简介:LDA主题模型是文本挖掘领域的重要算法,同时在推荐系统当中也有不错的表现.通过LDA主题模型挖掘用户感兴趣的主题,是目前最常用的用户兴趣主题挖掘方法之一.为了提高LDA主题模型应用在推荐系统时的推荐质量,我们提出了一种基于负样本进行学习的方法negLDA.通过创造出负样本来学习用户对物品的负面预测评分,同时结合正样本学习得到的正面预测评分,从正反两个方面进行综合评测,从而更加精确地衡量出用户对物品的预测评分.通过在MoviesLens-100k、MovieLens-1M、FilmTrust这三个数据集上的实验,表明所提出的算法在精确率、召回率、AUC三个指标上相比传统算法均有一定改进.
简介:摘要目的探讨慢性病健康素养领域的研究现状和主题,为慢性病健康素养的相关研究提供参考。方法系统检索Web of Science数据库中与慢性病健康素养相关的文献,从时间趋势、期刊分布、国家和机构分布等方面进行文献计量分析,并采用潜在狄利克雷分配(LDA)主题模型挖掘研究主题。结果共纳入1 023篇文献,文献数量整体呈上升趋势,来源出版物共计435种,发文量最大的期刊是Patient Education and Counseling(37篇),美国是该领域研究的主要国家,发文量占47.507%(486/1 023)。通过LDA主题模型识别11个研究主题,并进一步归纳为慢性病患者的电子健康素养研究、不同群体的慢性病健康素养水平及其影响因素研究、慢性病患者健康素养与其健康结局关系的研究3个方面。结论慢性病健康素养的研究总体呈上升趋势,通过对相关研究的主题挖掘与分析,有利于进一步为慢性病健康素养相关研究提供发展方向。
简介:摘要目的了解在线医疗社区用户对脑卒中疾病信息的需求,为开展符合脑卒中患者需求的医疗护理服务奠定基础。方法采用数据挖掘的方法,研究对象为3个中文在线医疗社区中与脑卒中有关的提问记录,通过爬虫代码采集2020年8月1日—2021年7月31日的数据,进行数据清洗和分词后采用潜在狄利克雷分配(LDA)主题模型挖掘主题特征。结果在线医疗社区提问记录的主题特征分析显示,LDA模型将33 731条提问记录划分4个方面和8个主题的信息需求,分别为症状的识别和应急处理(症状、突发症状和应急措施)、医疗诊治(检查和治疗、医疗诊断、手术)、康复保健(起居照顾、饮食和药物)、患者和照顾者心理护理知识需求(患者或照顾者对疾病预后的担心)。结论基于LDA主题模型的研究结果可反映脑卒中用户关于在线医疗社区的信息需求,为脑卒中专病护理信息需求及其结构化健康教育的开展提供了发展方向和信息支撑。
简介:摘要目的探讨中英文检索数据库中关于灾害护理文献的主题内容、热度变化,为相关研究提供参考,为促进灾害护理领域的健康发展提供理论依据与情报支撑。方法利用潜在狄利克雷分配(LDA)主题模型对中国知网、万方、Web of Science等中英文数据库中检索截止2021年9月6日相关灾害护理的文献主题进行建模,生成"主题-词"分布概率矩阵并分析结果。结果LDA模型分析显示,中文文献有13个研究主题,并可归为4个研究方向,包括灾害伤病员的护理及救治、国内外灾害护理现状及院前急救发展、突发公共卫生应急事件救护能力评估及保障、灾害护理人员能力培训及考核;英文文献有6个研究主题。结论应用LDA模型文本提取结果可准确地挖掘出灾害护理领域的研究主题,有利于了解灾害护理的发展动态和研究热点,能够为相关研究提供可靠的参考依据。
简介:摘要目的分析卒中后认知障碍管理的研究现状和热点,为卒中后认知障碍管理提供依据。方法系统检索2011年11月1日—2021年11月1日Web of Science数据库中与卒中后认知障碍管理相关的文献,从年份、期刊及国家等方面进行文献计量分析,同时采用狄利克雷分配(LDA)主题模型挖掘潜在主题,并确定主题关键词。结果共纳入1 815篇文献,文献数量整体呈稳步增长趋势,来源出版物共计394种,载文量最大的期刊是Stroke(61篇),美国是该领域研究的主要国家,发文量占34.93%(634/1 815)。通过LDA主题模型识别6个研究主题,分别为卒中后认知障碍患者各领域功能缺损及心理健康、神经心理筛查及评估工具、康复干预训练及效果评价、家庭照顾者的支持与健康促进、卒中后认知障碍的流行病学特征以及相关危险因素。结论卒中后认知障碍管理的研究总体呈上升趋势,通过对相关研究的主题挖掘与分析,有利于进一步为卒中后认知障碍管理的开展提供发展方向和信息支撑。
简介:互联网技术的发展带来更多信息安全问题,构建完善的网络信息安全法律法规体系,有助于保障国家及社会公共利益。对比分析中美两国现行网络信息安全立法文本主题,有助于了解两国网络信息安全立法现状,为完善和发展国内网络信息安全立法提供借鉴。文章利用LDA—Gibbs模型,对中美两国网络信息安全相关立法文本进行主题挖掘,基于文本一主题分布采用欧氏距离计算文本相似度,并进行K—Means聚类。研究结果表明:早期国内立法集中于对硬件以及重要文件的保密工作进行规范,近几年开始填补个人信息保护方面的空白,但仍有待改进;美国相关立法起步较早,在个人信息保护方面的法律法规较为完善。对比分析后,认为我国相关立法有以下需改进之处:第一,尽快推进《个人信息保护法》的出台;第二,明确规定通信、消费、健康、网络版权等领域的公民个人信息的含义、个人信息保护的适用范围及基本原则;第三,出台针对特殊人群(儿童、学生、孕妇等)的网络信息安全法律法规。
简介:摘要针对物联网中效劳数量的大规划性、效劳描绘的异构性以及设备效劳的资源高度受限性和移动性等特色,提出了一种依据概率主题模型的物联网效劳发现办法.该办法的首要特色是1)运用英文Wikipedia构建高质量的主题模型,并对类似短文本的效劳文本描绘进行语义扩大,使主题模型可以更有用地估量效劳文本描绘的隐含主题;2)提出运用非参数主题模型学习效劳文本的隐含主题,下降模型练习时刻;3)运用效劳隐含主题对效劳进行主动分类和文本类似度核算,快速削减效劳匹配数量,加快效劳文本类似度核算;4)提出可以一起支撑WSDL-based和RESTful两种物联网效劳的signature匹配算法.试验结果表明与现有的物联网效劳发现办法比较,该办法的精确率(precision)和归一化折损累积增益(NDCG)都有较大起伏的进步.
简介:Theintermolecularinteractionpotentialformethane-argoncomplexiscalculatedbylocaldensityapproximation(LDA)approaches.Thecalculatedpotentialhasaminimumwhentheintermoleculardistanceofmethane-argoncomplexis6.75a.u.;thecorrespondingdepthofthepotentialis0.0163eVwhichhasgoodagreementwithexperimentaldata.WealsohavemadeanonlinearfittingofourresultsfortheLennard-Jones(12-6)potentialfunctionandobtainthatV(R)=143794365.332/R^12-3032.093/R^6(Rina.u.andV(R)ineV).