学科分类
/ 1
14 个结果
  • 简介:总结国内外专利文本分类情况,简要叙述基于机器学习的专利文本分类的-般框架,介绍专利文本分类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过程.将应用于专利文本分类的机器学习算法分为单-分类算法和组合分类算法着重探讨单-分类算法主要有NB算法、ANN算法、Rocchio算法、KNN算法、SVM算法等;组合分类算法主要有两种组合算法,如NB-KNN算法、Rocchio-KNN算法、KNN-SVM算法、SVM-其它算法,还有多种组合算法.指出各种机器学习算法应用在专利文本分类上的优势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望.

  • 标签: 专利文本 自动分类 机器学习 朴素贝叶斯 支持向量机
  • 简介:国庆前夕,中国人民解放军海军驻永州市冷水滩区某部得知该区岚角山学校正在建设学校图书馆,资金比较困难,部队首长当即决定资助5000元。解放军部门的无私援助,极大地鼓舞了学校师生的工作、学习热情,又唱出一首军民共建精神文明之歌。

  • 标签: 学校图书馆 精神文明 永州市 无私援助 学习热情 解放军
  • 简介:依照Web2.0的“社会化标注”思想,针对基于内容的推荐算法(cBR)和协同过滤推荐算法(CF)存在的不足,提出了基于读者标签(Tags)的、融合图书“热门度”因子的个性化图书推荐的两个改进算法。利用统计分析软件R,重点对改进后的CBR算法进行实验分析和验证,结果表明,改进算法的图书个性化推荐效果有明显改善。

  • 标签: 图书个性化服务 推荐算法 标签 热门度
  • 简介:网页去重是提高网络检索效果的有效途径。针对现有网页去重算法的不足和网页正文的结构特征,提出一个基于网页正文逻辑段落和长句提取的网页去重算法。该方法通过用户检索关键词将网页正文物理段落结构表示成逻辑段落,在此基础上提取逻辑段落中的长句作为网页特征码实现相似网页判断。实验证明,该方法提高了篇幅短小的镜像网页和近似镜像网页的去重效果。

  • 标签: 网页去重 逻辑段落 长句提取 句子相似度
  • 简介:在搜索引擎的检索结果页面中,用户经常会得到内容相似的重复页面,它们中大多是由于网站之间转载造成的。为提高检索效率和用户满意度,提出一种基于特征向量的大规模中文近似网页检测算法DDW(Detectnear—DuplicateWebPages)。试验证明,比起其他网页去重算法(I—Match),DDW具有很好的抵抗噪声的能力及近似线性的时间和空间复杂度,在大规模实验中获得良好测试结果。

  • 标签: 网页去重算法 特征向量 近似网页 支持向量机
  • 简介:从一九八三年十月七日始,到今年十月止,弹指一挥间,不知不觉已是十二个春秋,在湖北省图书馆历史文献室度过。集中精力专心致志,孜孜不倦埋首于古文献之中,古人云:"不为无益之事,何以遣有涯之生。"作点为祖国文化而招魂,任重而道远。鄂是我永远怀念之地,故草拙文,以誌雪泥鸿爪。

  • 标签: 历史文献 工作人员 阅读 省图书馆 回顾 祖国文化
  • 简介:2017年数据一览国际联成员:1293个成员(包括国家和国际协会、机构、组织和个人)137个国家IFLA全球视野在线投票:21772次在线投票190个联合国成员国7大洲世界图书馆地图(LMW)项目:210万个图书馆105个国家参与LMW项目126个组织对LMW项目做出了贡献2017年世界图书馆与信息大会(WLIC):3100多名代表500多个发言人247个研讨会国际联战略规划:强有力的治理战略支持国际联战略规划阐述了2016-2021年的战略方向和目标,旨在指导国际联的治理和活动。2016-2021年,国际联管理委员会制定了四个战略方向,并通过一系列重要举措和活动来推进。

  • 标签: 国际图联 年度报告 联合国成员国 国家参与 图书馆 全球视野
  • 简介:6月15日—16日,安徽、山东两省10所地方高等专科学校图书馆馆长在合肥联合大学图书馆召开了首次会议,成立了“皖鲁高校图书情报工作委员会高等专科学校分委会”。经过协商,通过了“分委会章程”,会议推选合肥联合大学、山东潍坊高专、芜湖联合大学、安徽商专等五个馆为常委馆,并由合肥联大和潍坊高专两馆分别担任正、副主任委员馆,任期四年。

  • 标签: 安徽 山东 高校 图书馆 学术研究
  • 简介:黄宗忠先生是我敬重的一位老师,更是众多珞珈学子敬仰的前辈。2011年10月30日,先生驾鹤西去。闻听噩耗,长歌当哭,恸莫大焉!

  • 标签: 黄宗忠 教授 桃李 后学
  • 简介:[目的/意义]以情学科为例,探索作者关键词集的特征,为这一层面的知识挖掘提供一个新的视角。[方法/过程]提出作者关键词集的概念,以情领域的18种CSSCI源刊10年内的全部论文为研究对象,采用R语言编程技术,生成作者关键词数据集,包含作者发文量、关键词总量、关键词种数、低频关键词占比、中频关键词占比、高频关键词占比、Top关键词、关键词集的相似度、关键词共现网络参数等,探索作者关键词集的词频、相似性比较和共现网络。[结果/结论]情学科作者的关键词特征为低频关键词占比较高,高频关键词占比较低,相对分散。同时指出作者关键词集能够表征作者研究主题和兴趣,借助作者关键词集相似度指标,可以构建作者共现网络,而作者关键词共现网络中心性指标可以揭示作者研究领域、研究主题或研究方向。

  • 标签: 文献计量 关键词集 词频 共现网络 R语言
  • 简介:将2011年度发表在图书情报类18种核心期刊上的论文,分为国家社科基金论文、其他基金论文与无基金资助论文三组,统计各组论文的数量、被引频次,计算篇均被引次数,从基金论文的被引频次、不同类别基金情况以及期刊基金h指数三个方面分析其学术影响力.结果表明:基金论文的学术影响力高于无基金论文,社科基金论文的学术影响力高于其他基金论文;社科基金级别越高其资助论文的学术影响力也越高;期刊整体h指数与年载文量相关,项目数量和项目类别与基金h指数之间具有一定正相关性.

  • 标签: 基金论文 国家社科基金 学术影响力 图书情报学 被引频次 H指数
  • 简介:当第62届国际联大会召开的日期日益临近,各项筹备工作正在紧张进行之际,第62届国际联大会中国组委会于1995年5月25日在北京召开了第二次全体会议。大会组委会主席、国务委员、国务院秘书长罗干,组委会执行主席、文化部部长刘忠德出席了会议。会议由组委会常务副主席、文化部副部长刘德有主持。组委会秘书长、文化部图书馆

  • 标签: 国际图联大会 筹备工作 组委会 中国图书馆事业 文化部 会议中心
  • 简介:[目的/意义]指出"馆员书评"是专业阅读推广的主要方法,是"服务型馆员"向"学习型馆员"提升的必然路径。[方法/过程]总结2013~2017"馆员书评"征集活动情况,指出目前"馆员书评"存在的诸如选书不精当、结构不完整、缺少感受、解释与评价等问题。[结果/结论]高质量"馆员书评"的提升策略,一是从阅读开始,二是把握写作要领。

  • 标签: 阅读推广 书评 馆员书评 学习型馆员