简介:总结国内外专利文本分类情况,简要叙述基于机器学习的专利文本分类的-般框架,介绍专利文本分类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过程.将应用于专利文本分类的机器学习算法分为单-分类算法和组合分类算法着重探讨单-分类算法主要有NB算法、ANN算法、Rocchio算法、KNN算法、SVM算法等;组合分类算法主要有两种组合算法,如NB-KNN算法、Rocchio-KNN算法、KNN-SVM算法、SVM-其它算法,还有多种组合算法.指出各种机器学习算法应用在专利文本分类上的优势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望.
简介:2017年数据一览国际图联成员:1293个成员(包括国家和国际协会、机构、组织和个人)137个国家IFLA全球视野在线投票:21772次在线投票190个联合国成员国7大洲世界图书馆地图(LMW)项目:210万个图书馆105个国家参与LMW项目126个组织对LMW项目做出了贡献2017年世界图书馆与信息大会(WLIC):3100多名代表500多个发言人247个研讨会国际图联战略规划:强有力的治理战略支持国际图联战略规划阐述了2016-2021年的战略方向和目标,旨在指导国际图联的治理和活动。2016-2021年,国际图联管理委员会制定了四个战略方向,并通过一系列重要举措和活动来推进。
简介:[目的/意义]以图情学科为例,探索作者关键词集的特征,为这一层面的知识挖掘提供一个新的视角。[方法/过程]提出作者关键词集的概念,以图情领域的18种CSSCI源刊10年内的全部论文为研究对象,采用R语言编程技术,生成作者关键词数据集,包含作者发文量、关键词总量、关键词种数、低频关键词占比、中频关键词占比、高频关键词占比、Top关键词、关键词集的相似度、关键词共现网络参数等,探索作者关键词集的词频、相似性比较和共现网络。[结果/结论]图情学科作者的关键词特征为低频关键词占比较高,高频关键词占比较低,相对分散。同时指出作者关键词集能够表征作者研究主题和兴趣,借助作者关键词集相似度指标,可以构建作者共现网络,而作者关键词共现网络中心性指标可以揭示作者研究领域、研究主题或研究方向。