学科分类
/ 12
240 个结果
  • 简介:总结国内外专利文本类情况,简要叙述基于机器学习的专利文本类的-般框架,介绍专利文本类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过程.将应用于专利文本类的机器学习算法分为单-分类算法和组合分类算法着重探讨单-分类算法主要有NB算法、ANN算法、Rocchio算法、KNN算法、SVM算法等;组合分类算法主要有两种组合算法,如NB-KNN算法、Rocchio-KNN算法、KNN-SVM算法、SVM-其它算法,还有多种组合算法.指出各种机器学习算法应用在专利文本类上的优势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望.

  • 标签: 专利文本 自动分类 机器学习 朴素贝叶斯 支持向量机
  • 简介:提出高校图书馆到馆用户服务成本的概念,以某高校图书馆为例,对一学年内到馆用户服务成本进行分析。从馆舍布局、人力资源配置、资源购置费使用以及服务成本补偿四个方面,对降低服务成本的措施进行思考。

  • 标签: 高校图书馆 到馆用户 服务成本
  • 简介:[目的/意义]作为城市化进程中的“顽疾”,群租房屡禁不止,群租房引发的社会问题层出不穷。这一系列问题引发了微博热议,群租房微博舆情文本有助于获悉群租房存在的问题,从受众角度探讨政府群租房治理成效。[方法/过程]利用网络大数据爬取与分析技术,以群租房为研究对象,通过文本聚类分析与情感分析,进行热点评估,补充现有文献中忽视的群租房治理舆论研究。[结果/结论]研究发现,微博网民对群租房话题的关注明显呈波动趋势,讨论话题主要包括群租房产生的社会问题、政府对群租房的整治行动评价以及透过群租房现象折射出的中低收入群体的焦虑感。大多数微博网民在舆论场中的情感趋势为负面,认为有必要对群租房展开治理。本文的创新之处在于分析政府治理群租房所面对的舆论环境,并将其可视化呈现,为政府深入了解民情,制定适应民意的政策作铺垫。

  • 标签: 群租房 社会舆情 文本聚类 情感分析
  • 简介:随着信息技术发展,网络为信息资源开发提供了快速有效的获取途径,传统的获取信息的理论受到严峻的挑战。在网络传播中,学科资源数据库以超文本为载体。把文本、图像、音频、视频等融为一体,从而形成了新的超文本情景。在这种全新的网络情景中,信息资源的开发利用有着新的特点和规律。

  • 标签: 资源数据库 超文本 学科 信息技术发展 信息资源开发 获取途径
  • 简介:题目学科分类对海量题库的汇聚和应用有着重要意义。本文提出的二次分类方法能有效提高分类正确率,尤其针对那些容易混淆的学科,经过进一步的优化处理,取得比较显著改进效果。

  • 标签: 题库 卡方检验 朴素贝叶斯分类 支持向量机
  • 简介:本文首先讨论了在信息检索系统中应用统计语言模型的可行性,介绍了统计语言模型的简史以及在IR领域的研究进展,对信息检索过程中的两个模型作了公式化描述并简单介绍了数据平滑技术。接下来,介绍了支持语言模型在信息检索研究的工具箱——Lemur工具箱,并介绍了使用Lemur工具箱进行实验的方法、步骤,最后给出结论。

  • 标签: 统计语言模型 信息检索 LEMUR
  • 简介:[目的/意义]运用本体特有的语义关联和知识聚合能力,深入内容层面设计构建中美赛珍珠主题硕博学位论文本体,并在此基础上展开内容比较分析。[方法/过程]从理论层面提出本体库的总体架构和构建流程,在实践层面使用Protégé进行本体库建模和实例填充,并开展以外部文献信息中时间分布和研究内容《大地三部曲》为示例的比较研究。[结果/结论]中美赛珍珠主题硕博学位论文的时间分布上美国起步较早,但发展缓慢,后劲不足;中国虽然早期文献产量低,但上升速度快,文献产量高,后来居上。《大地三部曲》是两国共同关注的核心研究对象,相比而言,中国学位论文研究的人物、事件更多,时间的跨度更长,而美国论文选择的研究对象和涉及到的人物关系相对集中。研究方向上两国有同有异,对人物形象和中国文化的研究是两国共同的主流。

  • 标签: 赛珍珠 学位论文 中美比较 本体构建 知识发现
  • 简介:本文针对DIPS系统中对象文件加工入库的方法,需要对字段数据进行处理和加工,而传统做法是一条条地加工处理,费时又费力,利用字段数据批处理技巧能在短时间内加工处理成"标准文本格式"数据,有利于提高工作效率。

  • 标签: 数据库 字段数据 批处理 技巧
  • 简介:[目的/意义]基于关键词分析,得出不同类型的微博阅读群体的特殊行为特征,分析微博对群体阅读所起的作用和用户参与中的得失。[方法/过程]通过采集微博热门读书话题的数据样本,进行关键词提取、关键词词频统计、关键词与微博热度相关性分析、关键词文本类和情感分析。[结果/结论]对于在微博平台如何更好开展群体阅读分别从有影响力用户、普通用户、商业用户及平台方角度提出具体发展建议:有影响力的微博用户应加强与普通用户的深度互动;普通微博用户应加强自己的"深阅读"能力和交流能力;微博商业用户应减少书籍的过度营销;新媒体应加强对知识性阅读话题的重视和推广。

  • 标签: 关键词分析 文本分类 情感分析 群体阅读 微博话题
  • 简介:利用SPSS16.0统计分析软件对1998—2008年间科技查新研究论文进行共词分析,研究各高频关键词间的关系,探讨科技查新的研究现状、热点及趋势。

  • 标签: 查新 共词分析 研究热点 聚类分析
  • 简介:MEDLINE简称MedlarsOnline,是当前最重要、利用率最高的生物医学数据库之一。它由美国《医学索引》、《牙科文献索引》和《国际护理索引》所组成。该数据库收录了70多个国家的3200种期刊的目录与文摘。所有文献可分为研究、临床,管理政策,医疗服务等方面,其中70%是英文文献。该数据库收录的重点为临床医学,基础医学和实验医学,对边缘学科收录不够全面。但MEDLINE光盘以其存贮量大,检索入口多、功能强、速度快、省时省力,不受线路、空间的限制等诸多优点,而深受广大用户的厚爱。作为安徽省高等医学院校酋家引进MEDLINE光盘检索系统的单位,开展工作已有半年,我将这半年来的光盘使用情况加以总结及分析,以便将来更好地开展工作。

  • 标签: 收录 光盘检索 检索入口 《医学索引》 期刊 省力
  • 简介:在检索查阅、归纳分析原始专利文献的基础上,对海洋波浪能国际专利申请(公开)趋势、国家分布、主要专利权人及重点技术领域等方面做了全面的剖析,从中可了解技术领先国家、重点公司及其技术,以期对我国海洋波浪能的研发机构、企业有所启发,对我国海洋波浪能的发展有所帮助。

  • 标签: 海洋 波浪能 国际 专利分析
  • 简介:利用专利可视化工具,结合专利引证分析文本聚类分析等方法,对美国科锐公司的LED芯片专利保护策略、专利布局和技术发展方向进行分析,其结果表明该公司在各相关领域均申请专利以保护其技术优势,而其最新研发方向主要是掺杂微量元素以改进材料性能和增加微结构以提高芯片亮度。该结果可以为我国相关企业规避专利侵权风险、制定研发策略、寻求技术发展方向提供决策支持。

  • 标签: 专利分析 LED芯片 引证分析 专利地图
  • 简介:利用文献计量法,对741种中国文科核心期刊,从所属学科、出版地、主办者、出版者、刊期等进行了目录信息分析,从一个侧面考察中国文科期刊的发展历史和现状,对办好中文社科期刊提出了三点建议。

  • 标签: 中国期刊 文科期刊 核心期刊 目录信息 文献计量分析
  • 简介:以SCI数据库中Scientometrics2000~2014年期间刊载的2415篇论文为研究对象,采用文献计量学的方法,从载文量、被引情况、合作情况、核心作者、研究热点等几个角度进行分析,同时对中国作者发表的论文进行重点分析。研究结果表明,中国的发文量逐年上升,2011~2014年一直排在第一,但是总被引次数以及篇均被引次数都偏低,合作论文以国内合作为主,国际合作比例偏小,主要的合作国家有美国、比利时等。

  • 标签: 情报学 期刊评价 文献计量学 SCIENTOMETRICS
  • 简介:从专利类型、技术领域、专利分布情况及主要专利权人等方面分析了海洋波浪能中国专利布局现状,并根据专利分析结果对我国海洋波浪能技术研发及产业发展提出了建议。分析结果显示,我国在海洋波浪能技术方面已有初步的专利积累,并且其专利申请量继续保持增长趋势,但海洋波浪能中国专利主要由我国个人所申请,此外是大专院校和科研单位在进行该领域的技术研发,而我国介入海洋波浪能研发与产业化的企业太少。我国应有相应的政策支持,进一步加大对海洋波浪能关键技术的研发投入,鼓励更多的企业进入海洋波浪能领域。

  • 标签: 海洋 波浪能 专利分析 建议
  • 简介:以IncoPat数据库为来源,检索在中国申请的关于设施农业的专利。采用NodeXl和Excel作为主要分析工具,从申请量趋势、法律状态、专利权人、地域分布、主题迁移、IPC分布、高频被引专利、专利地图等方面对中国设施农业专利进行分析,反映我国设施农业专利技术的发展态势,找出不足,从政策和经费保障,加强对中西部地区专利意识的普及与财政、资金、人力支持,加大产学研合作力度促进企业向市场化和产业化转变,注重对设施农业技术的引导兼顾国外研究热门技术等四个方面为我国设施农业技术的未来进一步发展提供建议。

  • 标签: 设施农业 专利分析 社会网络分析 IncoPat