简介:数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词之间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。
简介:结合北京市城八区农民工适应性区群抽样数据,本文分析了作为一项人力资本和一种意义符号的语言能力(普通话水平)分别对农民工经济收入和社会交往的影响效应及可能的影响路径。研究发现,普通话熟练的农民工能够获得高于不熟练者21~40%的月收入,即使控制了教育、工作经验等其他人力资本变量,语言能力的影响依然显著。普通话熟练者在工作培训、职业技能、自我价值意识、工作适应等方面有更好的表现,这可能是他们能够获得更高收入回报的中间路径。与此不同的是,普通话熟练并未对农民工社会交际网络和生活空间的拓展带来显著影响。语言在农民工城市融入过程中的作用值得深入探讨。
简介:摘要大数据的出现和发展,对高校学生教育管理模式带来了一定的挑战与机遇。本文在分析当前高校学生教育关门模式发展现状,尤其是指出其存在不足的基础上,进一步分析了大数据时代下高校学生教育管理模式转变与应对策略,希望可以为我国高校学生教育管理模式改革提供一定的借鉴。
简介:记音字与词字和语素字不同,对这类单字在编排注释上需要有特殊考虑.一般的处理方式都是对记音字构成的复音词作具体注释,对记音字本身只显示它与复音词的构词记音关系.复音词中的记音字只有在组合时才有意义,拆为单字时因没有意义而不便解释,如果忽略了这一事实,就难免出现不准确的注释.汉字记写汉语的功能具体到每个字有是差异的.由于语素义项和语素兼词义项的注释和举例必然要系连到它们所构成的词语,因此较好的字词典对此往往有一定的讲究.然而处理语素与相关词语注释时还存在着一些问题,如:语素注释与相关词语注释混同或似同非同、语素与所构义近词其间缺少区别性注释语、非单用语素用作注释词、语素义配例不当等等.