简介:传统针对文本数据的分析,往往基于词频、词频逆文本统计量作为文本的表示特征.这类方法往往只反映了文本的部分信息,忽略了文本的内在语义特征.本文研究了中文词语衔接的概率语言模型,其基本思想在于根据文本中词语出现的先后顺序进行建模分析,该模型在短文本数据挖掘中能够很好地针对文本语义进行量化分析.主要解决两类问题:一、如何合理地将中文词转化为数字向量,并且保证中文近义词在数字空间特征上的相似性;二、如何建立恰当的向量空间,将中文文本的语义和结构特征等信息保留在向量空间中.最后结合某城市房屋管理部门留言板的实际留言文本数据,利用BP神经网络和RNN网络两种算法,实现概率语言模型的求解.与传统文本处理方法的对比说明,本文的模型方法针对短文本语义挖掘问题具有一定的优势性.
简介:建立了单粒子多位翻转的测试方法和数据处理方法,在此基础上开展了体硅90nmSRAM重离子单粒子多位翻转的实验研究。通过分析单粒子多位翻转百分比、均值、尺寸等参数随线性能量转移(linearenergytransfer,LET)的变化关系,表明了纳米尺度下器件单粒子多位翻转的严重性,指出了单粒子多位翻转对现有重离子单粒子效应实验方法和预估方法带来的影响。构建了包含多个存储单元的全三维器件模型,数值模拟研究了不同阱接触布放位置对单粒子多位翻转电荷收集的影响机制,表明阱电势扰动触发多单元双极放大机制是导致单粒子多位翻转的主要因素,减小阱接触与存储单元之间的距离是降低单粒子多位翻转的有效方法。