基于机器学习的药品知识库构建研究

(整期优先)网络出版时间:2021-07-24
/ 1
摘要目的以药品说明书为数据基础,构建药品知识库。方法对随机抽取的600份药品说明书进行人工标注,并划分为训练集和测试集,基于双向长短期记忆网络+条件随机场(Bi-LSTM+CRF)模型进行训练,完成医学实体的识别;以"相似度计算+规则映射表"的混合模型对提取出的实体进行标准化,完成后将药品信息导入Access数据库。结果基于Bi-LSTM+CRF模型的命名实体识别任务中,除人群类实体外,其余实体中均取得了F值高于85%的良好效果;基于"相似度计算+规则映射表"的混合模型,实体标准化的准确率为88.23%。结论本研究的机器学习模型效果与其他命名实体识别、实体标准化研究的模型效果相近,能够较好地完成药品知识库构建任务。