人工智能技术助力临床科研创新

(整期优先)网络出版时间:2021-07-27
/ 3

人工智能技术助力临床科研创新

李国仁

联通(上海)产业互联网有限公司 200020

【摘要】随着医院信息化建设的逐步推进,医院信息平台建设汇聚了海量的患者诊疗数据,对医疗机构而言是一笔宝贵财富,更为开展临床研究提供了重要的科研数据资源。高质量的数据资产是科研的基石,利用人工智能技术等手段来提升医疗数据的质量、确保数据的准确性与完整性、促进多学科数据融合、加强数据安全管控、大幅提升临床科研人员成果的产出效率。根本上解决困扰科研人员的数据处理、收集、分析等一系列历史性难题,并满足医疗机构多层次科研需求,加快科研成果产出并转化为临床使用性成果和诊疗技术,提升临床医疗质量,更好的服务患者。

【关键词】大数据、人工智能、临床科研平台

  1. 引言

公立医院作为中国科技成果创新的一支重要力量,公立医院的临床科研创新应把握时代机遇,发挥科技创新对提高全民健康水平和促进医疗产业发展的支撑作用。一直以来,科研的氛围与科研的成果产出往往是衡量医院质量与医院竞争力高下的重要指标,作为国内首屈一指的专科研究型医院对于临床科研有三大要求:1)除了完成常规治疗任务以外,以医学研究为先导,利用先进的理论知识、研究手段和技术方法,围绕重大疑难疾病进行系统性的研究,创造出新的知识。2)利用最新的科研成果,通过协作研究和临床验证的方式,快速转化为临床使用性成果和诊疗技术,提升临床医疗水平,更好的服务广大患者。3)将最新的医学成果投入临床应用并在行业内推广复制,提升全国整体医疗卫生水平,使更多的患者受益。

2018年《上海市医学科技创新发展“十三五”规划》中明确指出上海市将努力营造鼓励创新、宽容失败的文化与环境,鼓励科研人员持续研究和长期积累,健全鼓励创新的分配激励机制;相关医疗卫生机构可参照高校和科研院所享受科技成果转化收益奖励分配政策[2]。一系列国家政策导向指引我们加大临床研究,提升临床医疗质量,通过不断科研创新,为广大患者提供更先进、更高质量的医疗服务。

医疗数据是患者在诊断与治疗过程中产生的数据,是以患者为中心,包含患者的基本数据、出入院数据、EMR数据、LIS数据、PACS数据、财务数据等。同时也具有复杂性及多样性的特点,除了具有大数据的4V(Volume,Variety,Value,Velocity)特征外,还具有多态性、不完整性、标准不统一等特征[3-4]。1)多态性。医疗大数据包含着数据(体检、检验结果等)、信号(脑电信号、心电信号等)、图像(B超、X光、CT、MRI等)、文字(患者主诉、病程录等)、多态数据是医疗数据区分与其他领域数据的显著特点。2)不完整性。大量数据来源于人工,导致数据记录偏差和残缺,记录本身存在大量的错误与不确定性,在病历与病案中尤为突出,这些因素都导致了数据的不完整性。3)不同医院、个人对病种、治疗方法、治疗结局所使用的定义和专业术语不同,使得临床数据在诸如诊断数量和诊断名称、检测指标、药品数据、入院记录、检测报告等方面缺乏统一的标准,导致研究人员在数据采集和分析时无从入手[5]。传统的ETL方法和大数据挖掘技术,通过对数据的抽取,清洗,一定程度上提高了病历数据的质量,但中文医学语言的表达的随意性、语法多样性、结构复杂性,导致抽取病历文本的颗粒度、数据维度等方面存在不足,对于数据的结构化和标准化程度的提升问题一直以来是进行数据治理的障碍,传统的数据治理技术缺少一种能够自动化的解决方案。在数据处理统计分析方面,临床医生并非是统计学专家,无法熟练掌握目前主流的数学统计系统,例如:SAS,SPSS等,通常使用OFFICE等常用工具进行统计分析,效率低下,急需集合临床科研采集、分析、统计于一体的科研服务平台。在传统模式下,无论是提出科学问题,还是针对具体问题的收集、处理、分析研究等都是一项耗费大量人力、物力、财力的工程,临床医生的宝贵时间被浪费于繁琐的科研准备事务中,严重制约科研成果产出效率,大家了临床医生研究创新的积极性。



  1. 科研平台方法及技术路线

基于诊疗数据服务科研创新,提升提高医疗质量,更好的服务于患者,随着各大医院信息集成平台的建设和发展,诊疗数据的有效利用离不开底层的数据采集,为后期科研应用提供基础数据保障,并尝试基于数据集成平台下的一些科研应用的探索,通过临床数据中心在已经结构化的现有数据中能够实现数据的筛选,初步实现研究样本电子化采集,但仍然存在医疗信息分散、不完整,病历筛选检索耗时长,医学文本信息难利用,信息提取效率低,数据统计挖掘繁琐等问题,科经过基于大数据技术的研应用和探索,可以解决海量数据处理、样本病历查询效率、多维度数据导出统计等问题,由于医院数据结构化程度欠佳,精度匹配程度不高、造成科研应用过于独立,无法自动采集CRF数据,缺少数据分析,挖掘一体化应用体验,随访数据无法获取,造成科研数据不全面等问题。

以大数据平台为基础,借助人工智能技术,对原有数据中心中存在的结构化程度不高的医学文本数据通过自然语言处理等人工智能进行了数据的后结构化、标准化、归一化处理。有效提升了医疗机构数据结构化和标准化程度,满足了科研队列发现和变量提取的需要。系统架构图见图1:

60ffbb7a6787e_html_1b3acf7dd435812.png

图1:科研一体化平台架构图

通过人工智能的科研一体化平台可以满足了不同医生的临床科研个性化需求,经实践统计医生通过科研一体化平台的人工智能辅助eCRF采集临床科研数据,采集效率提高45%,准确率提高12%,以回顾性临床研究为例(见表1),从近10年病例中进行样本筛选,使用传统方式研究人员需要花费2-6个月,应用人工智能一体化科研平台后可进行秒级筛选,从1000份病史中采集100个变量,使用传统方法需要2-3个月时间,利用人工智能辅助技术只需1个月时间(包含人工核查)并且准确率均有大幅提升。在前瞻性临床研究方面(见表2),从原先手工纳入研究队列,到系统自动订阅入组,院内数据采集(1份100个变量)从需二次录入,40分钟/份到10分钟/每份,院外随访采集实现了免人工干预,资料自动回收等功能。

  1. 科研平台实践

随着人工智能科研一体化平台和高质量专病库的普及和应用,已经成功为多个医疗机构完成了多个重大科研项目的研究,例如:(1)中性粒细胞/淋巴细胞(NLR)、血小板/淋巴细胞(PLR)与先天性患儿术后感染和死亡的相关性分析(2)先天性心脏病儿童患者室间隔缺损(VSD)修补术后不良结局的风险因素分析(3)先天性心脏病儿童心脏术后发生低心排综合征的风险因子等研究课题,并在医学专业核心期刊进行发表。通过大数据治理平台,形成高质量的专病库,通过临床科研一体化平台满足了不同研究者的个性化需求,解决了科研人员的数据处理难题,提升科研成果产出效率,加快科研创新向临床实践的转化。 以回顾性研究为例:应用人工智能平台后相比较传统方法以10年病例数据量为例,样本筛选效率从原先的2-6个月缩短为秒级,数据采集以1000份病史采集100个变量为例,从2-3个月缩短为1个月(包含人工核验、准确率更高),数据清洗与统计阶段效率提升一倍,总体效率提升4个月左右,并且数据均可溯源(详见表1临床研究(回顾性研究))。以前瞻性研究为例:样本筛选从传统的人工纳入转化为系统自动订阅入组,数据采集以1份数据100变量为例传统方法需要二次录入,40分钟/份,应用人工智能平台后10分钟/份,院外随访数据采集方面(按5次随访)为例,传统方法使用电话随访,资料回收整理困难,平均耗时150分/人,采用人工智能方法,具有智能随访工具,资料自动回收,50分钟/人,总体效率提升300%,同时数据更规范,数据可追溯(详见表2临床研究(前瞻性研究))。

步骤

传统方法

应用AI平台后效果

开题立意

产生课题idea

靠经验和上级医生指导

依靠数据,启发科研思路

国内外文献查询、总结思路

没差别

没差别

小批量数据验证思路

1个月

0.25个月

样本筛选

近10年病历中进行筛选

2-6个月

秒级筛选

数据采集

从1000分病史中采集100个变量

2-3个月

1个月

(含人工核查、准确率高)

数据挖掘

数据清洗

0.5个月

0.25个月

数据统计

0.5个月

0.25个月

文章写作

论文撰写

1个月

1个月

总节省时间

至少4个月,数据可追溯

表1:临床研究(回顾性研究)


步骤

传统方法

应用AI平台后效果

开题立意

产生课题idea

靠经验和上级医生指导

依靠数据,启发科研思路

国内外文献查询、总结思路

没差别

没差别

小批量数据验证思路

1个月

0.25个月

样本筛选

纳入研究队列

人工纳入

系统自动订阅入组

数据采集

院内数据采集(1份100个变量)

二次录入,40分钟/份

10分种/份

院外随访数据采集(按5次随访)

电话随访,资料回收整理困难,150分种/人

智能随访工具,资料自动回收,50分钟/人

数据挖掘

数据清洗

0.5个月

0.25个月

数据统计

0.5个月

0.25个月

文章写作

论文撰写

1个月

1个月

提升效率

提升300%效率,同时数据更规范,数据可追溯

表2:临床研究(前瞻性研究)

  1. 结论

可以预见,在不久的将来还利用大数据和人工智能技术推进术后并发症智能监测,脓毒血症,血栓管控,血糖监测等医疗质控相关研究,通过历史临床数据挖掘分析,建立预测模型,利用人工智能和机器学习技术,不断提高准确率,持续提醒医生疾病发生的概率,做到提前预测,提前预防,有效降低患者风险,不断提高临床质量,更好的服务患者。



参考文献:

[1]刘琦材,科研管理搞得好,这六家医院是怎么做到的?,健康界, https://www.cn-healthcare.com/article/20180503/content-502984.html,2018年5月4

[2]上海市卫生和计划生育委员会,上海市卫生计生委关于印发《上海市医学科技创新发展“十三五”规划》的通知,www.shanghai.gov.cn/nw2/nw2314/nw39385/nw40603/u26aw52087.html,2017年4月19

[3]季聪华,曹毅,王伟,占伟江,刘姗。医院诊疗大数据的研究应用。中医药管理杂志,2016(14):142-144

[4]李毅,大数据下的医院科研管理创新初探。陕西档案,2017(3):22-23

[5]张胜行,陈大鹏,凌小明.基于大数据视角的医院科研管理[J].解放军医院管理杂志, 2015,5):481-483.