人工智能医疗器械可信赖性研究

(整期优先)网络出版时间:2023-07-25
/ 3

人工智能医疗器械可信赖性研究

周坤

深圳市普博医疗科技股份有限公司深圳市 518000

摘要:随着人工智能技术的发展,医疗器械软件产品利用人工智能技术实现辅助诊断和辅助分析等功能,极大地促进了临床诊断和治疗。大多数使用人工智能的医疗设备软件都具有电子数据交换或远程控制的网络功能,这提高了临床诊断的效率和质量,并带来了潜在的网络攻击风险。用于医疗设备的人工智能软件是一种医疗设备软件,它使用机器学习和深度学习等人工智能技术来实现辅助诊断,辅助分析和其他功能。医疗设备软件基于大量的医疗数据,并使用计算平台来开发算法。他们使用的医疗数据可能包括有关患者的个人身份,健康状况,治疗结果和健康状况的信息。本文对人工智能医疗器械可信赖性进行分析,以供参考。

关键词:人工智能;医疗器械;可信赖性;质量评价

引言

人工智能(AI)医疗设备,是指该设备在工作流程优化、数据处理、辅助诊断等领域实现其医疗用途,利用深度学习、神经网络通过数据驱动的方法训练AI算法的新一代医疗设备,主要分为AI独立软件(智能软件)和AI软件组件(智能硬件)两种。与传统医疗设备的静态模式相比,以大数据量、黑盒算法和高计算能力为核心的AI医疗设备具有实现精准医疗、个性化医疗和远程诊断的优点,可以提高医生的效率,有效缓解医疗资源的短缺。但是,由于其数据或算法驱动的特性导致动态变化和快速更新,AI医疗设备的安全性和有效性存在不确定性的风险加剧。

1人工智能医疗器械监管

随着人工智能(AI)在医疗保健领域变得越来越普遍,医疗设备人工智能(AIMD)通常被用作医疗设备的软件。软件在医疗设备(SiMD)用于成像,病理和其他领域,以及临床辅助诊断,治疗,筛查和其他情况。AIMD的发展面临着两大挑战。首先,如何建立临床用户对产品的信任。AI技术有一个黑匣子,特别是基于深度学习的AI算法,结果往往难以解释,利益相关者对产品安全的有效评估不够直接和深入。在从技术到产品的过渡过程中,确保AIMD的安全性和有效性不仅需要技术控制,还需要监管控制。其次,人工智能技术本身正处于快速发展阶段,AIMD产品的迭代更新加速了缩短产品安全性和有效性评估周期的需求,这给监管和测试带来了新的挑战,同时刺激了质量管理体系的调整。为了解决这些问题,各国正在审查其与AIMD相关的监管政策,提高AIMD的安全性和有效性评估,并确保用户和员工的安全。目前,AIMD法规正处于发展和变革阶段,多个国家/组织发布了相应的指南和规范。概述了AIMD的当前监管状况,简要分析了相关技术指南/标准的作用和范围,中国和美国目前的监管动态和监管思维,为AIMD行业提供了参考,并预测了标准发展的趋势。人工智能技术在各种医疗保健疾病中的应用正在增长,随着创建不同的疾病数据集和算法模型,预计将有更多的AIMD应用程序进入市场。国家和国际标准组织和监管机构正在积极探索AIMD的现有治理概念和标准。根据发布的技术指南,国家监管机构审查了AIMD的分类定义,审查和批准,并制定了相关的行业标准。在着陆过程中,有必要进一步研究细节,例如:确定不同的性能测试方法是否会影响比较结果,以及哪些性能测试方法更准确地反映产品的性能。

2质控需求分

根据医疗器械行业标准YY/T1833.2—2022《人工智能医疗器械质量要求和评价第2部分:数据集通用要求》,数据集制造责任方在数据集描述文档中应明确声称数据集的十几种质量特性,作为数据集质量评价的依据。数据集的入库环节是数据集建设的起点,对涉及数据价值维度的7种质量特性影响较大,因此将其作为质控的主要方向。实际开展数据集建设时,在需求分析阶段应当根据各个质量特性的含义,考虑数据质控如何实施。具体分析如下:(1)准确性:含义为数据与真值一致的程度。从真值的含义出发,考虑的内容包括数据采集/测量的有效性、数据形式的合理性、数据与描述的一致性,需要进行数据解析,对技术参数进行校验,例如,成像设备的技术指标是否符合相关要求;图像中心位置是否与描述一致;数据采集的日期、ID编码是否符合要求。(2)完备性:含义为数据集的内容覆盖数据集预期用途的程度。该特性关注数据集所含信息的全面性,需要对字段的全面性进行校验,例如,文本信息里面的必填项是否为空;文本信息的数据元能否体现数据代表性分析的维度。(3)唯一性:含义为数据之间避免重复的程度。该特性关注各数据单元是否出现冗余和重复,需要进行查重验证,包括内部查重、外部查重(与其他数据集之间的重复)。当数据集包含患者不同时刻的数据时(例如随访),各时刻之间也需要进行查重。(4)一致性:含义为数据保持一致的程度。该特性关注不同来源的数据之间、同一批数据之间是否具有相似或可比的属性,需要对相关字段进行比对和统计。当数据存在离群值时,需要有合理的解释,否则应剔除。(5)确实性:含义为数据真实、可信的程度。该特性要求对数据及其描述开展真实性核查,例如厂家名称、设备型号是否真实存在;数据元的内容是否符合其值域;参数设置是否符合临床实际等情形。(6)时效性:含义为各个环节的处理时限符合预期的程度。该特性关注数据集各个环节是否符合预设的时限,需要对时间信息进行校验,例如数据的采集时间、标注期限等。(7)精度:含义为数据定量信息与真值接近的程度。该特性关注数据的定量特征是否满足测量精度的要求,需要对相关字段进行检查,必要时对数据(含标注结果)本身进行校验。

3人工智能医疗器械软件网络安全风险管理

医疗设备的人工智能软件除了构建自己的软件网络安全功能外,还必须考虑在整个软件生命周期中管理网络和数据安全流程的要求,从概念和开发到上市和上市。在进入市场前的设计和开发阶段,与一般的医疗器械软件不同,医疗器械的人工智能软件是基于大数据的训练,需要识别数据采集、数据预处理、数据标记、数据集生成等过程中存在的网络和数据安全风险,并进行有效的控制。与从临床设施到生产设施的非敏感数据传输中使用的数据传输方法相关的潜在风险。它还应该识别在算法学习,算法性能评估,软件验证,软件验证等过程中可能出现的风险。例如,数据在训练期间被感染,软件代码和数据被恶意篡改,导致软件功能偏离预期目标。在上市后的使用阶段,必须全面评估医疗设备AI软件产品的网络安全风险,并结合产品的预期用途,使用的场景和主要功能。医疗设备系统的人工智能极大地提高了医务人员的生产力,而对网络连接的需求增加了网络中断、恶意更改数据、侵犯患者隐私等数据丢失的风险,产品开发人员和用户必须了解并共同保护这些产品风险。虽然医疗设备的AI软件通常在医疗机构中运行,但云也应该在具有适当保护的服务器环境中使用。医疗保健组织需要有足够的安全措施和技能来管理其网络,例如:选择IP地址范围,配置路由表和网关,在专用网络和其他网络之间安全分离,通过安全组防火墙等进行多层访问控制 医疗保健机构在自己的网络中使用云服务,管理患者数据并在医疗保健中运行人工智能软件。

4数据管理与安全

医疗设备临床试验的数据管理主要包括数据收集、数据存储、数据处理、数据传输、数据共享、数据存档和备份。对于具有网络要求的医疗AI设备,如果系统缺陷可能被破解,导致数据泄露,则需要提供防范和控制网络安全风险的能力,如建立安全网络和防火墙以防止入侵等。对于使用人工智能技术存储在云平台或使用云计算处理数据的医疗设备的临床试验,由于数据不在医院的监控范围内,在传输、存档、备份、存储和共享(特别是通过公共互联网传输敏感患者数据)过程中如何防止数据泄露和非法使用是一个重大问题。首先,人工智能医疗设备的临床试验在收集患者数据时应遵循最低限度的原则,数据收集后应尽快匿名化,防止匿名数据的重复识别,对于敏感数据应建立一套准确的访问程序,二次加密,防止信息泄露。其次,当患者,医护人员与医院供应链信息交互时,权限管理和使用各种技术,如访问控制,数据显示限制,数据加密,数据共享限制等。,确保数据安全。最后,今后应继续完善相关技术标准和法律规范,制定数据收集规则和信息保护措施,规范人工智能医疗器械临床试验数据管理。

5人工智能呼吸诊断中的应用

5.1呼吸诊断方法

呼吸诊断类产品一般通过监测数据和波形进行诊断。 这种设备通常的检测方法是对比患者与标准化呼吸周期和波形。首先依据患者的身高、体重、年龄、性别等,数据信息,建立一套标准的呼气相和吸气相的模型,模型包括呼吸参数和波形等数据。然后通过呼吸监测设备,监测患者的呼吸流速、压力、节律、氧合参数、二氧化碳分压,等,各项生理状态参数,形成患者的呼吸模型。并作为测试样本输入AI软件产品。AI输出的结果可以与标准体模自身固有数据进行对比,对患者进行诊断。诊断结果包括:呼吸暂停指数(AI)、阻塞呼吸暂停指数(OAI)、中枢呼吸暂停指数(CAI)、呼吸低通气指数(HI)、呼吸暂停低通气指数(AHI)、呼吸努力相关性觉醒指数(RERA)、鼾声指数(SNI),等。

5.2呼吸诊断准确性

对于AI诊断产品来说,如果能从真实数据中得到正确的测试结果则是最可靠和有效的。目前很多AI医疗器械类产品均采用将患者数据和标准数据模型进行对比的方式,进行评价和诊断,找出病理的差异。呼吸诊断AI产品也是采用此种方式。呼吸标准模型的构建贴合临床应用场景,并参考质量管理体系要求,从人员、设备、数据、标准、环境等各个方面开展数据收集与质控,以提高数据的多样性和代表性,并降低由于单一“标准品”带来的系统和随机偏差,充分考量算法的泛化能力,通过大数据系统,建立呼吸标准模型数据库。

对于标准数据集的构建本文不做详述,国家药监局AI医疗器械标准化技术归口单位等组织均有一些相应的数据集构建指导原则或是标准发布,构建方法可以参考其发布的内容。将标准数据集作为输入对AI软件进行测试,本身并没有技术上的难度,但如何对AI输出的结果与标准结果进行匹配,使用哪些评价指标才能真实客观地反映AI软件算法性能的优劣程度,是本文的主要研究内容。

呼吸诊断AI医疗器械,用提示框勾勒出呼吸波形异常,出现病理的位置。提示框可为方框、圆框、分割边界等,结合临床需求和呼吸治疗师的使用习惯,可根据自身需求进行设计,将波形异常点一一勾勒和标记出来,并形成病理数据汇总表,表中的数据和呼吸疾病的大数据库进行比对,形成诊断报告。诊断报告中包括AI给出的诊断结果和数据,以及勾勒出的呼吸波形异常点,供呼吸治疗师判断患者的病情。 该方法可以大大降低对呼吸治疗师的专业知识和临床经验的要求,并可以排除人工主观性的误判因素,同时减少呼吸治疗师的工作量。

6人工智能医疗器械可信赖性

6.1总则

AI技术的可信赖性与产品的预期用途、自治能力有关。可信赖性反映了AI算法与利益相关方之间的关系,利益相关方包括制造商、用户、患者等。因此,首先要考虑医疗领域应用场景和决策产生的复杂性,为更准确评估AI医疗器械算法的风险程度,可以按照产品的预期用途将其可信赖程度进行分级。对于具有不同自治能力的AI产品,其可信赖分级应进行适当调整,针对不同类型的AI医疗器械产品进行分级化的管理有利于制定合适的质控要求,采用更适宜的质控方法。

6.2评价方法

透明度和可解释性的要求可以从产品文档、产品界面及功能层面分别展开评价。从文档角度,主要通过评估产品说明书中对于产品的适用范围、使用限制、算法设计、数据集信息、算法影响因素、算法工作机理等信息的描述评估算法的透明度和可解释性。产品界面及功能角度,应关注产品的使用限制是否有提示、在与预期性能偏离的情况下,是否能向操作者发出请求等性能表现。如条件允许,在产品界面上对于产品的算法运行状态、决策过程进行可视化呈现,有利于增加产品的透明度和可解释性。对于可控性的评价,从产品文档角度,主要评估说明书中是否描述了人员对AI算法的操作权限,如算法的启动、暂停、终止、急停、参数配置等;从产品界面及功能角度,主要考虑产品的操作界面应该与操作人员的操作权限相适应,以对AI算法进行有效的控制。产品界面也应该对算法的结果给出反馈。鲁棒性评价是对于产品的性能指标的扩展性评价。我国的AI医疗器械注册审查指导原则中明确指出可根据真实数据生成对抗样本,进而评估算法鲁棒性,这是对算法性能评估的重要部分。我国近两年起草的产品算法测试方法标准中也对鲁棒性提出了具体要求。在实际质控中,我们可根据产品的临床使用场景,分析具体的扰动因素对产品输出的影响,确定产品的可接受变化区间,评估其鲁棒性情况,并作为软件整体可信赖性评估的重要组成部分。

结束语

一般来说,人工医疗设备是指集成了各种AI技术的医疗设备。与传统医疗设备相比,人工智能医疗设备在精准医学、个性化医学、远程诊断等领域具有诸多优势,有效缓解了医疗资源的匮乏等问题,导致医疗困难、病患关系紧张、医疗事故频发。为了更好地促进人工智能医疗产品的开发和生产,我们必须加强对其标准体系的研究和分析,使其更好地服务于医疗行业,提高我国医疗服务的整体质量。基于人工智能的医疗产品标准化系统的开发是一个复杂的过程。在实际设计和研究过程中,除了了解目前人工智能医疗器械的发展,还需要从人工智能医疗器械质量评估的演变中获得一些启发,并提出一些具体的建议和设计方法,以促进更好的人工智能医疗器械标准体系的设计。

参考文献

[1]张政,姜伟.工业设计在医疗器械产品智能化中的体现[J].大众标准化,2021(16):194-196.

[2]张丽鑫,钱庆,唐明坤,周佳茵,吴思竹.人工智能医疗器械标准数据集构建现状[J].中华医学图书情报杂志,2021,30(08):1-8.

[3]国家药品监督管理局医疗器械技术审评中心.AI医疗器械安全有效性评价研究有序开展[N].中国医药报,2020-11-17(001).

[4]唐睿,王学亮,王华丽,曲怡蓉,熊秋菊.“人工智能+”背景下医疗器械维护与管理专业课程体系构建研究[J].海峡科技与产业,2020,33(11):59-61.

[5]史新立,田佳鑫,骆庆峰,刘威.如何积极推进高端创新医疗器械发展[J].中国医疗器械信息,2020,26(21):15-18.

[6]刘雅茹,崔春舜,林炜炜,袁子焰,孙晓北,徐畅,付玉伟,高东平.人工智能医疗软件的监管现状及启示[J].中华医学图书情报杂志,2020,29(10):38-43.

[7]吴平.人工智能背景下JX医疗器械公司发展战略研究[D].东南大学,2020.

[8]董婷婷.医疗人工智能患者安全影响及对策研究[D].华中科技大学,2020.

[9]孟祥峰,王浩,张超,任海萍.人工智能医疗器械辅助诊断及探测性能评估参数的讨论[J].中国药事,2019,33(09):1026-1031.