基于深度学习的放大蓝激光成像和放大窄带成像模式下早期胃癌识别模型的诊断效果对比

(整期优先)网络出版时间:2021-09-21
/ 1
摘要目的研制基于深度卷积神经网络的放大蓝激光成像(ME-BLI)和放大窄带成像(ME-NBI)模式下早期胃癌识别系统,比较2种模式下模型的性能差异,并探讨模型训练方式对准确度的影响。方法回顾性收集ME-BLI和ME-NBI下的胃良性病灶和早期胃癌的内镜图像,共收集5个数据集和3个测试集:数据集1包括2 024张非癌和452张早期胃癌ME-BLI图片,数据集2包括2 024张非癌和452张早期胃癌ME-NBI图片,数据集3是数据集1和2的合集(共4 048张非癌、904张早期胃癌ME-BLI和ME-NBI图片),数据集4在数据集2的基础上增加62张非癌和2 305张早期胃癌ME-NBI图片(共2 086张非癌和2 757张早期胃癌ME-NBI图片),数据集5在数据集3的基础上增加62张非癌和2 305张早期胃癌ME-NBI图片(共4 110张非癌、3 209张早期胃癌ME-BLI和ME-NBI图片);测试集A包括422张非癌和197张早期胃癌ME-BLI图片,测试集B包括422张非癌和197张早期胃癌ME-NBI图片,测试集C是测试集A和测试集B的合集(共844张非癌、394张早期胃癌ME-BLI和ME-NBI图片)。根据5个数据集分别构建5个模型,分别评估其在3个测试集中的表现。通过以病灶为单位的视频测试,比较ME-NBI和ME-BLI模式下早期胃癌识别模型在临床环境下的性能差异,并与4名资深内镜医师进行比较。主要终点指标为早期胃癌的诊断准确度、灵敏度和特异度。采用卡方检验进行统计学分析。结果模型1在测试集A的表现最佳,准确度、灵敏度、特异度分别为76.90%(476/619)、63.96%(126/197)、82.94%(350/422);模型2在测试集B的表现最佳,准确度、灵敏度和特异度分别为86.75%(537/619)、92.89%(183/197)、83.89%(354/422);模型3在测试集B中的表现最佳,准确度、灵敏度和特异度分别为86.91%(538/619)、84.26%(166/197)、88.15%(372/422);模型4在测试集B的表现最佳,准确度、灵敏度和特异度分别为85.46%(529/619)、95.43%(188/197)、80.81%(341/422);模型5在测试集B的表现最佳,准确度、灵敏度和特异度分别为83.52%(517/619)、96.95%(191/197)、77.25%(326/422)。根据图片识别早期胃癌,模型2~5的准确度均高于模型1,差异均有统计学意义(χ2=147.90、149.67、134.20、115.30,P均<0.01);模型2和3的灵敏度和特异度均高于模型1,模型2的特异度低于模型3,差异均有统计学意义(χ2=131.65、64.15、207.60、262.03、96.73,P均<0.01);模型4和5的灵敏度均高于模型1~3,模型4和5的特异度均低于模型1~3,差异均有统计学意义(χ2=151.16、165.49、71.35、112.47、132.62、153.14,176.93、74.62、14.09、15.47、6.02、5.80,P均<0.05)。以病灶为单位的视频测试结果显示,医师1~4的平均准确度为68.16%;模型1~5的准确度分别为69.47%(66/95)、69.47%(66/95)、70.53%(67/95)、76.84%(73/95)和80.00%(76/95)。模型1~5之间、模型1~5与医师1~4之间的准确度比较差异均无统计学意义(P均>0.05)。结论基于深度学习的ME-BLI早期胃癌识别模型具有较好的准确度,但诊断效果略差于ME-NBI模型;ME-NBI联合ME-BLI早期胃癌识别模型的诊断效果优于单独模式下的模型;增加ME-NBI图片数量,尤其是早期胃癌图片,可以提高ME-NBI模型的灵敏度,但特异度有所下降。