随机森林模型的构建及其对乳腺癌新辅助化疗病理完全缓解的预测价值

在线阅读 下载PDF 导出详情
摘要 摘要目的构建随机森林模型并探讨其对乳腺癌新辅助化疗病理完全缓解(pCR)的预测价值。方法回顾性分析2010年1月至2021年10月沧州市中心医院142例新辅助化疗后行保乳术或改良根治术的原发性乳腺癌患者的临床病理资料。根据患者是否获得pCR(乳腺和腋窝淋巴结组织学无浸润性癌残留)分为pCR组与非pCR组,比较两组患者临床病理特征的差异。通过logistic回归分析新辅助化疗pCR的危险因素,应用R软件随机森林函数构建随机森林模型,应用随机森林算法的基尼指数对变量进行重要性排序。以pCR为金标准,通过受试者工作特征(ROC)曲线评价随机森林模型预测新辅助化疗pCR的效能。结果全组患者新辅助化疗pCR率为16.20%(23/142)。pCR组中肿瘤长径≤ 5 cm、腋窝淋巴结阴性、人表皮生长因子受体2(HER2)阴性、Ki-67阳性指数>20%、组织学分级2级及新辅助治疗方案包括靶向治疗患者比例均高于非pCR组,差异均有统计学意义(均P<0.05)。单因素logistic回归分析显示,肿瘤长径、腋窝淋巴结、HER2、Ki-67、组织学分级及新辅助治疗方案均与pCR相关(均P<0.05)。多因素logistic回归分析显示,肿瘤长径>5 cm(OR=5.85,95% CI 1.28~26.67,P=0.022)、腋窝淋巴结阳性(OR=11.22,95% CI 1.84~68.42,P=0.009)、HER2阳性(OR=7.35,95% CI 1.45~37.26,P=0.016)、Ki-67阳性指数≤20%(OR=1.03,95% CI 1.01~1.06,P=0.017)、组织学分级3级(OR=7.37,95% CI 1.24~43.86,P=0.028)及非靶向治疗(靶向治疗比非靶向治疗:OR=0.02,95% CI 0.00~0.25,P=0.003)均为pCR的独立危险因素。随机森林算法分析显示,pCR危险因素重要性依次为Ki-67低表达、腋窝淋巴结阳性、肿瘤长径>5 cm、HER2阳性、非靶向治疗及组织学分级3级。ROC曲线分析显示,随机森林模型预测pCR的曲线下面积为0.84(95% CI 0.74~0.93),当最佳临界值为0.88时,灵敏度为87.0%,特异度为72.3%。结论Ki-67低表达、腋窝淋巴结阳性、肿瘤长径>5 cm、HER2阳性、非靶向治疗及组织学分级3级为乳腺癌新辅助化疗pCR的危险因素,以此建立的随机森林模型有助于预测乳腺癌新辅助化疗pCR。
出处 《肿瘤研究与临床》 2022年10期
出版日期 2022年12月13日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献