综述:机器学习在结直肠癌预测和诊断中的模型性能系统评价

《International Journal of Medical Microbiology》:Machine learning in colorectal cancer prediction and diagnosis: a systematic review of models' performance

【字体: 时间:2025年11月03日 来源:International Journal of Medical Microbiology 3.6

编辑推荐:

  本综述系统评价了2019-2024年间机器学习(ML)模型在结直肠癌(CRC)预测与诊断中的应用。结果表明,集成学习(EML)、神经网络(ANN/DNN)和支持向量机(SVM)等模型表现优异,凸显了AI在肿瘤早筛领域的巨大潜力。然而,数据集和方法的异质性、缺乏标准化验证等挑战,仍是临床转化前亟待解决的关键问题。

  

摘要

结直肠癌(CRC)是全球重大的健康负担,其早期准确检测策略需求迫切。机器学习(ML)模型在此领域的应用日益增多,但其性能需系统评估以指导临床应用。本综述旨在评估2019年至2024年间发表的ML模型在CRC预测和诊断中的性能,识别最常用模型,确定其性能,并分析不同模型设置对性能的影响。

引言

癌症是全球主要的健康挑战之一,也是导致死亡的重要原因。2020年,全球有超过2000万新发癌症病例和近1000万死亡病例。结直肠癌(CRC)是其中最常见和最致命的癌症类型之一,当年新增病例约190万,死亡病例达93.5万例。CRC通常从良性息肉发展为侵袭性恶性肿瘤,因此早期发现和及时干预对于改善患者预后至关重要。
CRC是一种多因素疾病,风险因素包括年龄、家族史等不可改变因素,以及饮食、肥胖、吸烟等可改变的生活方式因素。人工智能(AI)技术,特别是机器学习(ML)和深度学习(DL),正日益融入医疗保健领域,在癌症诊断、风险评估和治疗规划方面发挥作用。在CRC领域,AI辅助结肠镜检查中的息肉检测、组织病理学分类以及基于临床和分子数据的结局预测,有助于提高准确性并实现个性化医疗。
与先前局限于大数据集或特定数据类型的综述不同,本综述涵盖了更近期的研究,综合了不同数据集类别下的预测和诊断模型,协调了多指标性能评估,并详细分析了数据分割、预处理和特征选择等模型设置对性能的影响。

方法

本系统评价遵循PRISMA指南,检索了SCOPUS、PubMed和Web of Science数据库中关于ML用于CRC分类和诊断的研究。研究筛选、数据提取和偏倚风险评估由多名评审员独立完成。提取的数据包括研究特征、模型规格、验证方法和性能指标。

结果

共有30项研究符合纳入标准。随机森林(RF)是最常被评估的模型,而集成学习(EML)、神经网络(ANN/DNN)和支持向量机(SVM)在多项指标中 consistently 表现出最高性能。大多数研究使用分子数据集,特征选择方法差异很大,并显著影响模型性能。

讨论

相关研究发表在计算机科学、医学、肿瘤学和生物信息学等多个学科的期刊上,这反映了ML在医疗保健中应用的多学科合作性质,但也为证据整合和临床推广带来了挑战。对于临床医生和政策制定者而言,整合分散在不同领域的证据更为困难。
模型性能的差异部分源于数据集特征、预处理技术和特征选择方法的异质性。内部验证方法(如k折交叉验证)的普遍使用,可能高估模型在未见数据上的实际表现。因此,外部和前瞻性验证对于评估其真实世界的诊断潜力和对临床决策的影响至关重要。

结论与未来方向

本综述的证据表明,ML模型,尤其是EML、ANN、DNN和SVM,在CRC预测和诊断中表现出较高的诊断性能。先进的特征选择和降维技术(如PCA、LDA)通常能提高模型的效率和性能。集成和混合模型的一致成功,凸显了其有效捕捉CRC多层面性质的潜力。
未来的研究应优先进行严格的外部验证,解决数据集和方法的异质性,并探索多模态数据融合。提高研究的透明度和报告规范性,将有助于促进这些有前景的ML模型转化为临床实践,最终改善CRC患者的预后。

优势与局限性

本综述的优势在于评估了ML取得显著进展时期的文献,系统比较了多种模型和指标,并使用多种测量指标以避免单一指标的偏差。局限性包括许多研究依赖内部验证,可能影响结果普遍性;研究间的高度异质性限制了直接比较;并且可能存在发表偏倚。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号