
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:乳腺癌肿瘤分类的机器学习与深度学习在不同数据集上的对比分析
《ARCHIVES OF COMPUTATIONAL METHODS IN ENGINEERING》:Breast Cancerous Tumor Classification: A Comparative Analysis of Machine Learning and Deep Learning on Different Datasets
【字体: 大 中 小 】 时间:2025年09月06日 来源:ARCHIVES OF COMPUTATIONAL METHODS IN ENGINEERING 12.1
编辑推荐:
这篇综述系统评述了机器学习(ML)和深度学习(DL)在乳腺癌肿瘤分类中的应用进展,聚焦五大数据集(Wisconsin、SEER、超声图像、乳腺X线摄影(mammograms)、BreakHis组织病理图像),通过分析2015-2024年多平台文献,揭示了人工智能技术在提升诊断准确性、克服放射性暴露风险及临床转化挑战中的潜力。
乳腺癌作为女性高发疾病,每八名女性中便有一人因此丧生。当前诊断技术如乳腺X线摄影(mammography)、磁共振成像(MRI)、计算机断层扫描(CT)等虽能早期发现病变,但依赖专业放射科医师解读,存在成本高、误诊风险大等局限。更值得注意的是,放射性暴露风险使部分女性回避筛查,而非侵入性技术的诊断特异性不足进一步制约了普及。
近十年间,机器学习(ML)与深度学习(DL)的融合彻底改变了医学影像分析领域。卷积神经网络(CNN)通过提取乳腺超声图像的深层特征,实现了微小肿瘤的精准定位;支持向量机(SVM)在Wisconsin数据集上表现出高达98%的良恶性分类准确率。组织病理学图像分析中,基于BreakHis数据集的ResNet-50模型将诊断时间缩短至传统方法的1/10,同时保持95%以上的敏感性。
研究对比了五大核心数据集的特点:
Wisconsin:聚焦临床特征与肿瘤标记物;
SEER:覆盖大规模流行病学数据;
超声图像:适用于致密乳腺组织筛查;
乳腺X线摄影:金标准但存在假阳性;
BreakHis:提供高分辨率组织切片。
跨数据集验证表明,迁移学习(Transfer Learning)可显著提升模型泛化能力,如将ImageNet预训练模型应用于乳腺超声时,AUC提升0.15。
尽管DL在实验室环境中表现优异,但实际临床应用仍面临三大挑战:
数据异质性:不同医疗机构影像协议差异导致模型性能波动;
解释性不足:黑箱决策难以获得临床医师信任;
伦理合规:患者隐私保护与算法偏见需严格审查。
下一代研究应聚焦三大方向:联邦学习(Federated Learning)解决数据孤岛问题、注意力机制(Attention Mechanism)增强可解释性、多中心临床试验验证模型鲁棒性。正如综述所强调,唯有通过跨学科合作与严格的外部验证,人工智能才能真正成为抗击乳腺癌的利器。
生物通微信公众号