基于H&E染色全切片图像的深度学习模型预测早期乳腺癌复发风险
《Scientific Reports》:Assessing the risk of recurrence in early-stage breast cancer through H&E stained whole slide images
【字体:
大
中
小
】
时间:2025年10月09日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对早期乳腺癌术后辅助化疗决策缺乏精准指导的临床难题,创新性地利用深度学习算法分析H&E染色全切片图像(WSI),以无创方式预测Oncotype DX 21基因检测复发风险评分(RS)。研究通过对125例患者WSI的分析,实现了低、中、高风险分层的87.33%准确率,特异性达0.972(高风险),且模型关注特征与病理学家评估的组织学特征(如核分裂象)高度一致。该研究为开发低成本、可扩展的乳腺癌复发风险评估工具提供了新思路。
在精准医疗时代,早期乳腺癌患者的术后治疗决策如同一场精密的天平称重——如何准确判断复发风险,避免过度治疗或治疗不足,始终是肿瘤学家面临的重大挑战。特别是对于雌激素受体阳性(ER-positive)、人表皮生长因子受体2阴性(HER2-negative)的早期乳腺癌患者,传统的临床病理参数往往只能提供有限的指导。目前,Oncotype DX等基因组检测虽能提供较为准确的复发风险预测,但其高昂成本和操作复杂性限制了广泛应用。
正是在这样的背景下,一项发表在《Scientific Reports》上的创新研究带来了令人振奋的解决方案。研究人员探索了一种全新的可能性:能否仅利用常规病理检查中最基础的苏木精-伊红(H&E)染色全切片图像(Whole Slide Images, WSIs),通过深度学习技术准确预测乳腺癌的复发风险?这一设想如果实现,将显著降低检测成本,使更多患者受益于精准的风险评估。
研究团队收集了来自两个医疗中心的125例早期乳腺癌患者的H&E染色WSIs,所有患者均已完成Oncotype DX检测并获得复发评分(Recurrence Score, RS)。研究采用创新的深度学习框架,首先将WSIs分割成512×512像素的图像块,然后通过多个步骤进行分析:先区分组织与背景,再识别癌变区域,最后预测每个癌变区域的复发风险等级。
关键技术方法包括:基于ConvNext架构的深度学习模型,采用5折交叉验证避免数据泄露;置信度感知学习(confidence-aware learning)技术解决模型过度自信问题;对比损失函数(contrastive loss)增强同类图像特征的聚类效果;以及基于多数投票的WSI级别预测聚合策略。样本队列来自韩国大学九老医院和国家癌症中心,包含125例T1-2、N0-1、M0期乳腺癌患者。
模型在WSI级别的总体准确率达到87.33%,其中高风险组的识别准确率尤为突出,为91.2%。特别值得注意的是,模型没有将任何高风险病例误判为低风险,这一特性在临床应用中至关重要。在敏感性和特异性方面,低风险组分别为0.857和0.816,中风险组为0.746和0.803,高风险组为0.529和0.972。
研究人员发现了一个重要现象:部分在WSI级别被错误分类的病例,在图像块级别实际上被正确识别。这表明简单的多数投票聚合策略可能不是最优方法,未来研究可能需要更复杂的加权策略。
通过可视化分析,研究人员揭示了模型决策的依据。类激活图(Class Activation Maps)显示,模型关注的特征与病理学家评估的组织学特征高度一致,如腺管形成、核多形性和核分裂象等。
模型预测与诺丁汉组织学分级(Nottingham histological grade)显示出显著相关性(Pearson相关系数0.61)。特别是在低级别(Grade 1)和高级别(Grade 3)肿瘤的比较中,模型能够有效区分不同的形态学特征。
更有趣的是,在某些病理学家判断与RS分组不一致的案例中,模型的预测反而更符合基因检测结果,提示深度学习可能捕捉到一些人眼难以识别的细微形态学特征。
这项研究证实了仅使用常规H&E染色WSIs即可通过深度学习模型有效预测乳腺癌复发风险,与Oncotype DX检测结果达到87.75%的一致性。这一成果具有重要的临床转化价值:首先,它提供了一种成本显著降低的风险评估方案,有望使更多医疗资源欠发达地区的患者受益;其次,模型展示出与病理专家评估的高度一致性,同时在某些情况下甚至能纠正人眼判断的偏差,显示出辅助诊断的潜力。
研究同时指出了当前方法的局限性:样本量相对较小(125例),高风险病例不足;缺乏长期临床结局数据的验证;中间风险组的预测性能有待提升。此外,简单的多数投票策略可能不是最优的图像块聚合方法。
未来研究需要在更大规模、多中心的前瞻性队列中进行验证,并整合临床结局数据,以进一步确立该方法的临床实用性。同时,探索更先进的聚合策略和模型架构,有望进一步提升预测性能。
这项研究为 computational pathology(计算病理学)在乳腺癌精准医疗中的应用开辟了新途径,展示了人工智能技术在弥补传统病理学主观性和基因组检测成本高这一双重挑战中的独特价值。随着技术的不断完善和验证,基于深度学习的H&E图像分析有望成为乳腺癌风险管理的重要工具,为全球乳腺癌患者提供更可及、更精准的诊疗服务。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号