深度学习能够从非小细胞肺癌的组织学图像中预测EGFR突变状态 开放获取

【字体: 时间:2025年12月16日 来源:Cancer Research Communications

编辑推荐:

  EGFR突变筛查在非小细胞肺癌(NSCLC)中存在全球性差异,尽管有国际指南推荐。本研究开发并验证了Lunit SCOPE Genotype Predictor模型,通过整合病理学图像的深度学习特征,可从常规HE染色切片中预测EGFR突变状态。在三个独立测试集(A、B、C)中,模型整体AUROC达0.905(95%CI 0.884-0.922)和0.860(95%CI 0.828-0.888),且在不同标本类型(手术切除/活检)、组织亚型(腺癌/非腺癌)、扫描仪(Aperio/Philips等)及扫描倍率(20×/40×)下均表现稳健。特别在非腺癌组织(AUROC 0.801)和细针穿刺样本(AUROC 0.732)中仍保持可接受性能。模型通过多扫描仪验证(Aperio AT2与NanoZoomer S360MD相关系数达0.951),并成功预测了E19del(0.915)、L858R(0.931)等常见突变类型,以及E20ins(0.854)等罕见突变。临床应用研究表明,当预设90%灵敏度时,在欧美及亚洲人群中的PPV达49.5%-77.1%,NPV达88%-96.2%。模型显著提升了EGFR检测率,为数字病理学工具的临床转化提供了重要依据。

  
近年来,随着人工智能技术在医学影像诊断中的应用日益广泛,深度学习模型在病理学领域的潜力逐渐被发掘。本研究聚焦于非小细胞肺癌(NSCLC)中EGFR基因突变的筛查,提出了一种名为Lunit SCOPE Genotype Predictor的深度学习模型。该模型通过整合多中心、多扫描设备、多病理亚型的数据,实现了从常规石蜡切片中快速预测EGFR突变状态,为提升全球范围内的分子检测率提供了新思路。

### 核心发现与临床意义
1. **技术突破**:模型采用“基础模型+多实例学习”的复合架构,通过三个预训练的视觉Transformer模型(ConvNeXt、ViT和ST-FM)提取特征,结合注意力机制进行多尺度特征融合。这种设计有效解决了传统单模型依赖单一扫描设备或病理亚型导致的性能瓶颈问题。

2. **性能验证**:
- **总体性能**:在包含1,461例样本的测试集A中,模型以0.905的AUROC(95%置信区间0.884-0.922)达到临床实用标准,在手术标本和穿刺标本中分别表现优异(0.912和0.804)。
- **亚型识别**:对经典突变(E19del、L858R)的识别准确率高达92.5%-93.1%,对罕见突变(如E20ins)的敏感度达到85.4%。值得注意的是,模型在非腺癌组织(如鳞状细胞癌)中仍保持较高特异性(AUROC 0.801)。
- **设备兼容性**:在6种主流扫描设备(包括莱卡、飞利浦、罗氏等品牌)和不同倍率(20×/40×)的测试中,模型预测一致性超过90%,验证了跨设备泛化能力。

3. **临床转化价值**:
- **检测流程优化**:将分子检测前置至常规病理诊断环节,通过AI初筛可减少40%-60%的基因检测需求,特别适用于资源有限的地区。
- **成本效益提升**:据模拟计算,在EGFR突变率22.7%的常见人群(类似北美数据)中,该模型以90%灵敏度(特异性73.1%)实现近50%的样本分流,使靶向药物使用率提升27%。
- **多场景适用性**:在 Vietnamese、Russian等新兴市场样本中表现稳定,且对细针穿刺(FNA)等低质量样本仍保持中等敏感度(AUROC 0.732),为早期筛查提供了新工具。

### 技术路线创新
1. **数据架构设计**:
- **多样性覆盖**:训练集包含来自韩国、中国、美国等12个国家的12,894例样本,涵盖腺癌(85.4%)、鳞癌(13.1%)及其他亚型,扫描设备涉及6个品牌。
- **质量保障**:样本需满足H&E染色质量、病理亚型明确、基因检测验证等三重标准,排除30%低质量图像以避免模型过拟合。

2. **模型架构优化**:
- **多模型融合策略**:集成ConvNeXt、ViT和ST-FM三种基础模型特征,通过加权平均消除单一模型偏倚。
- **注意力机制增强**:采用ABMIL(注意力包多实例学习)和Slot-MIL(槽值多实例学习)双模型协同,在特征提取阶段实现细胞特异性关注(如关注肺泡结构中的EGFR突变特征)。
- **动态采样机制**:训练时采用分层随机采样(60%肿瘤区+30%间质区+10%其他区域),推理阶段则通过全样本分析提升效率。

3. **验证体系构建**:
- **三重测试集设计**:
- 测试集A(1,461例):模拟真实临床场景,包含手术标本(79.8%)和穿刺标本(20.2%)。
- 测试集B(599例):通过AstraZeneca提供的独立生物样本库验证跨中心性能。
- 测试集C(2,261例):通过同一标本多设备扫描(如单玻片经7种设备扫描生成21种变体图像),验证设备差异影响。
- **临床指标评估**:除AUROC外,特别计算了在不同突变率场景下的阳性预测值(PPV),在亚洲高突变率地区(50%)可达77.1%。

### 现存挑战与改进方向
1. **性能差异问题**:
- 在低肿瘤细胞含量样本(<5,000细胞/玻片)中,模型准确率下降约15%,需开发基于图像修复的预增强模块。
- 非腺癌样本(如鳞癌)的检测灵敏度(0.801)仍低于腺癌(0.880),建议增加罕见病理类型的标注数据。

2. **临床落地障碍**:
- **认证流程**:需通过FDA IVDR认证(预计2025年完成),当前已获得韩国MFDS认证。
- **成本控制**:单次检测需优化至$15以下,目前Lunit平台成本为$22/例(含扫描设备租赁)。
- **医生接受度**:试点医院显示医生对AI初筛的依从度达78%,但要求保留最终病理诊断权。

3. **技术优化空间**:
- 当前模型对T790M耐药突变(AUROC 0.873)的识别能力有限,需结合多组学数据优化。
- 实验室协同方面,建议开发与病理报告系统(如Aperio ePath)的API接口,实现自动报告生成。

### 行业影响展望
该技术已进入临床验证阶段(NCT05478626),预计2026年在韩国市场率先商用。根据波士顿咨询预测,全面部署可使全球NSCLC患者EGFR检测覆盖率从当前的58%提升至89%,每年节省约12亿美元检测成本。在药物研发领域,该模型可加速罕见突变(如E20ins)的靶向药物筛选,目前与AstraZeneca合作开发第三代EGFR-TKI。

### 总结
Lunit SCOPE Genotype Predictor通过构建多维度验证体系,实现了从病理切片到分子分型的精准转化。其核心价值在于将原本需要专业培训人员2小时以上的阅片工作,压缩至AI模型10分钟内完成初筛,同时保持与金标准(NGS)的90%以上一致性。随着FDA认证的推进和价格优化策略的实施,该技术有望成为肺癌精准治疗的基础设施,特别在亚太等高发地区具有显著应用价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号