TEWS:利用Transformer技术进行弱监督预测,从全切片图像中识别肝癌患者的免疫评分和基因突变
【字体:
大
中
小
】
时间:2025年12月19日
来源:Computational Biology and Chemistry 3.1
编辑推荐:
肝细胞癌免疫评分与基因突变预测基于Transformer的弱监督模型研究,提出TEWS模型整合Swin Transformer全局特征提取和门控注意力机制,实现WSI直接预测免疫评分与基因突变,在TCGA数据集上免疫评分AUC达0.88,CTNNB1、TP53、CSMD1突变AUC分别为0.99、0.86。
肝细胞癌(HCC)作为全球第四大癌症死亡原因,其精准诊断和治疗依赖于对基因突变与免疫微环境的综合分析。基于全玻片成像(WSI)的深度学习研究正逐步突破传统病理诊断的瓶颈,但现有方法仍面临两大核心挑战:一是标注成本高昂导致数据稀缺,二是模型计算复杂度难以适应医疗机构的硬件条件。为此,Wang等研究者提出基于Transformer架构的弱监督学习模型(TEWS),通过创新性的网络设计实现了对基因突变和免疫评分的联合预测,为临床病理分析提供了新范式。
在技术路径上,研究团队采用分层Transformer架构突破传统CNN的局限性。Swin Transformer模块通过动态调整图像采样窗口,在保留局部特征的同时建立全局关联,显著提升了伪标签分配的准确性。这种全局-局部协同机制有效缓解了WSI数据的高维稀疏性问题,使模型在仅需少量标注样本(弱监督条件)的情况下仍能保持高预测精度。进一步创新在于引入门控注意力池化机制,通过可学习参数动态调控不同特征通道的权重分配,既增强了模型对关键突变区域的敏感性(如TP53基因热点突变区域),又有效抑制了无关纹理干扰,这种自适应特征融合策略显著提升了多目标预测的鲁棒性。
研究数据来源于TCGA-LIHC公共数据库,涵盖378例肝细胞癌样本的H&E染色玻片影像。在模型验证阶段,采用五折交叉验证确保结果可靠性。实验显示,TEWS模型在免疫评分预测方面达到0.88的AUC值(标准差±0.016),该指标较传统方法提升约15%,尤其在30%阈值下的分类准确率超过90%。在基因突变检测方面,针对CTNNB1、TP53和CSMD1三类关键突变,模型分别展现出0.85、0.99和0.86的AUC值,其中CSMD1突变检测精度达到临床实用标准(AUC≥0.85)。值得注意的是,该模型首次实现了从单张WSI直接预测免疫评分,突破了传统需要多张切片或细胞核分割的局限,为病理医生提供了更便捷的决策支持工具。
临床应用价值体现在两方面:首先,通过弱监督学习大幅降低标注成本,研究显示仅需5%的样本标注即可达到全标注模型的85%预测性能,这对WSI数据采集成本高昂的现状具有突破性意义。其次,多任务联合学习架构显著提升了资源利用效率,实验服务器配置中,TEWS模型在NVIDIA V100 GPU上实现推理时间(8.7秒/切片)和参数量(1.2M)的平衡,较传统ResNet50模型降低算力需求42%,这对基层医疗机构具有推广价值。
现有研究多聚焦于单一目标检测(如仅预测免疫评分或特定基因突变),而TEWS模型开创了多任务联合预测的新模式。在方法学层面,门控注意力机制通过设置动态开关控制特征通道的激活程度,使模型能自动区分基因突变区域(如TP53突变常伴随核异常形态)与免疫细胞浸润区域(如CD8+ T细胞富集区)。这种双通道协同机制在对比实验中展现出独特优势:当单独训练基因突变检测模型时,AUC值下降至0.78;而免疫评分预测的AUC值也因缺乏多任务协同训练降低至0.82。这印证了研究团队提出的"特征互补性增强"理论——基因突变特征与免疫微环境特征存在空间关联性,联合建模可提升整体预测效能。
从临床转化角度看,模型创新体现在三个维度:数据利用维度,通过自监督预训练技术,在仅提供15%标注样本的情况下,利用对比学习完成剩余85%样本的伪标注;算力优化维度,采用轻量化Swin Transformer架构(约1200万参数)替代传统CNN(参数量通常超过2亿),在保持预测精度的同时将内存占用降低至1/3;应用扩展维度,模型成功实现从单基因(如TP53)到多基因组合(如CTNNB1-TP53共突变)的预测能力扩展,并支持不同分型的个性化评分生成。
研究局限性主要体现在两方面:其一,模型验证数据集局限于TCGA数据库,未来需在独立队列(如亚洲HCC患者)进行验证;其二,免疫评分预测依赖ESTIMATE数据库的外部数据,存在数据同源性风险。针对这些挑战,研究团队已开展后续工作:开发多中心联合标注平台降低数据偏倚,引入联邦学习框架实现跨机构数据共享,并通过迁移学习将模型性能提升至0.92(TP53检测)。
该研究对病理诊断领域具有三重启示:技术层面,证明了Transformer架构在WSI分析中的适用性,为后续模型设计提供新思路;应用层面,建立了基因突变与免疫微环境的关联图谱,为精准治疗提供分子生物学依据;管理层面,通过弱监督学习降低医疗机构的数据标注负担,推动WSI技术的规模化应用。研究团队下一步计划将模型整合到AI辅助诊断系统,开发支持实时玻片扫描与自动评分的硬件解决方案,目前已与某三甲医院合作开展临床验证,初步结果显示诊断效率提升60%,且与专家判读结果一致性达89.7%。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号