
-
生物通官微
陪你抓住生命科技
跳动的脉搏
ROSIE深度学习框架:基于H&E染色图像的多重免疫荧光染色AI生成技术
【字体: 大 中 小 】 时间:2025年08月17日 来源:Nature Communications 15.7
编辑推荐:
这篇研究开创性地开发了ROSIE深度学习框架,通过卷积神经网络(ConvNeXt)从常规苏木精-伊红(H&E)染色图像中预测50种蛋白生物标志物的空间表达。基于1300余组共定位H&E与多重免疫荧光(mIF/CODEX)样本训练,模型在保留样本中实现Pearson R=0.285的预测精度,显著提升淋巴细胞亚型(B/T细胞)和肿瘤浸润淋巴细胞(TILs)的识别能力。该技术突破传统H&E的分子信息局限,为肿瘤微环境研究提供高性价比的数字化解决方案。
AI驱动的组织病理学突破
ROSIE框架:从H&E到多重免疫荧光的智能跃迁
技术革新背景
苏木精-伊红(H&E)染色作为临床病理学的金标准,虽能清晰显示细胞核(蓝色)和胞质(粉色)结构,却无法直接揭示CD45、PD-L1等关键蛋白标记物。传统多重免疫荧光(mIF)技术如CODEX虽可同时检测数十种蛋白,但存在单样本成本超5000美元、实验周期长达72小时等瓶颈。ROSIE框架的诞生,标志着AI在破解H&E图像隐藏分子信息领域取得重大突破。
数据规模与模型架构
研究团队构建了史上最大共定位数据集——跨越16种疾病类型、10个解剖部位的1342个样本,包含1600万细胞级对齐数据。核心模型采用50M参数的ConvNeXt-S卷积神经网络,以128×128像素H&E图像块为输入,预测中心8×8区域50种蛋白(含DAPI、CD45、PanCK等)的平均表达。相较于Transformer架构(ViT-L/16),该设计在保持3.02μm/像素分辨率的同时,训练效率提升6倍。
性能验证
在斯坦福胰腺癌(PGC)等4个独立验证集中,ROSIE展现出:
线性预测能力:整体Pearson R=0.285(CD68最高达0.52)
临床排序价值:样本级C-index达0.706,显著优于形态学基线(0.501)
细胞分型优势:B/T细胞识别F1分数0.507,超越CellViT++算法23%
生物学意义挖掘
模型预测成功捕获肿瘤免疫特征:
免疫热/冷肿瘤:结直肠癌(Ochsner-CRC)预测T细胞比例40.1%,与临床"热肿瘤"特征吻合
空间互作解析:肿瘤浸润淋巴细胞(TILs)计数预测与金标准相关性r=0.805
微环境重构:通过SCGP算法发现基质-上皮边界结构(ARI=0.475)
技术亮点
质量控制系统:创新性引入Wasserstein距离(W1)和动态范围双指标,可将低质量样本预测准确率提升17%
跨平台验证:在Orion-CRC数据集(非CODEX平台)中,对CD45等15种标志物保持预测稳定性
计算优化:单张组织微阵列(TMA)核心仅需5分钟GPU推理
临床转化前景
研究证实ROSIE可替代约30%的免疫组化(IHC)检测需求。在弥漫大B细胞淋巴瘤(UChicago-DLBCL)样本中,模型预测的BCL2表达与患者预后显著相关(p<0.01)。未来通过与Foundation Model联用,有望实现从常规病理切片到个性化治疗方案的AI直通路径。
方法学细节
样本制备采用多聚赖氨酸包被载玻片,5μm FFPE切片经pH9.0抗原修复后,与DNA条形码抗体孵育3小时。图像配准使用SIFT特征匹配,通过RANSAC算法实现亚像素级对齐(误差<2μm)。训练采用masked MSE损失函数,Adam优化器(lr=1e-4)配合随机亮度/对比度增强。
局限性
研究承认ECad等上皮标志物预测性能波动(r=0.12-0.45),可能与H&E对细胞连接结构显色特异性不足有关。团队开源了抗体信息表(含148种抗体克隆号)和训练数据集,推动领域协同优化。
这项发表于Nature系列的研究,为全球2500万例/年的H&E切片提供了分子级解析的新范式,其技术路线已获3项国际专利保护。随着数字病理学进入AI时代,ROSIE框架或将重新定义病理诊断的成本效益曲线。
生物通微信公众号
知名企业招聘