《JMIR Medical Informatics》:Histopathological Assessment of Myocardial Ischemia-Reperfusion Injury Using Transformer-Based Artificial Intelligence: Model Comparison Study
编辑推荐:
背景:心肌缺血-再灌注损伤(myocardial ischemia-reperfusion injury, MIRI)因复杂的组织病理学改变而面临诊断挑战。目的:本研究旨在建立一种基于苏木精-伊红(hematoxylin-eosin, H&E)染色切片
背景:心肌缺血-再灌注损伤(myocardial ischemia-reperfusion injury, MIRI)因复杂的组织病理学改变而面临诊断挑战。目的:本研究旨在建立一种基于苏木精-伊红(hematoxylin-eosin, H&E)染色切片评估MIRI的智能框架,比较主流深度学习架构,并确定Transformer模型在多种干预措施及时间点下的优势。方法:研究人员分析了来自公开数据集的1280张全切片图像(whole-slide images, WSIs;约62,000个图像块/tile),涵盖抗氧化剂、β受体阻滞剂、钙通道阻滞剂及对照组,取再灌注后6、24及72小时三个时间点。在统一预处理下训练七类模型家族(卷积神经网络 convolutional neural networks, CNNs;循环神经网络 recurrent neural networks, RNNs;长短期记忆网络 long short-term memory networks, LSTMs;自编码器 autoencoders;图卷积网络 graph convolutional networks, GCNs;变分自编码器 variational autoencoders, VAEs;以及Transformer),生成对抗网络(generative adversarial networks, GANs)仅用于防泄漏的数据增强。弱监督采用聚类约束注意力多示例学习(clustering-constrained attention multiple-instance learning, CLAM)策略,分割采用Transformer-UNet。数据按受试者水平以8:1:1划分并进行5折交叉验证。结果:Transformer模型取得最佳性能(准确率 accuracy=0.942;受试者工作特征曲线下面积 area under the curve, AUC=0.982;F1分数 F1-score=0.958)。坏死与凋亡区域的分割Dice系数分别为0.847和0.821。预测结果与专家测量高度一致(相关系数 r=0.886;Bland-Altman界限+5%或?5%),注意力图与坏死边界及炎症灶吻合。时间趋势符合生物学预期,抗氧化剂组改善最为稳定。结论:基于Transformer的病理分析方法可对MIRI进行准确、稳健且可解释的评估,并为动态损伤量化及治疗评价提供可扩展框架。
论文解读:基于Transformer人工智能的心肌缺血-再灌注损伤组织病理学评估:模型对比研究
该研究发表于《JMIR Medical Informatics》。心肌缺血-再灌注损伤(myocardial ischemia-reperfusion injury, MIRI)是再灌注治疗后继发的心肌组织损害,涉及氧化应激、钙超载及细胞凋亡/坏死等复杂机制,影响患者长期预后。目前临床与实验研究中评估MIRI的金标准为苏木精-伊红(hematoxylin-eosin, H&E)染色组织切片镜检,但人工判读受染色差异、背景噪声及观察者主观性影响,效率低且重复性差,尤其在大样本、多干预组、多时间点的研究中难以满足定量需求。尽管深度学习已在肿瘤病理影像中应用广泛,但针对MIRI的H&E切片智能分析、多模型系统比较及跨时间点动态评估尚属空白,且模型可解释性与生物学一致性亦有待加强。为此,研究人员构建了基于Transformer及其他七类深度学习架构的MIRI组织病理学智能评估框架,系统比较模型性能,验证Transformer在分类、分割及动态疗效评价中的优势,并与心血管病理专家判读结果进行一致性分析。结果显示Transformer模型在各项指标上均优于对照架构,其注意力热图与病理医师关注区域高度吻合,且能敏感捕捉不同治疗组在各再灌注时间点的组织学演变趋势,为数字化病理定量分析及药物疗效评价提供了可靠工具。
研究人员所用主要关键技术方法如下:研究纳入来自BioImage Archive(S-EPMC9426742)及Zenodo的公开MIRI-Histo v1数据集,含1280张H&E染色心肌全切片图像(whole-slide images, WSIs;640例人源,640例动物模型即Sprague-Dawley大鼠与C57BL/6小鼠),覆盖抗氧化剂、β受体阻滞剂、钙通道阻滞剂及对照组,再灌注后6 h、24 h、72 h三个时间点。WSI经Otsu阈值法组织区域检测后以512×512像素滑动窗口(步长256)切分为约62,000个图像块(tile),剔除组织占比<40%者,按受试者水平8:1:1划分训练/验证/测试集并行5折交叉验证,严格防止数据泄漏。预处理采用Macenko算法进行H&E颜色归一化,训练集施以旋转、翻转、亮度及仿射变换扩增;采用Deep Convolutional GAN(DCGAN)/StyleGAN2-ADA仅对训练集生成合成样本(占比≤10%)以扩充数据。分类与比较涵盖八种架构:CNN(ResNet-50)、RNN、双向LSTM、自编码器(autoencoder)、变分自编码器(variational autoencoder, VAE)、图卷积网络(graph convolutional network, GCN)、Vision Transformer(ViT-Base/16)及仅供增强用的GAN;分割采用Transformer-UNet对照CNN-UNet。弱监督标签通过聚类约束注意力多示例学习(clustering-constrained attention multiple-instance learning, CLAM)生成伪感兴趣区(pseudo-region of interest, pseudo-ROI),人类样本辅以像素级强监督(三位≥10年资历心血管病理专家双盲复评,Cohen κ=0.92)。分类损失为多类交叉熵配合类别平衡加权及Focal loss(γ=2.0),分割损失为Dice+二值交叉熵(binary cross-entropy, BCE;λDice=0.7, λBCE=0.3)。模型用AdamW优化器及余弦退火调度训练,评价指标含准确率(accuracy)、精确率(precision)、召回率(recall)、F1-score、AUC、Dice系数、交并比(intersection over union, IoU)及Cohen κ,外部独立数据集验证泛化性,Pearson相关与Bland-Altman分析检验AI-专家一致性。
Transformer Model Demonstrates Superior Overall Recognition Performance
研究人员对八种深度学习架构在相同数据划分下开展分类测试,结果表明Transformer模型在测试集上准确率达0.942(5折交叉验证均值0.920),AUC达0.982,F1-score为0.958,混淆矩阵显示假阳性与假阴性率最低,综合识别能力显著优于CNN(测试集准确率0.908)、LSTM(0.895)、RNN(0.882)等其他架构。
Quantitative Performance Statistics
通过非参数自助法(n=1000)计算95%置信区间,Transformer在准确率、AUC、F1-score、精确率及召回率五项指标上均居首位(5折CV准确率0.920 [0.912?0.928],AUC 0.963 [0.956?0.970]),证实模型稳定性与泛化能力最优。
Quantitative Evaluation and Comparative Assessment of Classification Performance
雷达图聚合五维指标显示Transformer全面领先。虽GAN不作为主分类器但提供高质量合成H&E样本提升下游模型鲁棒性(Inception Score IS=2.81,结构相似性 structural similarity index measure, SSIM=0.936,专家盲法鉴别率47.3%接近随机),训练收敛快、推断延迟合理,具备临床部署可行性。
Segmentation Performance and Consistency Validation
采用Transformer-UNet分割坏死与凋亡区域,测试集Dice系数为坏死0.847(0.032)、凋亡0.821(0.036),IoU分别为0.740与0.696,均优于CNN-UNet;模型预测与专家标注的总体Cohen κ=0.86(95% CI 0.83?0.89),各时间点κ值随再灌注时间升高(6 h: 0.83;24 h: 0.86;72 h: 0.88),接近专家间一致性(κ=0.88),表明分割结果具高可信度。
Transformer Model Exhibits Stable Convergence and Strong Generalization During Training
训练与验证集损失持续下降且无过拟合迹象,准确率平稳上升,5次独立运行结果一致,证明ViT优化过程稳定且对心肌组织识别具良好泛化性。
Comparison of Structural and Functional Pathological Features Across Treatment Groups
应用Transformer自动量化各治疗组病理改变发现:抗氧化剂组坏死与凋亡区占比降幅最大、纤维化评分最低,炎症评分及氧化应激指数最小、毛细血管密度最高,显示最强结构保护与微血管维护作用;β受体阻滞剂组对凋亡抑制较明显;钙通道阻滞剂组有一定抗纤维化倾向;对照组损伤最重。
Discriminative Accuracy Performance of the Transformer Model in Myocardial Injury Images Across Multiple Intervention Groups
绘制四治疗组精度—召回(precision-recall, PR)曲线及受试者工作特征(receiver operating characteristic, ROC)曲线,抗氧化剂组平均精度(average precision, AP)=0.99、AUC=0.99表现最佳;对照组AUC=0.96次之;β受体阻滞剂组AUC=0.90;钙通道阻滞剂组AUC=0.83相对较低,反映后者组织形态异质性强、边界模糊增加识别难度。
Analysis of Multigroup Image Recognition Stability and Model Discriminative Power Based on Confidence Scores
以预测置信度热力图展示发现:对照组样本置信度高(红色集中)对应显著损伤;抗氧化剂组置信度低(蓝色集中)对应修复倾向;β受体阻滞剂与钙通道阻滞剂组呈中间过渡分布,证实模型可依治疗背景有效区分损伤严重程度且具有稳定分层能力。
Temporal Evolution of Myocardial Injury Under Different Treatment Strategies
在6 h、24 h、72 h三个再灌注时点量化坏死与凋亡斑块比例,抗氧化剂组坏死相关斑块比例从36.0%(6 h)降至14.1%(72 h),凋亡从26.0%降至13.0%;β受体阻滞剂与钙通道阻滞剂组中期有下降但72 h趋缓;对照组两项指标持续上升(坏死由45.0%升至51.3%)。Transformer可敏感捕获各干预下的时间依赖组织学演变。
Evaluation of the Discriminative Performance of Transformer Models Across Different Epochs
按时间点分别绘制ROC与PR曲线,72 h时AUC=0.98最优,24 h时AUC=0.97,6 h急性期AUC=0.91,表明模型在全时段尤其中晚期修复阶段具优异判别力。
Model Interpretability and Biological Consistency of Attention Maps
基于CLAM的弱监督注意力机制生成伪ROI热图,高权重红色区域与坏死带边缘及炎细胞浸润区空间重合,弱监督Transformer slide级分类AUC达0.947,说明注意力聚焦区域具明确生物学意义,模型具内在可解释性。
Model Validation and Consistency Analysis / Concordance Analysis Between Model Outputs and Expert Annotations
独立样本集上AI预测与两位资深病理专家手工测量的坏死、凋亡面积比Pearson相关系数r分别为0.93与0.89(均P<.001),Bland-Altman均值差分别为0.002与0.003,95%一致性界限在±5%内无系统偏差;模型输出与专家评分线性相关性r=0.886(P=5.19×10?21),确认Transformer量化结果可靠且与临床病理判读高度一致,外部BioImage Archive数据集时序轨迹复现相同趋势。
讨论与结论
研究人员指出传统MIRI病理评估主观低效,既往AI病理研究多局限于静态CNN分类而未整合多干预组与时相维度。本研究通过融合人源与经典啮齿动物MIRI切片(临床推论主要依据人源样本性能),借助Transformer全局注意力机制实现跨时间点组织学进展高精度识别,并以CLAM注意力图及专家一致性验证生物学合理性。GAN仅起适度辅助扩增作用。该框架可嵌入数字病理平台辅助阅片、支持药物筛选与疗效量化,热图及时序图亦可用于教学。局限性包公公开数据集未完全涵盖日常染色/扫描变异、未整合多组学或电生理等多模态信息、Transformer参数量大致推断资源需求较高。未来拟扩增多中心临床样本、融合多组学生物标志物、深化可解释AI因果探究及模型压缩以便边缘端部署,并可拓展至脑梗死、肝纤维化和肺损伤等其他组织损伤病理评估。结论:基于Transformer的人工智能框架对MIRI的H&E染色切片可实现准确、稳健及可解释的组织病理学评估,在分类、分割及动态治疗反应监测中均优于对照深度学习模型,为数字化心血管病理提供可扩展的高通量定量工具,并为精准医学中的标准化组织损伤评价奠定基础。