基于Transformer人工智能的心肌缺血-再灌注损伤组织病理学评估：模型对比研究

《JMIR Medical Informatics》：Histopathological Assessment of Myocardial Ischemia-Reperfusion Injury Using Transformer-Based Artificial Intelligence: Model Comparison Study

【字体：大中小】 时间：2026年06月14日 来源：JMIR Medical Informatics 3.8

编辑推荐：

　　背景：心肌缺血-再灌注损伤（myocardial ischemia-reperfusion injury, MIRI）因复杂的组织病理学改变而面临诊断挑战。目的：本研究旨在建立一种基于苏木精-伊红（hematoxylin-eosin, H&E）染色切片

背景：心肌缺血-再灌注损伤（myocardial ischemia-reperfusion injury, MIRI）因复杂的组织病理学改变而面临诊断挑战。目的：本研究旨在建立一种基于苏木精-伊红（hematoxylin-eosin, H&E）染色切片评估MIRI的智能框架，比较主流深度学习架构，并确定Transformer模型在多种干预措施及时间点下的优势。方法：研究人员分析了来自公开数据集的1280张全切片图像（whole-slide images, WSIs；约62,000个图像块/tile），涵盖抗氧化剂、β受体阻滞剂、钙通道阻滞剂及对照组，取再灌注后6、24及72小时三个时间点。在统一预处理下训练七类模型家族（卷积神经网络 convolutional neural networks, CNNs；循环神经网络 recurrent neural networks, RNNs；长短期记忆网络 long short-term memory networks, LSTMs；自编码器 autoencoders；图卷积网络 graph convolutional networks, GCNs；变分自编码器 variational autoencoders, VAEs；以及Transformer），生成对抗网络（generative adversarial networks, GANs）仅用于防泄漏的数据增强。弱监督采用聚类约束注意力多示例学习（clustering-constrained attention multiple-instance learning, CLAM）策略，分割采用Transformer-UNet。数据按受试者水平以8:1:1划分并进行5折交叉验证。结果：Transformer模型取得最佳性能（准确率 accuracy=0.942；受试者工作特征曲线下面积 area under the curve, AUC=0.982；F1分数 F1-score=0.958）。坏死与凋亡区域的分割Dice系数分别为0.847和0.821。预测结果与专家测量高度一致（相关系数 r=0.886；Bland-Altman界限+5%或?5%），注意力图与坏死边界及炎症灶吻合。时间趋势符合生物学预期，抗氧化剂组改善最为稳定。结论：基于Transformer的病理分析方法可对MIRI进行准确、稳健且可解释的评估，并为动态损伤量化及治疗评价提供可扩展框架。

论文解读：基于Transformer人工智能的心肌缺血-再灌注损伤组织病理学评估：模型对比研究

该研究发表于《JMIR Medical Informatics》。心肌缺血-再灌注损伤（myocardial ischemia-reperfusion injury, MIRI）是再灌注治疗后继发的心肌组织损害，涉及氧化应激、钙超载及细胞凋亡/坏死等复杂机制，影响患者长期预后。目前临床与实验研究中评估MIRI的金标准为苏木精-伊红（hematoxylin-eosin, H&E）染色组织切片镜检，但人工判读受染色差异、背景噪声及观察者主观性影响，效率低且重复性差，尤其在大样本、多干预组、多时间点的研究中难以满足定量需求。尽管深度学习已在肿瘤病理影像中应用广泛，但针对MIRI的H&E切片智能分析、多模型系统比较及跨时间点动态评估尚属空白，且模型可解释性与生物学一致性亦有待加强。为此，研究人员构建了基于Transformer及其他七类深度学习架构的MIRI组织病理学智能评估框架，系统比较模型性能，验证Transformer在分类、分割及动态疗效评价中的优势，并与心血管病理专家判读结果进行一致性分析。结果显示Transformer模型在各项指标上均优于对照架构，其注意力热图与病理医师关注区域高度吻合，且能敏感捕捉不同治疗组在各再灌注时间点的组织学演变趋势，为数字化病理定量分析及药物疗效评价提供了可靠工具。

研究人员所用主要关键技术方法如下：研究纳入来自BioImage Archive（S-EPMC9426742）及Zenodo的公开MIRI-Histo v1数据集，含1280张H&E染色心肌全切片图像（whole-slide images, WSIs；640例人源，640例动物模型即Sprague-Dawley大鼠与C57BL/6小鼠），覆盖抗氧化剂、β受体阻滞剂、钙通道阻滞剂及对照组，再灌注后6 h、24 h、72 h三个时间点。WSI经Otsu阈值法组织区域检测后以512×512像素滑动窗口（步长256）切分为约62,000个图像块（tile），剔除组织占比<40%者，按受试者水平8:1:1划分训练/验证/测试集并行5折交叉验证，严格防止数据泄漏。预处理采用Macenko算法进行H&E颜色归一化，训练集施以旋转、翻转、亮度及仿射变换扩增；采用Deep Convolutional GAN（DCGAN）/StyleGAN2-ADA仅对训练集生成合成样本（占比≤10%）以扩充数据。分类与比较涵盖八种架构：CNN（ResNet-50）、RNN、双向LSTM、自编码器（autoencoder）、变分自编码器（variational autoencoder, VAE）、图卷积网络（graph convolutional network, GCN）、Vision Transformer（ViT-Base/16）及仅供增强用的GAN；分割采用Transformer-UNet对照CNN-UNet。弱监督标签通过聚类约束注意力多示例学习（clustering-constrained attention multiple-instance learning, CLAM）生成伪感兴趣区（pseudo-region of interest, pseudo-ROI），人类样本辅以像素级强监督（三位≥10年资历心血管病理专家双盲复评，Cohen κ=0.92）。分类损失为多类交叉熵配合类别平衡加权及Focal loss（γ=2.0），分割损失为Dice＋二值交叉熵（binary cross-entropy, BCE；λ_Dice=0.7, λ_BCE=0.3）。模型用AdamW优化器及余弦退火调度训练，评价指标含准确率（accuracy）、精确率（precision）、召回率（recall）、F₁-score、AUC、Dice系数、交并比（intersection over union, IoU）及Cohen κ，外部独立数据集验证泛化性，Pearson相关与Bland-Altman分析检验AI-专家一致性。

Transformer Model Demonstrates Superior Overall Recognition Performance

研究人员对八种深度学习架构在相同数据划分下开展分类测试，结果表明Transformer模型在测试集上准确率达0.942（5折交叉验证均值0.920），AUC达0.982，F₁-score为0.958，混淆矩阵显示假阳性与假阴性率最低，综合识别能力显著优于CNN（测试集准确率0.908）、LSTM（0.895）、RNN（0.882）等其他架构。

Quantitative Performance Statistics

通过非参数自助法（n=1000）计算95%置信区间，Transformer在准确率、AUC、F₁-score、精确率及召回率五项指标上均居首位（5折CV准确率0.920 [0.912?0.928]，AUC 0.963 [0.956?0.970]），证实模型稳定性与泛化能力最优。

Quantitative Evaluation and Comparative Assessment of Classification Performance

雷达图聚合五维指标显示Transformer全面领先。虽GAN不作为主分类器但提供高质量合成H&E样本提升下游模型鲁棒性（Inception Score IS=2.81，结构相似性 structural similarity index measure, SSIM=0.936，专家盲法鉴别率47.3%接近随机），训练收敛快、推断延迟合理，具备临床部署可行性。

Segmentation Performance and Consistency Validation

采用Transformer-UNet分割坏死与凋亡区域，测试集Dice系数为坏死0.847（0.032）、凋亡0.821（0.036），IoU分别为0.740与0.696，均优于CNN-UNet；模型预测与专家标注的总体Cohen κ=0.86（95% CI 0.83?0.89），各时间点κ值随再灌注时间升高（6 h: 0.83；24 h: 0.86；72 h: 0.88），接近专家间一致性（κ=0.88），表明分割结果具高可信度。

Transformer Model Exhibits Stable Convergence and Strong Generalization During Training

训练与验证集损失持续下降且无过拟合迹象，准确率平稳上升，5次独立运行结果一致，证明ViT优化过程稳定且对心肌组织识别具良好泛化性。

Comparison of Structural and Functional Pathological Features Across Treatment Groups

应用Transformer自动量化各治疗组病理改变发现：抗氧化剂组坏死与凋亡区占比降幅最大、纤维化评分最低，炎症评分及氧化应激指数最小、毛细血管密度最高，显示最强结构保护与微血管维护作用；β受体阻滞剂组对凋亡抑制较明显；钙通道阻滞剂组有一定抗纤维化倾向；对照组损伤最重。

Discriminative Accuracy Performance of the Transformer Model in Myocardial Injury Images Across Multiple Intervention Groups

绘制四治疗组精度—召回（precision-recall, PR）曲线及受试者工作特征（receiver operating characteristic, ROC）曲线，抗氧化剂组平均精度（average precision, AP）=0.99、AUC=0.99表现最佳；对照组AUC=0.96次之；β受体阻滞剂组AUC=0.90；钙通道阻滞剂组AUC=0.83相对较低，反映后者组织形态异质性强、边界模糊增加识别难度。

Analysis of Multigroup Image Recognition Stability and Model Discriminative Power Based on Confidence Scores

以预测置信度热力图展示发现：对照组样本置信度高（红色集中）对应显著损伤；抗氧化剂组置信度低（蓝色集中）对应修复倾向；β受体阻滞剂与钙通道阻滞剂组呈中间过渡分布，证实模型可依治疗背景有效区分损伤严重程度且具有稳定分层能力。

Temporal Evolution of Myocardial Injury Under Different Treatment Strategies

在6 h、24 h、72 h三个再灌注时点量化坏死与凋亡斑块比例，抗氧化剂组坏死相关斑块比例从36.0%（6 h）降至14.1%（72 h），凋亡从26.0%降至13.0%；β受体阻滞剂与钙通道阻滞剂组中期有下降但72 h趋缓；对照组两项指标持续上升（坏死由45.0%升至51.3%）。Transformer可敏感捕获各干预下的时间依赖组织学演变。

Evaluation of the Discriminative Performance of Transformer Models Across Different Epochs

按时间点分别绘制ROC与PR曲线，72 h时AUC=0.98最优，24 h时AUC=0.97，6 h急性期AUC=0.91，表明模型在全时段尤其中晚期修复阶段具优异判别力。

Model Interpretability and Biological Consistency of Attention Maps

基于CLAM的弱监督注意力机制生成伪ROI热图，高权重红色区域与坏死带边缘及炎细胞浸润区空间重合，弱监督Transformer slide级分类AUC达0.947，说明注意力聚焦区域具明确生物学意义，模型具内在可解释性。

Model Validation and Consistency Analysis / Concordance Analysis Between Model Outputs and Expert Annotations

独立样本集上AI预测与两位资深病理专家手工测量的坏死、凋亡面积比Pearson相关系数r分别为0.93与0.89（均P＜.001），Bland-Altman均值差分别为0.002与0.003，95%一致性界限在±5%内无系统偏差；模型输出与专家评分线性相关性r=0.886（P=5.19×10^?21），确认Transformer量化结果可靠且与临床病理判读高度一致，外部BioImage Archive数据集时序轨迹复现相同趋势。

讨论与结论

研究人员指出传统MIRI病理评估主观低效，既往AI病理研究多局限于静态CNN分类而未整合多干预组与时相维度。本研究通过融合人源与经典啮齿动物MIRI切片（临床推论主要依据人源样本性能），借助Transformer全局注意力机制实现跨时间点组织学进展高精度识别，并以CLAM注意力图及专家一致性验证生物学合理性。GAN仅起适度辅助扩增作用。该框架可嵌入数字病理平台辅助阅片、支持药物筛选与疗效量化，热图及时序图亦可用于教学。局限性包公公开数据集未完全涵盖日常染色/扫描变异、未整合多组学或电生理等多模态信息、Transformer参数量大致推断资源需求较高。未来拟扩增多中心临床样本、融合多组学生物标志物、深化可解释AI因果探究及模型压缩以便边缘端部署，并可拓展至脑梗死、肝纤维化和肺损伤等其他组织损伤病理评估。结论：基于Transformer的人工智能框架对MIRI的H&E染色切片可实现准确、稳健及可解释的组织病理学评估，在分类、分割及动态治疗反应监测中均优于对照深度学习模型，为数字化心血管病理提供可扩展的高通量定量工具，并为精准医学中的标准化组织损伤评价奠定基础。

热点排行