基于临床文本与患者特异性信息的12导联心电图生成模型DiffuSETS:推动AI辅助心血管疾病诊断的新突破

【字体: 时间:2025年06月12日 来源:Patterns 6.7

编辑推荐:

  本文提出DiffuSETS模型,通过结合临床文本报告(clinical text reports)和患者特异性信息(如心率、年龄、性别),生成高保真12导联心电图(ECG),解决了高质量标注ECG数据稀缺的难题。研究构建三级评估框架(信号/特征/诊断水平),验证模型在增强AI自动诊断、医学教育及知识发现中的潜力,为心血管疾病研究提供创新工具。

  

引言

心血管疾病占全球死亡原因的三分之一,心电图(ECG)作为非侵入性诊断工具面临数据稀缺与隐私限制。现有ECG生成模型依赖小规模数据集或单一标签,缺乏多模态条件输入和系统评估。DiffuSETS首次整合临床文本与患者信息(如心率、年龄),基于MIMIC-IV-ECG数据集(794,372条记录)和扩散模型(DDPM),实现高语义对齐的ECG生成。

模型架构与创新

DiffuSETS采用三阶段架构:

  1. 信号-潜空间转换:变分自编码器(VAE)压缩12导联ECG信号至潜空间。
  2. 条件嵌入:大型语言模型(LLM)提取临床文本语义,与患者信息(如"男性,96岁,心率79 bpm")融合为条件向量。
  3. 去噪生成:U-Net噪声预测器通过跨注意力机制整合条件,生成符合输入的ECG。
    关键创新在于设计有序提示(ordered prompts)处理多文本报告,例如"首要诊断:心房颤动"与"补充条件:左心室肥大",提升语义精度。

三级评估验证性能

  1. 信号水平:Fréchet起始距离(FID)23.6(内部数据集),波形相似性F1分数0.894,优于基线模型WaveGAN和SSSD-ECG。
  2. 特征水平:生成ECG的心率与输入误差仅4.15 bpm(MAE),显著优于无患者信息的对照组(12.25 bpm)。
  3. 诊断水平:CLIP分数0.812,证明模型捕捉到"窦性心动过速"等文本描述的波形特征。

临床与教育应用

  1. 数据增强:在房颤(AF)分类任务中,DiffuSETS生成数据使模型F1分数从0.21提升至0.83,解决15:1的数据不平衡问题。
  2. 复杂病例生成:输入"心房颤动伴室性早搏(PVC)、左前分支阻滞"等文本,生成ECG呈现RR间期不规则、宽大畸形QRS波等典型特征(图4A)。
  3. 罕见病模拟:联合LLM生成Brugada综合征ECG,显示右束支阻滞和ST段抬高,与文献记载一致。

医学发现潜力

模型揭示非心脏疾病与ECG的潜在关联:

  • 高钾血症:输入"患者血钾升高",生成ECG呈现特征性T波高尖(图4D)。
  • 心脏年龄:生成ECG的心年龄与实际年龄相关系数r=0.594(p<0.001),提示模型捕获衰老相关电生理变化。

局限与展望

当前模型未实现个性化ECG生成(如患者特异性波形),未来可结合数字孪生技术。代码已开源(GitHub/PKUDigitalHealth),数据集来自PhysioNet的MIMIC-IV-ECG和PTB-XL。

结论

DiffuSETS通过多模态条件生成和严谨评估,推动ECG生成从数据补充迈向医学知识挖掘,为AI辅助心血管诊疗开辟新路径。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号