
-
生物通官微
陪你抓住生命科技
跳动的脉搏
GPT-4o模型在心电图图像解读中的诊断效能研究:基于多模态人工智能的心脏病辅助诊断新策略
【字体: 大 中 小 】 时间:2025年08月25日 来源:JMIR AI 2
编辑推荐:
本研究针对传统深度学习模型在心电图(ECG)分析中开发复杂、成本高的问题,探索了多模态大语言模型GPT-4o在12导联ECG图像解读中的应用。通过零样本和少样本学习方法,证实GPT-4o能100%识别ECG图像,区分正常/异常ECG准确率达83%(95% CI 81.8%-84.6%),虽特定病理分类准确率仅41%,但为临床ECG初筛提供了可及性AI解决方案。
心脏疾病是全球主要健康威胁,而心电图(ECG)作为最常用的心脏筛查工具,其准确解读对早期诊断至关重要。尽管深度学习(DL)模型在ECG分析中展现出卓越性能,但这些专业模型需要大量标注数据和特定任务训练,开发成本高昂。与此同时,以GPT-4o为代表的多模态大语言模型(LLM)在医学图像理解领域崭露头角,但其在ECG分析中的潜力尚未充分探索。来自以色列Sheba医学中心的研究团队在《JMIR AI》发表的研究,首次系统评估了GPT-4o解读ECG图像的能力,为开发低门槛的心脏病AI辅助工具提供了新思路。
研究采用80例12导联ECG图像(30例正常,50例异常含ST段抬高型心肌梗死[STEMI]、心房颤动[AF]等5类病变),通过OpenAI API测试GPT-4o在三种场景下的表现:ECG图像识别、正常/异常二分类和六类病理分类。关键技术包括:1)零样本与少样本学习策略对比;2)三种提示工程方法(基础提示、带类别描述的提示、含视觉特征指导的详细提示);3)使用复合图像整合训练样本;4)以专家判读为金标准,计算准确率、敏感性等指标;5)增设ViT和Gemini 2.0 Flash模型作为敏感性分析对照。
场景1:ECG图像识别
GPT-4o展现出完美的图像识别能力,在"是否为ECG"的基础判断任务中达到100%准确率,证实其处理医学图像的底层能力。
场景2:正常与异常ECG分类
零样本学习准确率随提示优化从53%提升至63%,但特异性始终偏低(最高仅33%)。少样本学习显著改善性能:提供10个训练样本并附加文本指导后,模型平均准确率达83%(95% CI 81.8%-84.6%),特异性跃升至97%,表明少量典型样本能有效引导模型关注关键波形特征。
场景3:特定病理分类
模型表现明显受限,少样本学习最佳准确率仅41%。值得注意的是,正常ECG识别准确率达89%,而起搏心律以55.5%的准确率成为最易识别的异常类型,反映模型对显著电生理改变的敏感性。
敏感性分析
GPT-4o在对比测试中稳定优于ViT和Gemini 2.0 Flash,凸显其在医学图像领域的优势。
这项开创性研究揭示,GPT-4o无需专门训练即可实现ECG图像的高效初筛,其83%的二分类准确率与高特异性(97%)使其适合作为临床分诊工具。尽管在具体病理诊断上仍有局限(41%准确率),但模型展现的少样本学习能力(仅需10个示例提升30%性能)为资源有限场景提供了可行方案。研究者特别指出,GPT-4o的"推理解释"能准确描述RR间期、P波等关键特征,这种可解释性在医疗AI中弥足珍贵。
该研究的临床意义在于:1)证实通用多模态AI可突破专业模型开发壁垒;2)为急诊室快速ECG评估提供自动化方案;3)推动"AI辅助心电图分诊"概念落地。未来通过整合临床资料、优化提示工程,GPT-4o有望成为心脏病诊断链条中的重要一环,特别是在医疗资源匮乏地区。正如作者Haya Engelstein团队强调的,这项技术并非取代医生,而是作为"临床决策支持系统",帮助更高效地识别需要优先处理的心脏异常。
生物通微信公众号
知名企业招聘