自动化心电图解读的临床修正模式:一项基于15万例ECG的真实世界研究
《European Heart Journal - Digital Health》:Factors associated with physician modifications to automated ECG interpretations
【字体:
大
中
小
】
时间:2025年11月09日
来源:European Heart Journal - Digital Health 4.4
编辑推荐:
【编辑推荐】为解决自动化心电图(ECG)解读系统在真实临床场景中的准确性不足问题,研究人员开展了一项针对15.9万例ECG的回顾性研究。结果发现31.3%的自动化报告需医师修正,QT间期延长(新添加5.6%)和心室起搏器(新添加3.6%)最常被补充,而下壁梗死(删除率32.0%)等术语常被删除。该研究揭示了规则型ECG算法的局限性,为AI心电图诊断系统的优化提供了关键依据。
在当今心血管疾病诊疗中,心电图(ECG)已成为最常规的检查手段之一。全球每年记录数百万份ECG,其中绝大多数通过算法自动分析生成实时初步解读,旨在辅助临床决策、优化工作流程并减少人为误差。尽管商用自动化ECG解读系统已广泛投入使用,但这些系统远未达到完美境界。既往研究指出,它们对复杂ECG特征的误判、对标准化模式的过度依赖以及对多样化患者群体的适应性不足,可能导致错误的临床决策、不必要的检查或漏诊危重病情,最终影响患者安全及医疗资源利用。
值得注意的是,尽管临床实践高度依赖自动化ECG解读,但我们对算法与专家修正之间真实互动的理解仍十分有限。现有研究多聚焦于算法在受控条件下的准确性验证,缺乏对真实临床场景的系统评估。此外,以往研究多局限于特定诊断亚组或有限人群,难以全面反映多样化的临床实践。随着自动化ECG解读日益融入日常诊疗,迫切需要对医师修正的模式和频率进行系统性分析——这不仅有助于改进算法性能,对高危场景下的及时准确诊断更具重大意义。
为此,由Cedars-Sinai医疗中心I-Min Chiu与Yuki Sahashi等学者领衔的研究团队,在《European Heart Journal - Digital Health》发表了题为“Factors associated with physician modifications to automated ECG interpretations”的原创研究。该研究回顾性分析了2011-2023年间159,630例12导联ECG,比较GE Marquette? 12SL分析程序生成的自动化初步报告与医师最终报告之间的差异。研究将文本差异定义为“修正”,并通过对69个预定义ECG术语的分类统计,深入探索了修正发生的规律及其临床关联。
研究方法的核心在于大规模数据比对与术语级分析。研究人员从Cedars-Sinai医疗中心获取所有静息12导联ECG记录,排除未经过医师审核的报告,并对解读量异常高的医师进行随机抽样(最终纳入8位医师的各1万例ECG)。通过对比自动化报告与医师最终报告的文本,识别出69个关键ECG术语,并计算每个术语在修正前后的出现频率、新增比率(术语原不存在而被医师添加的比例)及删除比率(术语原存在而被医师移除的比例)。统计分析采用Python 3.10.12与R 4.2.2完成,重点考察了修正行为与采集时间、患者生理参数、医师经验等因素的关联。
研究结果揭示,31.3%的ECG报告经历了医师修正。修正更常见于非工作时间采集的ECG(54% vs. 52%)、心室率较高(86±28 b.p.m. vs. 80±21 b.p.m.)及QRS时限较长(103±33 ms vs. 97±25 ms)的患者。随时间推移,修正率显著下降(2011-2012年42.2% → 2023年18.4%),提示ECG分析算法的持续改进。
术语层面,医师最常新增的诊断为“QT间期延长”(2565例新增)、“心室起搏器心律”(1826例新增)和“窦性心律”(1619例新增);最常删除的术语为“下壁梗死”(1925例删除)、“前壁梗死”(1371例删除)及“窦性心律”(1245例删除)。值得注意的是,“窦性心律”同时位列新增与删除前三名,反映医师对心律判断的精细化调整。某些特定术语如“疑似起搏器功能异常”在自动化报告中出现时,高达90.3%被医师删除;“WPW预激模式”的删除率也达84.6%。
按术语类别分析显示,“心电图测量/模式”类术语新增比率最高(1.1%),而“起搏器相关”类术语的删除比率显著高于其他类别(58.2%)。“缺血相关”术语的删除比率达39.4%,凸显算法在此领域的过度诊断倾向。医师经验也影响修正行为,高年资医师(>36年)修正率(28.4%)显著高于低年资者(24.7%),暗示临床经验促发更严格的算法审阅。
讨论部分指出,本研究首次大规模揭示了临床医师与自动化ECG解读系统的真实互动模式。修正行为不仅纠正错误,更体现医师对算法输出的主动重构——删除模糊术语(如“不确定心律”)、补充关键诊断(如QT间期延长),这种选择性编辑深植于临床语境与患者个体特征。规则型系统的局限性在起搏器心律分析、心肌缺血判断等复杂场景中尤为突出,而深度学习(Deep Learning)模型近年已展现出超越传统算法的潜力,如在心律失常分类、结构性心脏病检测乃至隐匿性生物标志物推断方面的卓越表现。
研究结论强调,医师对自动化ECG报告的修正反映了其整合临床语境与波形细微特征的诊断智慧。明确的修正模式为改进算法提供了路线图:未来人工智能(AI)模型需从静态规则转向语境感知,重点提升对QT间期测量、起搏器心律识别等薄弱环节的准确性。随着深度学习技术不断验证于多样化临床环境,其有望显著降低医师解读负担,推动ECG诊断从自动化向智能化演进。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号