利用基于人工智能的软件辅助识别与胎儿先天性心脏病相关的超声检查结果

《Obstetrics & Gynecology》:Use of Artificial Intelligence–Based Software to Aid in the Identification of Ultrasound Findings Associated With Fetal Congenital Heart Defects

【字体: 时间:2025年10月17日 来源:Obstetrics & Gynecology 4.7

编辑推荐:

  人工智能辅助超声在孕中期先天性心脏病筛查中的应用显示显著提升诊断准确率、减少解读时间并提高临床置信度。

  这项研究探讨了人工智能(AI)辅助软件在胎儿超声检查中对识别先天性心脏病(CHD)可疑表现的效果。研究的主要目标是评估AI辅助是否能提高妇产科医生和母胎医学专家在第二孕期识别CHD可疑超声征象的能力。研究设计采用了多读者、多案例的模式,通过对比AI辅助与未辅助的阅读条件,评估了医生在识别这些征象时的准确率、敏感度、特异度以及阅读时间和信心水平。

研究数据来自11个中心,共收集了200例胎儿超声检查,其中100例包含至少一个CHD可疑表现,另外100例则没有可疑表现。所有检查均在18至24周的单胎妊娠中进行,且患者年龄均在18岁以上。检查中仅包含可解释的二维灰度动态影像(cine clips)和标准的四腔心、左心室流出道、右心室流出道视图。为了确保数据的代表性,研究还纳入了胎儿超声心动图,以增加严重CHD案例的数量。

研究参与者包括7名妇产科医生和7名母胎医学专家。每位医生在随机顺序下独立地对所有检查进行了两次评估:一次是AI辅助阅读,另一次是未辅助阅读。评估内容包括每个可疑表现的存在与否,以及对每个发现的置信度评分。研究中使用的指标包括面积下曲线下面积(AUROC)、敏感度和特异度,同时记录了阅读时间和置信度水平。所有数据均采用95%置信区间(CI)进行统计分析,并通过Dorfman–Berbaum–Metz方法(经Hillis等人更新)评估AI辅助与未辅助条件下的差异。

研究结果显示,AI辅助显著提高了医生识别任何可疑表现的能力。AI辅助阅读的AUROC为0.974(95% CI,0.957–0.990),而未辅助阅读的AUROC为0.825(95% CI,0.741–0.908),差异显著(+0.149,95% CI,0.066–0.232,P=0.002)。AI辅助阅读的敏感度为0.935(95% CI,0.892–0.978),而未辅助阅读的敏感度为0.782(95% CI,0.686–0.878),差异为+0.153(95% CI,0.052–0.254,P=0.005)。特异度方面,AI辅助阅读为0.970(95% CI,0.949–0.991),未辅助阅读为0.759(95% CI,0.630–0.887),差异为+0.211(95% CI,0.083–0.339,P=0.003)。此外,AI辅助显著减少了医生的阅读时间,平均为226秒(95% CI,218–234),而未辅助阅读时间为274秒(95% CI,265–283),差异为-48秒(95% CI,40–56,P<0.001)。同时,AI辅助还显著提高了医生的置信度评分,平均为4.63(95% CI,4.60–4.66),而未辅助阅读的平均置信度评分为3.90(95% CI,3.85–3.95),差异为+0.73(95% CI,0.68–0.78,P<0.001)。

进一步的子群分析表明,AI辅助在不同患者体重指数(BMI)、图像质量、孕周以及超声设备制造商的情况下均表现出更高的AUROC。此外,对于不同经验水平的医生,AI辅助在提升检测能力和置信度方面也显示出一致性。例如,对于经验较少的医生(0–3年经验),AI辅助的AUROC为0.977(95% CI,0.961–0.994),而未辅助阅读的AUROC为0.803(95% CI,0.619–0.987)。对于经验较丰富的医生(8年以上经验),AI辅助的AUROC为0.970(95% CI,0.949–0.992),而未辅助阅读的AUROC为0.850(95% CI,0.708–0.991)。尽管如此,对于母胎医学专家而言,AI辅助对AUROC的提升并不显著,而对妇产科医生则有明显改善。

研究还发现,AI辅助在识别个别可疑表现时也表现出显著优势。例如,在识别右心室与左心室大小差异时,AI辅助的敏感度比未辅助阅读高0.408(95% CI,0.268–0.547),而在识别扩大的心胸比(CTR)时,AI辅助的敏感度提高了0.235(95% CI,0.131–0.339)。此外,AI辅助在识别异常的流出道关系时,特异度提高了0.086(95% CI,0.020–0.151)。这些结果表明,AI辅助在提高检测能力方面具有普遍适用性,尤其是在图像质量较低或患者BMI较高的情况下。

值得注意的是,研究中提到的AI辅助软件能够分析二维灰度超声动态影像,而不需要依赖复杂的四维成像技术。这使得AI辅助软件在临床实践中更具可行性,尤其是在资源有限的地区。相比之下,一些早期的AI应用如FINE方法,虽然在检测CHD方面表现出色,但需要四维超声数据,这在实际操作中可能带来一定的限制。本研究中的AI软件通过常规的二维超声检查即可实现高效的识别,这为其在广泛临床环境中的应用提供了支持。

此外,研究还强调了AI辅助对医生置信度的影响。在AI辅助条件下,医生对异常表现的平均置信度评分明显高于未辅助条件下的评分。例如,对于异常流出道关系的识别,AI辅助下的平均置信度评分为4.41(95% CI,4.37–4.44),而未辅助阅读下的平均评分为3.66(95% CI,3.61–3.71)。这表明,AI辅助不仅提高了检测的准确性,还增强了医生对结果的把握程度,有助于减少误诊和漏诊的风险。

然而,研究也指出了其局限性。首先,数据是回顾性收集的,这可能影响结果的实时性和适用性。其次,研究中约50%的检查为异常,这一比例远高于一般人群中的CHD发生率(约1%),因此可能无法完全反映实际临床环境中的情况。此外,虽然研究纳入了胎儿超声心动图,但这些检查在实际临床中并不常见,因此其代表性可能有限。最后,由于大多数检查的图像质量较高(84%的检查图像质量评分高于3),研究结果可能无法推广到图像质量较低的临床场景。

总体而言,这项研究为AI辅助软件在胎儿超声检查中的应用提供了有力的证据。结果显示,AI辅助能够显著提高医生在识别CHD可疑表现方面的准确率、敏感度和特异度,同时减少阅读时间和提升置信度。这些发现对于改善胎儿超声检查的效率和质量具有重要意义,尤其是在资源有限或缺乏专业培训的环境中。然而,进一步的研究需要在更广泛的临床实践中进行,以验证这些结果的普遍适用性,并探索AI辅助在不同医疗条件下的潜在价值。未来的研究还应关注AI辅助软件在不同类型的超声检查中的表现,以及其在提高全球范围内CHD检测率方面的作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号