编辑推荐:
胎儿生长状况关乎围产期结局,准确产前体重评估意义重大。研究人员开展 “超声产前胎儿体重评估:AI 与不同经验超声医师准确性比较” 研究。结果显示 AI 准确性欠佳,专家评估仍是金标准。这为产前超声诊断提供参考。
在妇产科领域,准确评估胎儿体重一直是一项重要且颇具挑战的任务。胎儿体重不仅反映其在子宫内的健康状况,更是预测围产期各种风险的关键指标。胎儿生长受限(FGR)或过度生长(大于胎龄儿,LGA),都与心血管、代谢等多方面的风险紧密相连。例如,胎儿生长受限可能预示着胎儿在子宫内发育不良,面临营养供应不足等问题;而过度生长则可能导致分娩困难,增加母婴并发症的发生几率 。
目前,超声检查是估算胎儿体重的常用方法,其中 Hadlock 公式通过综合测量胎儿的头围、腹围和股骨长度来计算体重。然而,实际操作中,这一方法却受到诸多因素的干扰。像是孕妇的体重指数(BMI)、胎儿在子宫内的位置、羊水量的多少,甚至超声检查者的经验水平,都会影响测量的准确性,进而降低估算体重的可靠性 。
随着科技的飞速发展,人工智能(AI)在医疗领域展现出巨大的潜力。在胎儿体重评估方面,AI 有望凭借其强大的数据处理和分析能力,克服传统超声检查的一些局限性,提高评估的客观性和精准度,减少人为误差。基于此,来自德国的研究人员开展了一项前瞻性队列研究,旨在探究 AI 辅助超声评估足月胎儿体重的准确性,并与不同经验水平的临床超声医师的评估结果进行对比 。该研究成果发表在《Archives of Gynecology and Obstetrics》上,为产前超声诊断领域带来了新的思考和方向 。
研究人员在德国的一家三级产前中心开展研究,招募了 2024 年 5 月 1 日至 12 月 31 日期间,计划近期进行择期剖宫产的单胎或双胎孕妇。研究的主要技术方法如下:
- 数据采集:对每位胎儿,由具有德国医学超声学会(DEGUM)一级资质的住院医师、二级资质的高级医师和 AI 算法分别独立进行产前胎儿体重估算,且估算时检查者对孕周等信息不知情,以减少偏差。使用 GE Voluson E22 系统及集成的 AI 辅助软件采集数据,测量参数包括头围、腹围和股骨长度,测量遵循 INTERGROWTH - 21st Project 标准 。
- 统计分析:运用 Stata?(ver. 18)软件进行统计分析。通过配对 t 检验研究三组估算值与实际出生体重的差异;以出生体重的 10% 以内波动为准确,利用受试者工作特征(ROC)曲线评估两组(住院医师组和 AI 组)与高级医师组相比的诊断准确性;采用单因素逻辑回归检验准确性与潜在影响因素的关联;进行敏感性分析,即根据检查与分娩间隔天数,每天增加 25 克来调整估算体重 。
研究结果如下:
- 研究对象基本信息:共纳入 300 例胎儿,平均孕周 38.7±1.1 周,分娩前中位数 2(2 - 4)天进行检查。胎儿头位 234 例(78%),双胎 34 例(11.3%),女婴 137 例(45.7%)。孕妇年龄 34.9±5.2 岁,孕前 BMI 为 25.4±5.7,平均出生体重 3264.6±530.7g 。
- 胎儿体重估算情况:住院医师组(group 1)、高级医师组(group 2)和 AI 组(group 3)估算的胎儿平均体重分别为 3061±506.8g、3132.4±534.8g 和 2921.9±713.4g。三组均低估胎儿体重,与出生体重的差值分别为 - 203.6±325.4g、-132.2±294.1g 和 - 338.4±606.2g 。
- 估算准确性:估算体重准确率方面,group 1 为 62%(56.2%,67.5%),group 2 为 70%(64.5%,75.1%),group 3 为 48.3%(42.6%,54.1%)。与 group 2 相比,group 1 和 group 3 的诊断准确性指标如下:敏感性分别为 55.7%(48.7%,62.5%)和 68.6%(61.8%,74.8%);特异性分别为 68.9%(58.3%,78.2%)和 53.3%(42.5%,63.9%);ROC 曲线下面积分别为 0.62(0.56,0.68)和 0.61(0.55,0.67) 。
- 影响因素分析:经单因素逻辑回归分析,孕周、胎儿头位、孕妇年龄、是否双胎、BMI、胎盘位置、新生儿性别、妊娠期糖尿病和羊水指数等因素,均与超声体重估算准确性的优势比无关联 。
- 敏感性分析结果:敏感性分析调整后,各组准确率有所上升,group 1 为 68%(62.4%,73.2%),group 2 为 75%(69.7%,79.8%),group 3 为 51.3%(45.5%,57.1%);与出生体重的平均差值也发生改变,分别为 - 136.1±321.8g、-64.7±291.2g 和 - 270.7±605.2g 。排除双胎观察数据后的事后敏感性分析结果与主要分析结果无显著差异 。
研究结论和讨论:
本次研究表明,产前胎儿体重估算的准确性与超声检查操作者密切相关。经验丰富的高级医师组低估程度最小,准确性最高,再次证实了高级别资质专家的评估在当前仍是产前胎儿体重评估的金标准 。即便考虑了胎儿每日体重增长进行调整,这一 “金标准” 的准确率仍低于 80%,说明产前胎儿体重评估的准确性还有提升空间 。
而 AI 辅助方法在此次研究中表现出较大的变异性,其准确性明显低于经验丰富的专家。这可能是由于足月胎儿在超声检查时,受胎儿体位、颅骨正常缝线干扰等因素影响,图像辨识度降低;同时,研究中使用的 AI 模型在识别生物测量参数时存在困难,导致体重估算不准确 。不过,AI 技术仍具有巨大的发展潜力。通过深度学习算法,尤其是卷积神经网络,有望提高超声图像分析的准确性,更精准地识别胎儿组织和器官,减少图像伪影的影响,进而提升胎儿体重估算的可靠性 。但在 AI 技术广泛应用于临床之前,还需要进行大量的优化和验证工作,确保其安全性和有效性 。
此外,研究发现诸多潜在影响因素与体重估算精度并无关联,而敏感性分析强调了考虑超声检查与分娩间隔时间对提高测量准确性的重要性。准确的胎儿体重评估对于优化分娩管理策略、降低分娩风险、保障母婴安全至关重要。未来,在提高超声检查准确性的道路上,需要进一步加强对超声医师的专业培训,提升其临床经验和判断能力;同时,加大对 AI 技术在产前超声诊断领域的研发投入,推动 AI 技术的不断完善,为产前诊断提供更可靠的工具,最终改善围产期结局 。