《Ultrasound in Medicine & Biology》:Clinical Application of an AI-Driven Framework for Accurate Endometrial Thickness Measurement in Transvaginal Ultrasound
编辑推荐:
AI框架实现经阴道超声子宫内膜厚度自动测量,内部验证MAE 1.05mm,外部验证AI-D1组MAE 0.89mm,临床可接受性74.85%,测量速度提升30倍。
吴一斌|倪琼英|陈炯权|徐金辉|李秉汉|林浩天|何穗|姜灿明|何炯军|康海芳|卢明|倪东|杨欣|蔡向然
中国广州济南大学第一附属医院医学影像科
摘要
目的
本研究旨在基于大规模数据集,开发一个基于人工智能的框架,用于自动测量经阴道超声(TVUS)中的子宫内膜厚度(ET),并从多个临床角度评估其性能。
方法
回顾性地纳入了来自深圳光明区人民医院(2019–2023年)的9850张超声图像,用于训练和内部验证。外部验证则前瞻性地收集了300例的356张图像。所有图像均由三位经验水平不同的超声技师(D1-D2-D3,高级-中级-专家)进行采集和标注。该框架包括一个子宫体分割模型、一个子宫内膜分割模型以及一个用于测量ET的最大内切圆搜索算法。模型性能通过平均绝对误差(MAE)、组内相关系数(ICC)和测量值在±2毫米误差范围内的百分比来评估。同时 also 评估了临床可接受度。
结果
在内部验证中,模型的MAE为1.05,测量值在±2毫米范围内的比例为87.40%。外部验证中,AI-D1组的MAE为0.89,AI-D2组的MAE为1.01。AI-D1组的ICC和测量值在±2毫米范围内的百分比分别为0.90和90.18%。AI测量的临床可接受度为74.85%,低于D1组(87.37%),但略高于D2组(72.50%)。该模型完成测量所需时间为0.2秒,比经验较少的人类超声技师快30倍。
引言
子宫内膜覆盖子宫壁,由基底层和功能层组成,在月经周期中会发生周期性变化。其支持正常着床的能力(称为受容性)对健康妊娠至关重要[1]。在影响子宫内膜受容性的各种因素中,子宫内膜厚度(ET)是最关键的,也是研究最多的[2,3]。研究表明,超出一定范围的厚度可能会降低着床率并减少怀孕的机会[4,5]。除了与子宫内膜受容性的潜在关联外,异常的ET还可能指示妇科疾病,包括子宫内膜癌,这是影响女性的五大癌症之一[[6], [7], [8]]。总之,准确快速的子宫内膜厚度测量不仅有助于子宫内膜受容性的研究,也对临床诊断和治疗计划至关重要。
与经腹部超声相比,经阴道超声(TVUS)能更好地显示子宫的细微结构和特征。由于其无创、实时且成本效益高的特点,TVUS已成为评估ET的主要工具[9]。根据超声表现,子宫内膜可以分为三种回声模式:(i) 三线模式,中间有一条高回声线,两侧为低回声层;(ii) 中等回声模式,与周围肌层具有相同的反射率,中央高回声线不明显;(iii) 均匀的高回声子宫内膜[10]。如图1所示,在临床实践中,超声技师根据回声模式主观定义子宫内膜边界,然后在子宫的中矢状面上确定两个边界点。当连接这两个点的线垂直于子宫腔线且两点之间的距离最大时,该距离被记录为子宫内膜厚度。然而,这种方法耗时且劳动强度大[11]。此外,由于子宫内膜的复杂性和与周围组织的对比度低,还存在观察者间差异性和可重复性差的问题。
随着技术的进步,深度学习算法已成为超声成像中自动定位、分类和分割的主要方法。近期研究分析了人工智能(AI)在子宫内膜识别中的应用。例如,胡等人[12]提出了一个两步框架,将基于深度学习的语义分割与最大内切圆(MITC)方法结合用于测量ET。朴等人[13]提出了一个关键点检测器以实现可靠的子宫内膜分割。在胡的工作[12]基础上,刘等人[14]进一步优化了分割算法,并在正常和病理超声图像上验证了其鲁棒性。此外,还引入了一个深度双分辨率网络来提高子宫内膜分割性能[15]。这些努力推动了ET测量的自动化。然而,以往研究中使用的数据集有限,不仅限制了模型的性能,也限制了对其的评估视角。
基于上述发现,本研究旨在开发一个先进的基于深度学习的框架,以实现快速精确的子宫内膜厚度自动测量。该框架使用包含近5400例临床病例的大规模观察数据集进行开发和评估。此外,本研究还从子宫内膜回声模式和厚度范围等角度详细分析了模型的性能。
研究设计
本研究采用了回顾性和前瞻性观察相结合的设计(图2)。共纳入了2019至2023年间在深圳光明区人民医院接受TVUS检查的5650名女性患者的资料,2024年还将前瞻性地纳入同医院的300例病例。所有参与者的数据隐私得到严格保护,数据不对外公开。常规临床信息包括年龄、BMI和种族等。
内部评估中的分割和测量性能
我们首先定量分析了所提出的子宫内膜分割模型在内部测试集上的性能。如表2所示,模型的DSC、JI、精确度、特异性和敏感性得分分别为0.85 ± 0.09、74.1 ± 12.6%、83.5 ± 13.3%、98.4 ± 1.4%和88.1 ± 11.4%,其中±表示受试者间的标准差。模型的分割性能在A型、B型和C型子宫内膜上呈现下降趋势。
讨论
作为盆腔超声的一种形式,TVUS广泛用于检查女性生殖器官,包括子宫、宫颈和子宫内膜[24]。在评估子宫内膜时,TVUS图像为妇科医生提供了有价值的信息。常见的超声指标包括ET、形态和血流,其中ET是最常用的指标[[2], [3]]。例如,妇科医生可以通过综合评估子宫内膜来诊断不孕或其他子宫病变。
结论
总之,本研究开发的基于AI的框架在自动测量子宫内膜厚度方面展现出强大的潜力。该模型在分割和厚度测量方面均取得了高精度,性能可与经验丰富的临床医生相媲美。此外,它还显著提高了效率,测量速度比经验较少的医生快30倍。通过外部验证确认了该框架的临床可接受性。
数据可用性声明
有兴趣访问数据的研究人员可以联系通讯作者申请授权。授权需符合组织的数据保护政策和法律要求。
利益冲突
作者声明没有利益冲突。
致谢
我们感谢我们机构的所有患者和工作人员对这项工作的贡献。本工作得到了国家自然科学基金(编号:62171290、62101343、12326619)、广西壮族自治区科技计划(编号:2024AB17023)以及深港联合研究计划(编号:SGDX20201103095613036)的资助。