基于常规二维超声的影像组学与深度学习融合模型预测窦卵泡计数和抗缪勒管激素:一项标准化卵巢储备评估的人工智能框架研究

《Scientific Reports》:Ultrasound radiomics and deep learning for predicting antral follicle count and anti-Müllerian hormone

【字体: 时间:2025年12月21日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对传统窦卵泡计数(AFC)评估存在观察者间变异性和抗缪勒管激素(AMH)检测局限性的临床难题,开发了一种基于常规二维超声的人工智能框架。研究通过整合影像组学和深度学习技术,建立了可预测AFC3D和AMH水平的融合模型(Rad-DL),在外部测试队列中分别达到R2=0.583和0.509的预测性能。该模型实现了69.1%的敏感性和84.6%的特异性识别高风险患者,为资源有限临床环境下的个性化卵巢刺激方案优化提供了有效工具。

  
在辅助生殖技术领域,准确评估卵巢储备功能是制定个性化治疗方案的关键前提。目前临床主要依赖窦卵泡计数(AFC)和抗缪勒管激素(AMH)检测两种方法,但都存在明显局限性:传统AFC评估依赖医师手动计数,存在较大的观察者间变异性;而AMH检测则缺乏国际标准化标准,且成本较高、耗时长。更令人困扰的是,三维超声自动计数技术虽能提高准确性,但设备昂贵,在资源有限的医疗机构难以普及。
面对这些挑战,重庆医科大学附属妇女儿童医院张晋玮团队联合深圳大学倪东团队开展了一项创新性研究,探索能否利用最常规的二维超声图像,通过人工智能技术实现卵巢储备功能的准确评估。他们的研究成果《Ultrasound radiomics and deep learning for predicting antral follicle count and anti-Müllerian hormone》近期发表在《Scientific Reports》期刊上,为这一领域提供了新的解决方案。
研究人员开发了一种融合影像组学和深度学习的人工智能框架,仅需常规二维超声图像即可预测AFC和AMH水平。这项多中心回顾性研究纳入了395名不孕症患者,分别来自医院的两个院区作为训练队列(210例)、内部测试队列(91例)和外部测试队列(94例)。研究建立了三种预测模型:基于674个IBSI标准影像组学特征的影像组学模型、基于ResNet50的深度学习模型,以及融合两种模态的混合模型。
研究的关键发现令人振奋:尽管静态二维图像显示的窦卵泡数量显著少于动态扫描,但两种方法间存在强相关性和一致性。更重要的是,融合模型在预测AFC3D方面表现出最优性能,内部测试和外部测试队列的R2分别达到0.743和0.583,显著优于单一模型。在更具挑战性的AMH预测任务中,融合模型同样展现出最佳泛化能力,外部测试R2为0.509。
影像组学特征提取与选择
研究从超声图像中提取了674个定量影像组学特征,经过稳定性筛选后,分别筛选出10个特征用于AFC3D定量预测、5个特征用于AMH水平预测、10个特征用于AFC3D序贯三分类预测。
定量预测模型的建立与评估
在AFC3D定量预测中,融合模型在内部测试和外部测试队列中均表现稳定。对于AMH水平预测,尽管所有模型性能均低于AFC预测任务,但融合模型仍保持了相对较好的泛化能力。
序贯三分类预测模型性能
研究根据AFC值将患者分为低反应(AFC3D≤5)、正常反应(6≤AFC3D≤19)和高反应(AFC3D≥20)三组。随机森林 classifier显示最佳性能,融合模型在识别高风险患者方面AUC达到0.881,较单一模型提升8.0%。
深度学习模型的可解释性
通过Grad-CAM技术可视化显示,算法在窦卵泡的无回声区域激活最为明显,证明这些区域对深度学习模型具有最高预测价值。
研究的讨论部分深入分析了不同模型的性能差异。影像组学模型在定量预测AFC3D方面表现出比深度学习模型更强的鲁棒性,特别是在外部测试队列中。这种差异部分归因于外部超声图像分辨率较低对深度学习性能的不利影响。融合模型通过整合手工设计的影像组学特征和自动学习的深度特征,在复杂任务如AMH预测中展现出明显优势。
值得注意的是,所有模型在AMH预测任务中的表现均不如AFC预测,这主要是因为AMH在超声图像中缺乏直接可视化对应物,必须通过AFC等形态学代理指标间接推断,增加了任务复杂性。此外,定量回归问题因对噪声敏感且需要预测连续值,比分类任务更容易过拟合。
在临床应用中,研究提出的序贯三分类模型为识别卵巢高反应或低反应风险患者提供了实用解决方案。当因子宫高位、肠气干扰、肥胖或病理病变等因素使AFC评估困难时,该模型能显著减少超声医师的工作量和图像采集时间。由于分析不需要检查设备具备额外计算能力,可在云端集中处理,这一特点使该技术特别适合缺乏高端超声设备、操作者经验有限或流程标准化较弱的临床环境。
研究人员也坦诚指出了研究的局限性:外部测试队列图像分辨率因采集卡差异而受损;操作者选择显示最多窦卵泡的静态图像时存在主观性;仅纳入月经周期规律患者,不适用于多囊卵巢综合征患者;样本量相对有限。未来研究将探索深度学习超分辨率重建技术增强图像质量,并扩大样本量和参与中心数量。
该研究的最终目标是阐明超声影像特征与生育治疗结局间的相关性,包括精准促性腺激素给药策略、成熟(M2)卵母细胞获取率、囊胚形成率以及临床妊娠率。当前研究重点是在考虑刺激方案等混杂因素前,验证新方法相对于传统AFC的有效性,证明其在预测结局方面可与传统AFC相媲美。
这项研究的意义在于,它首次成功将影像组学与深度学习技术融合应用于常规二维超声图像的卵巢储备功能评估,建立了一个标准化、可推广的人工智能框架。不仅为卵巢储备评估提供了更加客观、准确的方法,更重要的是使资源有限地区也能获得高质量的生育评估服务,有望在辅助生殖领域实现更加公平的医疗资源分配。随着技术的进一步优化和验证,这一方法有望成为临床实践中卵巢储备评估的新标准,为个性化不孕症治疗开辟新的可能性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号