
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于时间序列胚胎图像的人工智能模型预测第3天胚胎的囊胚形成与质量:一项多中心临床决策研究
【字体: 大 中 小 】 时间:2025年06月22日 来源:Computers in Biology and Medicine 7.0
编辑推荐:
为解决辅助生殖技术(ART)中胚胎第3天评估的临床决策难题,研究人员开发了基于时间序列图像和XGBoost算法的AI预测模型。该模型通过分析7111个胚胎的时序图像,实现了囊胚形成(ROC AUC 0.87)、优质囊胚(0.88)和低质囊胚+停滞胚胎(PR AUC 0.90)的精准预测,其设备无关性和SHAP可解释性为个体化胚胎选择提供了新工具。
在辅助生殖技术(ART)领域,胚胎培养至第5天囊胚阶段虽能提高妊娠率,但对高龄或胚胎数量有限的患者可能适得其反。日本作为全球ART应用最广泛的国家之一,其独特的社会环境(极少使用供卵)使得第3天胚胎评估尤为重要。然而现有预测方法存在三大瓶颈:静态形态学评估精度不足(ROC AUC仅0.78)、时间序列参数标注耗时且存在观察者差异、AI模型普遍存在"黑箱"问题且设备依赖性高。这些限制严重阻碍了胚胎特异性决策的临床应用。
京都大学医学院联合多家生殖中心开展了一项突破性研究,通过整合四种不同类型时差培养箱的7111个胚胎数据,构建了首个多中心兼容的AI预测系统。该成果发表于《Computers in Biology and Medicine》,创新性地将ImageNet预训练的NASNet-A Large网络与XGBoost梯度提升框架相结合,实现了从第3天胚胎图像到第5天囊胚质量的端到端预测。
研究方法包含三大核心技术:1) 基于17类形态学标签(包含Veeck分级1-3)的自动标注系统开发,使用四家医疗机构的23,852张胚胎图像进行微调;2) 多中心时间序列图像标准化处理,涵盖24-64小时受精后(hpi)的关键发育窗口;3) 整合年龄因素的XGBoost预测模型构建,通过SHAP值实现决策可视化。
AI自动标注系统性能
通过微调NASNet-A Large网络,建立的17类胚胎分类器达到95%的细胞阶段准确率。时差参数计算显示,囊胚形成组的2细胞阶段出现时间(t2)显著早于停滞胚胎组(24.8 vs 27.0 hpi),与既往研究一致。该系统成功克服了碎片化胚胎(Veeck 3级)的分类挑战,为后续预测提供了可靠特征。
囊胚形成预测模型
该模型选用88个特征,测试集ROC AUC达0.87。校准曲线显示预测概率与实际频率高度吻合,Brier评分0.15。特别值得注意的是,在62.75 hpi出现的5-7细胞阶段(1/2级)和8细胞阶段被识别为阳性预测因子,而异常的2细胞直接分裂则显示强负相关性。
优质囊胚预测模型
基于156个特征的模型取得0.88的ROC AUC,虽因优质囊胚占比低(28%)导致PR AUC相对较低,但其在35-39岁年龄组仍保持0.85以上的稳定性能,证实了模型的年龄适应性。
低质囊胚+停滞胚胎预测模型
这个临床最关键的模型仅用76个特征就实现PR AUC 0.90的卓越表现。当设定阳性预测值(PPV)为90%时,敏感性达60%;调整为80% PPV时敏感性提升至80%,为临床提供了灵活的决策阈值选择空间。
设备兼容性与时效性验证
对比实验证实,基于完整时间序列的模型(ROC AUC 0.87)显著优于单时间点图像模型(0.63-0.78)。在仅使用3张模拟日常观察的图像时,模型性能仍显著受限(p<1.0×10-5),凸显了连续观测的必要性。
这项研究开创性地解决了ART领域的三大临床痛点:通过高精度自动标注替代人工参数测量,利用多中心兼容架构打破设备限制,借助SHAP解释实现AI决策透明化。特别是对低质囊胚+停滞胚胎90%的阳性预测准确率,使临床医生能可靠识别不适合延长培养的胚胎,为高龄和预后不良患者制定更精准的个体化策略。
研究的局限性包括使用主观性较强的Gardner囊胚分级标准,以及排除了619个图像质量不佳的胚胎可能带来的选择偏倚。未来研究可通过前瞻性多中心试验进一步验证模型的临床效用,并探索整合精子质量、受精方式等更多临床变量。这项成果标志着ART领域向数据驱动、透明化的人工智能辅助决策迈出了关键一步,为优化胚胎培养策略、提高累积妊娠率提供了重要工具。
生物通微信公众号
知名企业招聘