FedEmbryo:基于联邦任务自适应学习的个性化IVF胚胎选择系统突破数据隐私壁垒

《Communications Medicine》:Federated task-adaptive learning for personalized selection of human IVF-derived embryos

【字体: 时间:2025年11月19日 来源:Communications Medicine 6.3

编辑推荐:

  本研究针对体外受精(IVF)胚胎形态学评估依赖人工、耗时费力且传统人工智能(AI)集中训练存在数据隐私隐患的问题,开发了分布式AI系统FedEmbryo。该系统创新性地提出联邦任务自适应学习(FTAL)框架及分层动态权重适配(HDWA)机制,在保护各临床中心数据隐私的前提下,通过整合多任务学习(MTL)与联邦学习(FL),实现了对胚胎关键形态学特征(如原核对称性、卵裂球数目、碎片率等)的精准评估和活产结局的准确预测。实验表明,FedEmbryo在内部及外部测试集上均优于本地模型及现有先进FL方法,为提升IVF临床决策提供了安全、有效的工具。

  
不孕症是全球性的健康挑战,影响着约8-12%的育龄夫妇。体外受精(IVF)作为辅助生殖技术(ART)的核心手段,为无数家庭带来了希望。然而,IVF的成功率在很大程度上依赖于胚胎学家对胚胎的形态学评估,这是一个高度依赖经验、既耗时又费力的过程。传统的人工智能(AI)方法虽能实现自动化评估,但其依赖集中式大规模数据训练的模式,在医疗数据隐私法规日益严格的今天,面临着严峻的挑战。
为了解决胚胎评估中的自动化与数据隐私保护之间的矛盾,由北京邮电大学、北京大学、首都儿科研究所、中国人民解放军总医院第六医学中心及伦敦大学学院等机构的研究人员合作,在《Communications Medicine》上发表了题为“Federated task-adaptive learning for personalized selection of human IVF-derived embryos”的研究。他们开发了一个名为FedEmbryo的分布式AI系统。FedEmbryo的核心创新在于提出了一种联邦任务自适应学习(FTAL)方法,并引入了分层动态权重适配(HDWA)机制。FTAL巧妙地将多任务学习(MTL)与联邦学习(FL)相结合,设计了一个包含共享层和任务特定层的统一客户端架构,使每个临床中心(客户端)能够同时处理单任务(如活产预测)和多任务(如多形态学指标评估)。HDWA机制则根据任务和客户端的学习反馈(损失比率),动态平衡任务间的注意力分配以及客户端间的模型聚合权重,从而有效应对真实世界临床场景中普遍存在的数据非独立同分布(non-IID)挑战。
研究表明,FedEmbryo能够在不共享原始数据的情况下,联合多个临床中心协同训练模型,最终在胚胎形态学评估和活产结局预测任务上,其性能均显著优于仅在单一中心数据上训练的本地模型,也优于FedAvg、FedProx、FedDWA等现有联邦学习算法。这不仅证明了FedEmbryo在保护隐私的前提下提升模型性能的能力,也凸显了其在处理复杂、异构医疗数据方面的强大潜力。
为开展此项研究,研究人员主要应用了几项关键技术方法:首先,他们构建了一个来自中国辅助生殖技术调查联盟(CC-ARTI)的多中心、多模态胚胎数据集,包含胚胎图像、母体临床资料和临床结局;其次,设计了基于ResNet-50的统一多任务客户端模型架构,用于同时学习胚胎发育不同阶段(原核期、卵裂期、囊胚期)的多个形态学评估任务;第三,提出了核心的HDWA算法,动态调整客户端内(任务间)和客户端间(聚合时)的权重;第四,对于活产预测任务,采用了融合胚胎图像和临床因素的多模态学习方法;最后,利用积分梯度(IG)和SHAP等可解释性技术对模型预测进行可视化分析,以增强临床可信度。
胚胎形态学评估
研究人员将FedEmbryo应用于胚胎形态学评估,涵盖了从原核期到囊胚期(Day 1至Day 5)的多个关键指标。结果表明,FedEmbryo在内部测试集(Client A-D)上对所有评估任务均取得了优异的性能。例如,在分类任务中,异常原核检测、极端不对称检测和囊胚形成预测的AUC(曲线下面积)值分别比本地模型平均提高了18.75%、16.00%和26.47%。在回归任务(如卵裂球碎片率、细胞数目预测)中,FedEmbryo也显示出更高的皮尔逊相关系数(PCC)。在外部测试集(Cohort E和F)上的验证进一步证实了其鲁棒性。与FedAvg、FedProx和FedDWA等联邦学习基线方法相比,FedEmbryo同样展现出优势,这表明HDWA机制有效缓解了数据异构性带来的性能下降问题,确保了各客户端局部特征在模型聚合过程中得到充分学习和保留。
HDWA机制的有效性
图2a展示了不同客户端间以及客户端内不同任务间存在的标签分布不平衡问题。这种数据异构性给多任务学习和联邦聚合带来了挑战。研究结果显示,HDWA机制能够有效应对这一挑战。在客户端内部,HDWA通过动态调整不同任务的权重,使模型能更好地学习那些更具挑战性的任务(如碎片率预测和细胞数预测),从而实现了任务间性能的均衡提升(图2d, e)。在客户端之间,传统的聚合方法(如FedAvg)容易受数据量大的客户端主导,而HDWA机制通过考虑客户端的损失比率,赋予数据量较小但学习困难的客户端更大的聚合权重,使得像Client A这样数据量最小的客户端,其模型性能也能与数据量最大的Client C相媲美(图2b-f)。这证明了HDWA在聚合不同客户端特征方面的有效性。
活产结局预测
活产是IVF治疗的最终目标。研究人员首先仅使用胚胎图像进行活产结局预测。结果显示,FedEmbryo在内部和外部测试集上的AUC分别达到0.80和0.76,较本地模型提升了9.59%和8.57%,且优于所有对比的联邦学习方法(图3a)。这表明联邦学习能有效整合多中心数据特征,弥补单中心数据量的不足。进一步地,研究引入了临床因素(如母亲年龄、子宫内膜厚度、FSH水平等)与胚胎图像进行多模态融合。结果表明,仅使用临床因素(元数据)的模型预测能力有限,而结合了图像和元数据的多模态FedEmbryo模型性能最佳,在外部测试集Cohort E和F上相比纯元数据模型分别提升了16.00%和11.00%(图3b, c),凸显了多模态信息互补的重要性。
可视化与可解释性
为了增强模型决策的透明度,研究人员应用积分梯度(IG)生成了显著图(Saliency Map),以显示模型在做出形态学评估时所关注的图像区域。如图4a所示,不同本地客户端模型由于其本地数据分布的异构性,关注的胚胎区域存在明显差异。而FedEmbryo通过联合训练,能够聚合各客户端的特征,其显著图能更全面、准确地覆盖与临床评估相关的关键区域(如Day 1图像中的原核区域、Day 3图像中的所有相关卵裂球)。这表明FedEmbryo不仅能处理客户端间的数据差异,还能平衡客户端内对不同任务的关注。此外,利用SHAP(SHapley Additive exPlanations)对活产预测模型进行解释性分析发现,基于FedEmbryo的图像预测得分是影响活产结局的最重要因素,其次为母亲年龄,其他如子宫内膜厚度、FSH水平等临床因素也显示出显著影响(图4b, c)。这为临床医生理解模型决策、识别关键风险因素提供了直观依据。
消融实验
消融研究进一步验证了联邦学习、多模态整合和多任务学习各个模块的贡献。结果表明,移除联邦学习模块或仅进行单任务学习都会导致模型性能显著下降。同时,多模态模型(图像+元数据)的性能优于任何单一模态模型。这证实了FedEmbryo所采用的集成策略对于实现最优性能是必要且有效的。
综上所述,这项研究开发的FedEmbryo系统,成功地将联邦学习与多任务学习相结合,通过创新的HDWA机制解决了医疗AI在分布式、多任务场景下面临的数据隐私和异构性核心挑战。该系统不仅在胚胎形态学自动评估和活产结局预测方面表现出色,还通过可解释性技术增强了临床应用的信任度。FedEmbryo为在严格保护数据隐私的前提下,利用多中心数据协作开发高性能、可信赖的临床AI工具提供了一个可行的框架,有望在未来推动辅助生殖领域乃至更广泛医疗场景的精准化、智能化发展。尽管当前研究数据主要来源于中国人群,且采用同步训练方式可能在极端异构网络环境下存在挑战,但其所提出的方法学和展现的潜力,为后续研究奠定了坚实的基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号