编辑推荐:
为解决胚胎数据稀缺难题,研究人员融合合成与真实胚胎数据训练 AI 模型,提升胚胎阶段分类准确率,意义重大。
在现代医学中,辅助生殖技术(Assisted Reproductive Technology,ART)是解决不孕不育问题的重要手段。据世界卫生组织(WHO)数据,全球约六分之一的育龄人群面临不孕困扰,ART 成为众多家庭的希望。然而,这项技术的平均成功率却不到 30%,而胚胎质量的选择是影响成功率的关键因素。以往,胚胎学家主要通过视觉评估胚胎形态来挑选合适的胚胎,但这种方式主观性强,容易出现人为误差。同时,随着 ART 治疗数量的增加,人工分析大量的图像和视频数据变得既耗时又耗力。
在此背景下,人工智能(Artificial Intelligence,AI)技术的发展为辅助生殖领域带来了新的曙光。AI 能够为胚胎评估增添客观性,提高 ART 的治疗效果。不过,AI 在 ART 中的应用面临着一个巨大的挑战 —— 胚胎数据的稀缺。由于隐私和伦理问题,胚胎数据的共享受到极大限制,公开可用的数据集不仅数量有限,规模也较小,这严重制约了深度学习模型的训练和发展。
为了突破这一困境,来自罗马尼亚、挪威等多国研究机构的研究人员展开了深入研究。他们的研究成果发表在《Scientific Reports》上,为辅助生殖技术与人工智能的结合开辟了新路径。
研究人员在此次研究中运用了多种关键技术方法。首先是数据收集,他们从挪威的 Volvat Spiren 生育诊所获取了部分胚胎视频图像数据,并结合公开可用的 “Human Embryo Time-Lapse Video” 数据集,构建了包含 5500 张胚胎图像的最终数据集,涵盖 2 - 细胞、4 - 细胞、8 - 细胞、桑葚胚(morula)和囊胚(blastocyst)五个发育阶段。其次,采用生成对抗网络(Generative Adversarial Network,GAN)中的 StyleGAN 和扩散模型(Latent Diffusion Model,LDM)两种生成模型,基于 1000 张真实胚胎图像训练生成合成胚胎图像。最后,运用 VGG、ResNet 和 ViT 三种分类模型进行多类分类,评估合成图像对胚胎阶段分类准确率的影响。
下面来看具体的研究结果:
- 数据生成结果:通过计算 Fréchet inception distance(FID)分数评估生成模型性能,结果显示 LDM 模型的 FID 分数更低,生成的合成图像质量更高。
- 分类结果:研究发现,在训练分类模型时,融合合成图像和真实图像能够提升分类性能。例如,VGG 模型在仅使用真实数据训练时,准确率为 94.5%,而加入合成数据后,准确率提升至 97%。即使仅用合成数据训练模型,在真实数据上测试时,VGG 模型也能达到 92% 的较高准确率。并且,结合来自不同生成模型(StyleGAN 和 LDM)的合成数据,比使用单一模型的数据能获得更好的分类结果。
- 定性分析:研究人员开发了一个网络应用程序,邀请四位胚胎学家进行图灵测试(Turing test),以评估合成图像的逼真度。结果表明,LDM 生成的图像更具迷惑性,胚胎学家正确识别 LDM 生成图像为假的比例仅为 34.4%,而识别 StyleGAN 生成图像为假的比例为 74.7%。
综合研究结果与讨论部分,此次研究意义非凡。一方面,证明了合成数据在解决胚胎数据稀缺问题上的有效性,即使仅用合成数据训练分类器也能取得不错的准确率,而将合成图像与真实图像结合使用,能进一步提升模型性能,且在外部数据集测试中也表现出色,增强了模型的泛化能力。另一方面,研究还发现了一些有待改进的问题,如部分合成图像过暗影响评估,数据集未涵盖所有相关细胞阶段和胚胎类型等。后续研究可针对这些问题进行优化,从而推动 AI 在辅助生殖技术中的应用,有望提高 ART 的成功率,为更多不孕不育家庭带来福音。