评估一种用于畸形检测的新型包容性下一代合成面部工具

《American Journal of Medical Genetics Part A》:Evaluation of a New Inclusive Next-Generation Synthetic Face Tool for Dysmorphology

【字体: 时间:2025年11月07日 来源:American Journal of Medical Genetics Part A 1.7

编辑推荐:

  通过扩散模型生成合成面容数据提升罕见遗传综合征AI诊断工具的准确性和包容性,研究采用LoRA和ControlNet技术生成覆盖不同年龄、性别、族裔的合成面部图像,测试表明合成数据可将真实测试集的准确率从0.766提升至0.869,并在超罕见综合征和亚洲人群检测中达到0.971。

  

摘要

背景:面部分析工具有助于诊断罕见的遗传综合征,但由于数据集规模小且存在偏见,其在极罕见病例和代表性不足的种族群体中的诊断准确性有限。合成面部图像可以丰富训练数据,从而提高诊断的公平性。方法:我们开发了一种基于扩散模型(DreamShaper XL Turbo)的合成面部生成流程,并通过LoRA技术进行特定综合征领域的适应处理,同时利用ControlNet进行姿态调整。共生成了4432张代表十种罕见综合征的合成面部图像,这些图像在年龄(0–18岁)、性别(50/50)和种族(33%白人、非裔加勒比人、亚洲人)方面进行了平衡。我们将合成数据和真实数据用于四种机器学习模型中,以训练和测试ArcFace R-100这一用于综合征分类的表型分析算法。结果:从真实患者数据生成的合成面部图像在表型真实性方面表现优异,分类准确率达到了0.823(top-1准确率),AUC值为0.991。将合成图像添加到真实训练数据集中后,真实测试图像的准确率从0.766提升至0.869,AUC值从0.988提升至0.993。对于极罕见综合征和亚洲人群体,性能提升尤为显著(top-1准确率为0.971)。仅使用合成图像进行训练时,准确率较低(top-1准确率为0.606),这突显了合成图像的补充作用。结论:本研究表明,基于扩散模型生成的合成面部图像能够提高基于人工智能的畸形分析工具的包容性和准确性。这些合成数据集为数据稀缺问题提供了可扩展且符合伦理的解决方案,可应用于临床培训和远程医疗,尤其是在服务不足的地区。

利益冲突

作者声明不存在利益冲突。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号