GestaltGAN:合成罕见遗传病患者逼真肖像,助力医学研究与隐私保护

【字体: 时间:2025年01月23日 来源:European Journal of Human Genetics 3.7

编辑推荐:

  在医学研究中,面部形态(facial gestalt)对罕见遗传病诊断至关重要,但医学数据稀缺且存在隐私风险。研究人员开展了利用生成神经网络合成罕见病患者肖像的研究,训练出 GestaltGAN。结果表明其能生成逼真且保护隐私的图像,这对医学研究、教学及深度学习意义重大。

  在医学领域,面部特征对于许多遗传疾病的诊断起着关键作用。当医生面对一些罕见遗传疾病时,患者独特的面部形态常常是重要的诊断线索。在人类孟德尔遗传在线数据库(OMIM)中,与 “面部畸形(facial dysmorphism)” 相关的条目多达 2997 个,这充分显示了面部形态在疾病诊断中的重要性。然而,医学数据存在诸多问题。一方面,相关的医学成像数据十分稀缺,难以满足研究和教学的需求;另一方面,分享患者的面部图像又会带来隐私和身份泄露的风险。如何在保护患者隐私的前提下,获得足够且准确的面部图像数据,成为了医学研究的一大难题。
为了解决这些问题,来自德国波恩大学基因组统计与生物信息学研究所、德国奥格斯堡大学计算机科学研究所等多个机构的研究人员展开了一项极具意义的研究。他们的研究成果发表在《European Journal of Human Genetics》上,旨在探索能否利用生成神经网络(Generative Neural Networks)来合成罕见病患者的精确肖像。
研究人员主要采用了以下关键技术方法:首先,利用了来自 GestaltMatcher 数据库(GMDB)的数据,该数据库包含 581 种涉及面部畸形的疾病以及 10980 多张患者图像 。其次,运用了 REAL - ESRGAN 技术来提高低分辨率图像的质量,还用 DDColor 技术给黑白图像上色,让数据集更统一。此外,他们选用了条件式 StyleGAN3 - R 架构进行模型训练,通过添加自定义损失函数和过采样函数,让模型更好地学习疾病特征。
研究结果如下:
  1. 计算评估图像质量:研究人员生成了大量图像,利用 RetinaFace 评估发现,大部分生成图像是高质量的肖像,但不同疾病的失败案例比例有所差异,如 Cornelia de Lange 综合征失败率为 2.7%,Kabuki 综合征为 6.9% 。同时,利用 GestaltMatcher 评估发现,生成图像在捕捉疾病特征方面表现良好,整体 top - 5 准确率达到 76.7%,像 Cornelia de Lange 综合征和 Williams - Beuren 综合征的 top - 5 准确率更是高于 90%。
  2. 人类专家评估图像质量:研究人员招募了 63 名医学专业人士进行在线调查。在识别原始图像实验中,参与者识别原始图像的准确率为 33.3%,高于随机猜测的 25%,但仍有大部分情况下无法识别。在识别训练数据图像实验中,参与者识别正确的概率为 33.7%,说明 GestaltGAN 生成的图像在一定程度上保护了患者隐私。在诊断疾病实验中,专家基于真实肖像诊断的准确率为 48%,基于生成肖像的诊断准确率为 48.5%,这表明生成图像能准确呈现疾病特征,甚至由于自定义损失函数的作用,诊断率还略有提高。
    研究结论和讨论部分指出,研究人员成功训练出 GestaltGAN,它能够合成逼真的罕见遗传病患者肖像,在保留疾病特征的同时保护了患者隐私。不过,该研究也存在一些局限性,例如不同方面的评估是独立进行的,未对单张图像同时进行所有测试;测试的疾病数量有限,且仅采用了一种生成方法。尽管如此,这项研究依然具有重要意义。它为医学研究和教学提供了新的图像资源,也为深度学习模型的训练提供了更多数据。就如同传统医学教育中 “见一个、做一个、教一个” 的理念,GestaltGAN 通过对有限病例的学习,实现了对罕见病患者面部图像的精准生成,这充分展示了生成对抗网络在医学领域的巨大潜力,有望为未来的医学研究和临床诊断带来更多突破。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号