AI对侧眉线的分级:用于生成未见过的合成图像和数据增强的新型模型

《Clinical, Cosmetic and Investigational Dermatology》:AI Grading of Lateral Canthal Lines: Novel Models for Unseen Synthetic Image Generation and Data Augmentation

【字体: 时间:2025年11月22日 来源:Clinical, Cosmetic and Investigational Dermatology 1.9

编辑推荐:

  本研究开发了一种基于扩散的生成式AI模型,通过结构化标签控制侧颞部皱纹严重程度,生成10,500张临床图像。实验显示,结合生成数据与常规增强后,CNN分类准确率提升至91%(原82%),AUC达0.981,有效改善数据不平衡,为皮肤病学AI提供新方法。

  人工智能在皮肤科的应用正在迅速发展,并展现出令人鼓舞的成果。然而,开发准确且可靠的AI算法通常需要大量的带标签训练数据,而这些数据在临床环境中往往难以获取。为了克服这一挑战,本研究旨在设计一种新的基于扩散的生成式AI算法,能够生成具有可调整细节的患者图像,从而创建更大且更均衡的数据集,用于神经网络的训练。这种新模型特别适用于临床皮肤图像,因为其生成的图像能够保持与原始图像相似的风格和特征,同时允许研究人员根据具体任务需求调整图像的某些属性。

在皮肤科中,明显的外眼角皱纹(俗称“鱼尾纹”)是患者寻求美容治疗的常见原因。治疗效果通常通过标准化的评分系统进行评估。因此,建立标准化的评分体系对于治疗方案的制定和治疗效果的监测至关重要。本研究使用标准化的临床图像,结合新的生成式AI模型,生成具有不同外眼角皱纹严重程度的患者图像,从而提高分类模型的性能。研究结果表明,使用该模型生成的图像可以有效缓解数据样本不足或数据分布不均的问题,提升分类器的整体准确性。

本研究的数据集包括121名受试者的图像,其中6名男性和115名女性,平均年龄为43.53岁。所有受试者均为东亚裔,并具有Fitzpatrick皮肤类型III或IV。使用VISIA?皮肤分析系统在标准照明条件下获取了标准化的左右外眼角图像。最终,研究使用了566张(左右各一张)图像进行评估,这些图像的外眼角皱纹严重程度由两位认证的皮肤科医生根据五级评分标准(0到4)进行评估,其中0级表示无皱纹,4级表示最严重的皱纹。在评分不一致的情况下,评估者会讨论并达成最终一致。所有图像在研究前经过预处理,包括裁剪、缩放和归一化,以确保图像质量的一致性。

生成式AI模型的核心是扩散过程,它包括正向扩散和逆向扩散两个阶段。正向扩散通过逐步向图像中添加高斯噪声,最终使图像变得模糊,接近纯噪声。而逆向扩散则是通过训练一个可学习的神经网络,逐步去除噪声,恢复图像的原始状态。这种方法的关键在于如何训练模型以准确预测噪声并重构清晰图像。通过逆向扩散过程的多层去噪,可以生成符合特定要求的图像,同时由于噪声添加的控制,每张生成的图像都会略有差异。

为了使扩散模型能够生成特定图像,研究引入了控制变量,即结构化的组合标签。这些标签作为条件生成模型的一部分,使模型能够学习不同图像组合之间的关系,从而在生成过程中更好地控制图像的某些特征。通过这种方式,模型可以生成与原始数据分布和特征一致的图像,避免生成与实际患者图像不一致的图像。此外,研究还结合了传统数据增强方法,如旋转、锐化、对比度调整和翻转,以进一步丰富数据集。

研究采用了一种基于卷积神经网络(CNN)的分类模型,其特征提取器基于ImageNet预训练的ResNet-34网络。该模型通过三个全连接层和三个Dropout层进行分类,最终输出每个类别的条件概率估计。在训练过程中,模型经过200个epoch,每个epoch结束后都会进行验证和计算验证准确率。最终选择验证准确率最高的模型作为分类模型。

研究比较了三种不同的数据集训练方式对分类模型性能的影响。第一种方法使用原始数据集,并将其划分为训练集、验证集和测试集,比例为64%–16%–20%。第二种方法在原始数据集的基础上应用了传统数据增强技术,包括旋转、翻转和对比度调整。第三种方法则是在原始数据集的基础上,结合了基于组合的零样本和小样本生成模型生成的合成图像,进一步增强了数据集的多样性。结果表明,使用合成图像的数据集在分类准确率和AUC(曲线下面积)方面均优于原始数据集和传统数据增强方法。

生成的图像数量为10,500张,覆盖了五个外眼角皱纹等级。新数据集中的图像分布更加均衡,与原始数据集相比,每个等级的图像比例相似。这些生成的图像不仅保持了原始图像的风格,还能够根据需要调整皱纹的严重程度。研究还通过混淆矩阵分析了分类模型的性能,发现使用合成图像训练的模型在分类错误方面表现出更好的控制,特别是在区分严重等级(如4级)时,错误率显著降低。

本研究的创新点在于开发了一种基于组合的零样本和小样本生成模型,该模型能够根据有限的示例生成具有特定特征的图像,从而有效解决数据样本不足的问题。此外,该模型还能够根据任务需求调整图像的某些属性,例如外眼角皱纹的严重程度,为研究人员提供了更大的灵活性。然而,研究也指出了一些局限性,包括数据集的多样性不足和缺乏外部验证。尽管如此,研究结果表明,通过引入生成式AI模型,可以显著提升分类模型的性能,尤其是在处理数据不平衡问题时。

在未来的研究中,可以进一步探索该生成模型在不同人群中的适用性,特别是对于肤色较深的患者群体。目前的研究数据主要来自东亚裔人群,因此在应用于其他种族或肤色的患者时,需要更多的数据支持和验证。此外,研究还可以考虑扩展生成模型的应用范围,使其能够处理更广泛的皮肤科图像任务,如皮肤癌、甲癣和痤疮等。

总的来说,本研究展示了一种有效的生成式AI方法,能够生成高质量的临床图像,帮助研究人员创建更大、更均衡的数据集,从而提升AI算法的训练效果。这种方法不仅适用于外眼角皱纹的分类任务,还可能在其他皮肤科图像分析任务中发挥重要作用。随着AI技术的不断发展,生成式模型将在医疗领域发挥越来越重要的作用,为医生和研究人员提供更准确、更全面的图像分析工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号