生成式AI在医学影像中的表征偏差:一项关于加拿大医学放射技师人口统计学与设备准确性的多模型研究
《Journal of Medical Imaging and Radiation Sciences》:Geographic prompting and content fidelity in generative Artificial Intelligence: A multi-model study of demographics and imaging equipment in AI-generated videos and images of Canadian medical radiation technologists
【字体:
大
中
小
】
时间:2025年10月19日
来源:Journal of Medical Imaging and Radiation Sciences 2
编辑推荐:
本研究针对生成式AI工具在制作医学影像和视频时存在的准确性与公平性问题,聚焦加拿大医学放射技师(MRT)的职业表征。研究人员通过分析8个主流文本-图像/视频模型生成的690份输出,发现AI生成内容在人口统计学特征(性别、种族、年龄)和成像设备呈现上均与现实数据存在显著差异,例如男性(41.4% vs 21.2%, p<0.001)和可见少数族裔(39% vs 20.8%, p<0.001)被过度代表,且设备呈现不准确(26%为虚构设备)。该研究揭示了AI生成医学内容可能扭曲公众认知和专业形象的风险,强调了改进模型训练的必要性。
在当今数字医疗时代,生成式人工智能(AI)正以前所未有的速度渗透到医学教育、患者沟通和专业营销等多个领域。从制作生动的科普视频到生成逼真的培训图片,AI工具如DALL·E、Sora等文本-图像/视频模型,似乎为医疗内容的可视化提供了无限可能。然而,在这股技术热潮背后,一个严峻的问题逐渐浮出水面:这些由AI生成的“完美”影像,是否真实地反映了医疗行业的多样性与专业性?特别是对于那些身处医疗前线、直接操作复杂成像设备并与患者密切接触的医学放射技师(Medical Radiation Technologists, MRT)而言,AI的“画笔”是否会无意间歪曲他们的职业形象,甚至强化社会固有的刻板印象?
先前的研究已经敲响了警钟。多项研究表明,AI在描绘医生、护士等医疗专业人员时,常常存在明显的性别、种族和年龄偏差。例如,2024年的一项研究发现,AI生成的医生图像中,高达93%为男性,82%为白人,这与现实中医护人员的多元化构成相去甚远。类似地,在外科医生的AI画像中,几乎清一色是白人男性,仿佛将人们带回了半个世纪前的职业图景。尽管有较新的研究指出,AI在表征护士和医生的种族与性别多样性方面有所进步,但其在人物神态、着装等细节上仍流露出难以抹去的刻板印象。然而,当研究视线转向医学放射技师这一关键群体时,尤其是放在加拿大这一多元文化国家的背景下,我们却惊讶地发现,相关的系统性评估几乎是一片空白。医学放射技师是诊断成像和介入治疗团队中不可或缺的角色,他们不仅是技术的操作者,更是患者的首访者。如果AI生成的用于教育、招聘或宣传的材料错误地描绘了他们的形象和工作环境,不仅会误导公众和患者,更可能对职业认同感和未来的招聘工作产生深远影响。正是为了填补这一关键空白,由Yousif Al-Naser、Sonali Sharma、Ken Niure、Kevin Ibach、Faisal Khosa和Charlotte J. Yong-Hing组成的研究团队,在《Journal of Medical Imaging and Radiation Sciences》上发表了他们的最新研究成果。
为了深入探究生成式AI对加拿大医学放射技师的表征准确性,研究团队设计并实施了一项严谨的多模型比较研究。
研究人员选取了八款主流的生成式AI模型,包括六款文本-图像模型(DALLE-3, Firefly, Imagen-3, FLUX, Stable Diffusion XL (SDXL), Grok)和两款文本-视频模型(Sora, Hailuo AI)。研究采用统一的标准化提示词:“Image [or video] of a Canadian medical radiation technologist”(加拿大医学放射技师的图像/视频),旨在最小化提示词差异对结果的干扰。研究最终生成了总计690份输出(600张图像和90段视频)用于分析。所有生成内容均由三名评估者进行独立编码,评估指标涵盖人口统计学特征(性别、种族/民族、年龄、宗教表征、可见残疾)以及成像设备的呈现情况(存在与否、类型、准确性)。评估者间的一致性很高(Cohen‘s Kappa系数在0.81至0.90之间)。为了进行基准比较,研究人员获取了加拿大统计局关于全国20,755名在职医学放射技师的人口普查数据。统计分析采用了卡方检验、比例Z检验等方法,以检验AI生成内容与现实数据之间的差异显著性。
将AI生成的690名技师与加拿大真实世界的20,755名技师数据进行对比后,发现了全方位的显著差异。在种族/民族方面,AI生成内容中可见少数族裔(根据加拿大统计局定义)的比例高达39%,显著高于现实中的20.8%(p < 0.001)。具体而言,白人技师被低估(61% vs 79.2%, p < 0.001),亚洲裔技师也被轻微低估(12.9% vs 16.3%, p = 0.02),而黑人(16.7% vs 2.55%, p < 0.001)、拉丁裔(6.2% vs 0.72%, p < 0.001)和其他族裔(3.2% vs 1.23%, p < 0.001)则被过度代表。在性别维度上,AI生成的男性技师比例(41.4%)远高于现实(21.2%, p < 0.001),而女性技师比例(58.5%)则显著低于现实(78.8%, p < 0.001)。年龄分布上,AI生成的技师明显更年轻,88.3%被判定为55岁以下,而现实中这一比例为83.4%(p < 0.001)。
研究进一步揭示了不同AI模型之间的巨大差异。性别分布在不同模型间存在极显著差异(χ2 = 212.69, p < 0.001)。例如,SDXL和Flux模型生成的技师以女性为主(分别为97%和73%),而Grok模型则几乎完全生成男性技师(99%)。值得注意的是,文本-视频模型(Sora和Hailuo AI)的整体性别分布(86.7%为女性)与图像模型(58.6%为女性)有显著不同(Z = 5.16, p < 0.001),且视频模型的女性表征更接近现实数据(78.8%)。种族/民族表征在不同模型间也差异显著(χ2 = 311.84, p < 0.001)。DALLE-3和Imagen-3模型涵盖了所有五种族裔类别,但DALLE-3的分布相对更均衡。而像SDXL模型生成的全部是白人技师,Grok模型则过度代表了黑人技师(55%)。
在设备保真度方面,问题同样突出。在全部690份输出中,有66.6%包含了成像设备。然而,设备的类型分布严重失衡且常常失真。计算机断层扫描/磁共振成像(CT/MRI)设备占据了主导地位,出现在66%的有设备输出中。而作为放射科基础检查手段的X射线设备,仅出现在4.3%的输出中。超声设备更是罕见,仅占0.86%。更令人担忧的是,高达26%的输出中包含的设备被归类为“不存在”(DNE),即这些设备是扭曲的或完全虚构的,与现实中任何公认的医疗设备不符。不同模型在设备呈现的多样性上也有差别,Imagen-3模型展现了最广泛的设备类型(五种)。
本研究系统地揭示了当前主流生成式AI模型在描绘加拿大医学放射技师时存在的双重偏差:人口统计学偏差和设备表征失真。尽管表面上AI生成了一些多样性表征(如更高的可见少数族裔比例),但这种“过度代表”并非真实的反映,反而可能制造出一种“多样性假象”,掩盖了真实存在的职业多样性挑战,并可能削弱推动实质性平等的紧迫感。尤其值得关注的是,在医学放射技术这个女性占多数的领域,AI的图像模型却显著低估了女性比例,这与其他医疗专业研究中发现的男性过度代表模式有所不同,提示AI偏差具有情境特异性。
尽管在提示词中明确指定了“加拿大”这一地理信息,但AI模型的响应显得肤浅且符号化,更多是通过国旗、枫叶等刻板符号来体现,而非准确反映加拿大医学放射技师队伍真实的人口构成。这表明模型对地理提示的理解和执行力仍然非常有限,难以满足需要精确地域化表征的应用场景(如地方性的招聘宣传、公共卫生教育)的需求。
在专业层面,成像设备呈现的严重失真(如虚构设备、过度强调高端CT/MRI而忽视基础的X射线)是一个不容忽视的风险。这不仅可能误导医学生和公众对放射技技术工作的认知,还可能影响教学材料的准确性和资源分配的决策。当AI生成的内容被不加批判地用于教材、宣传册或在线课程时,其中包含的偏差和错误就会被放大和固化。
综上所述,该研究有力地表明,当前的生成式AI尚不能可靠地生成在人口统计学和专业背景上均准确的医学放射技师形象。这些发现对医学教育者、内容创作者、AI开发者和专业协会提出了警示:在利用AI的强大生成能力时,必须辅以严格的人工审核和专业知识把关。未来的发展方向应包括改进AI模型的训练数据,增强其对地理、专业上下文提示的敏感性,并将领域专业知识更深地融入模型开发与评估流程。最终目标是驾驭AI的创造力,使其能够服务于构建一个更加准确、公平和包容的医疗专业数字图景,而非无意中加剧现有的误解与偏见。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号