编辑推荐:
乳腺癌严重威胁女性健康,AI 在乳腺癌筛查中利弊共存。研究人员开展 “Preferences for the Use of Artificial Intelligence for Breast Cancer Screening in Australia: A Discrete Choice Experiment” 研究,发现女性对 AI - 放射科医生混合读片有偏好,为 AI 在乳腺癌筛查的应用提供依据。
在全球范围内,乳腺癌一直是严重威胁女性健康的 “头号杀手”。在澳大利亚,乳腺癌更是女性群体中最为常见的癌症类型。目前,澳大利亚采用的是每两年为符合条件的女性提供一次乳腺癌筛查的策略,旨在降低乳腺癌的死亡率。随着科技的飞速发展,人工智能(AI)逐渐崭露头角,被视为乳腺癌筛查领域的一项极具潜力的工具。早期的前瞻性试验显示,AI 作为第二读片工具与放射科医生配合,效果不逊色于两名放射科医生读片,且有研究表明其具有一定的成本效益。
然而,AI 在乳腺癌筛查中的应用并非一帆风顺。一方面,AI 的使用存在诸多潜在风险,比如系统错误、算法偏见和隐私问题等,这些问题可能对患者造成伤害。另一方面,消费者对于 AI 在乳腺癌筛查中的应用看法不一,他们的态度和期望对于 AI 能否在健康筛查服务中得到广泛应用至关重要。尽管此前有不少研究探索公众和患者对 AI 作为医疗筛查或诊断工具的偏好,但大多基于调查数据,尚未有研究利用离散选择实验(DCE)来评估女性对 AI 驱动的乳腺癌筛查服务的偏好。在这样的背景下,开展一项深入研究,了解澳大利亚女性对 AI 在乳腺癌筛查中的偏好以及相关影响因素,显得尤为必要。
为了解决这些问题,来自澳大利亚多所高校和研究机构的研究人员 Maame Esi Woode、Udeni De Silva Perera、Chris Degeling 等开展了一项名为 “Preferences for the Use of Artificial Intelligence for Breast Cancer Screening in Australia: A Discrete Choice Experiment” 的研究。该研究成果发表在《The Patient - Patient-Centered Outcomes Research》杂志上。这项研究对于优化乳腺癌筛查策略、推动 AI 在医疗领域的合理应用具有重要意义,有望为政策制定者、医疗保健专业人员、筛查项目管理者和技术开发者提供关键参考,从而更好地塑造澳大利亚乳腺癌筛查的未来。
在研究方法上,研究人员主要运用了以下关键技术:
- 离散选择实验(DCE):精心设计了包含七个属性(读片方法、筛查敏感性、筛查特异性、筛查与接收结果的时间间隔、支持证据、公平代表性、责任归属)的 DCE 实验。通过向 2063 名 40 - 74 岁的澳大利亚女性展示两种基于不同属性组合的筛查服务,让她们进行选择,以此来评估女性对不同筛查服务的偏好。
- 随机分组:将参与者随机分为两组,一组只接收关于 AI 在乳腺癌筛查中使用的标准信息,另一组除标准信息外,还接收 AI 潜在益处的额外信息,以此探究信息对偏好的影响。
- 统计分析:运用多项 logit(MNL)和随机参数 logit(RPL)模型进行分析,通过贝叶斯信息准则(BIC)和一致性赤池信息准则(CAIC)评估模型性能,最终选择 RPL 模型进行数据分析。同时进行了多项检验,如通过同质性检验判断两组数据是否可合并,以及进行优势检验和速度检验来保证数据质量。
研究结果如下:
- 参与者特征:共 2166 名参与者同意参与并完成调查,经筛选后 2063 名纳入分析。参与者在年龄、地区、教育程度、健康状况等方面具有全国代表性,其中约 30% 的参与者年龄在 40 - 49 岁,尚未收到澳大利亚乳腺癌筛查计划的邀请;约 42% 拥有大学学位或其他高等教育背景;72.5% 至少进行过一次乳腺癌筛查;5.9% 曾被诊断出患有乳腺癌。
- 偏好和采用率
- 读片方法偏好:参与者普遍更倾向于一名放射科医生和一个 AI 系统的混合读片方式(0.51;95% CI 0.40 - 0.62),相较于两名放射科医生读片。对于两种 AI 系统读片和两名放射科医生读片的偏好,未观察到统计学显著差异。
- 其他属性偏好:参与者更倾向于漏诊病例少(高敏感性)、假阳性少(高特异性)、等待结果时间短的筛查服务。同时,相比于仅使用临床试验数据,他们更倾向于 AI 系统开发使用临床试验和真实世界证据。在责任归属方面,参与者对 AI 开发机构承担诊断错误责任的偏好显著低于政府(?0.30;95% CI ?0.39 至 ?0.22)。此外,参与者选择不筛查的可能性较低(?4.12;95% CI ?4.34 至 ?3.91)。
- 相对属性重要性和采用率:读片方法是第三重要的属性,仅次于敏感性和特异性。AI 与放射科医生一起使用的服务的采用率最高,高于仅使用两个 AI 系统的服务。
- 偏好异质性研究
- 基于服务敏感性和特异性的读片方法偏好差异:当读片方法为两个 AI 系统时,参与者更倾向于特异性更好(假阳性率更低)的服务;当读片方法为一名放射科医生和一个 AI 系统时,参与者对高敏感性和高特异性都有较高偏好。
- 信息对偏好的影响:提供 AI 使用和益处的额外信息后,参与者对 AI - 放射科医生混合读片的偏好显著增强,同时对漏诊 25% 病例的筛查服务偏好显著降低,对使用 AI 系统训练包含所有少数群体代表的筛查服务偏好也降低。
- 癌症和癌症筛查经历对读片方法和筛查偏好的影响:有过癌症筛查经历的人,无论采用何种筛查方法,选择不筛查的可能性更低。
研究结论和讨论部分表明:该研究首次通过 DCE 调查,深入了解了澳大利亚女性对 AI 在乳腺癌筛查中的偏好及影响决策的关键因素。研究发现女性对 AI 在乳腺癌筛查中的应用持开放态度,尤其是在有放射科医生参与的情况下。同时,信息在影响女性对 AI 驱动的健康服务的接受和采用方面起着重要作用,提供 AI 潜在益处的信息能增强女性对 AI - 放射科医生混合读片的偏好。此外,研究还发现人们普遍不太倾向于让 AI 开发公司对错误负责,而更倾向于监管机构负责。
然而,该研究也存在一定的局限性。研究开展于新冠疫情期间,参与者对医疗技术的体验可能影响其对 AI 在医疗筛查中应用的看法。并且,研究未在必要时向参与者提供属性定义,信息表未突出 AI 在乳腺癌筛查中的潜在负面影响,实验设计对交互效应的研究也较为探索性。
尽管如此,这项研究对于澳大利亚未来制定 AI 健康服务的实施和监管政策具有重要意义。它强调了在医疗决策过程中直接人类参与的重要性,为促进 AI 系统在健康工作流程中的平衡融入提供了依据,有望推动 AI 在乳腺癌筛查领域更加安全、有效地应用,从而为女性健康保驾护航。