大型语言模型在辅助生殖技术中能否为不孕患者提供准确且富有同理心的解答?一项前瞻性双盲对照研究

【字体: 时间:2025年08月17日 来源:Reproductive BioMedicine Online 3.5

编辑推荐:

  本研究通过双盲对照试验评估了大型语言模型(LLM)在辅助生殖技术(ART)领域回答患者常见问题的表现。结果显示,ChatGPT v4.0提供的答案在专业性和同理心方面与人类专家相当,胚胎学家回答质量显著优于AI,而AI在14/26问题中被心理学家评为更具同理心。研究表明LLM可作为ART中心的辅助教育工具,但需警惕信息准确性风险。

  

研究亮点

本研究首次系统评估了大型语言模型(LLM)在辅助生殖技术(ART)领域的应用潜力。通过双盲对照设计,我们发现AI生成的回答在专业性和情感支持方面展现出与人类专家相当的竞争力,为数字化医疗咨询提供了新证据。

材料与方法

这项在法国大学医院开展的前瞻性研究,收集了ART临床(13题)和胚胎学(13题)领域的高频问题。2名妇科医生、2名胚胎学家和ChatGPT v4.0分别作答,所有回答由4名评估者(2名妇科医生+2名胚胎学家)进行盲法评分,心理学家单独评估同理心维度。严格控制文本长度变量,采用5分量表评估回答质量。

结果

AI回答的平均字数显著多于人类专家(64.7±14.1 vs 44.5±16.4)。质量评分显示:胚胎学家回答显著优于AI(p=0.02),但妇科医生与AI无统计学差异。值得注意的是,AI回答在14/26问题中被心理学家评为"最具同理心",且所有回答均未包含错误信息。

讨论

ChatGPT v4.0展现出处理常规ART咨询的潜力,其优势包括:1) 即时响应能力;2) 标准化知识输出;3) 在特定情境下更优的情感表达。然而,AI仍存在局限性——无法替代复杂病例的个体化诊疗,且可能产生"过度流畅性偏差"(即语言流畅但内容空泛)。

结论

本研究证实LLM可作为ART中心的辅助教育工具,建议将AI应答系统整合至医院官网用于常规咨询。需要建立三重保障机制:1) 专业内容审核;2) 明确使用边界标注;3) 持续的性能监测体系,确保这项技术真正造福不孕症患者群体。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号