大型语言模型在辅助生殖技术中能否为不孕患者提供准确且富有同理心的解答？一项前瞻性双盲对照研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月17日 来源：Reproductive BioMedicine Online 3.5

编辑推荐：

　　本研究通过双盲对照试验评估了大型语言模型(LLM)在辅助生殖技术(ART)领域回答患者常见问题的表现。结果显示，ChatGPT v4.0提供的答案在专业性和同理心方面与人类专家相当，胚胎学家回答质量显著优于AI，而AI在14/26问题中被心理学家评为更具同理心。研究表明LLM可作为ART中心的辅助教育工具，但需警惕信息准确性风险。

^研究亮点

本研究首次系统评估了大型语言模型(LLM)在辅助生殖技术(ART)领域的应用潜力。通过双盲对照设计，我们发现AI生成的回答在专业性和情感支持方面展现出与人类专家相当的竞争力，为数字化医疗咨询提供了新证据。

^{材料与方法}

这项在法国大学医院开展的前瞻性研究，收集了ART临床(13题)和胚胎学(13题)领域的高频问题。2名妇科医生、2名胚胎学家和ChatGPT v4.0分别作答，所有回答由4名评估者(2名妇科医生+2名胚胎学家)进行盲法评分，心理学家单独评估同理心维度。严格控制文本长度变量，采用5分量表评估回答质量。

^结果

AI回答的平均字数显著多于人类专家(64.7±14.1 vs 44.5±16.4)。质量评分显示：胚胎学家回答显著优于AI(p=0.02)，但妇科医生与AI无统计学差异。值得注意的是，AI回答在14/26问题中被心理学家评为"最具同理心"，且所有回答均未包含错误信息。

^讨论

ChatGPT v4.0展现出处理常规ART咨询的潜力，其优势包括：1) 即时响应能力；2) 标准化知识输出；3) 在特定情境下更优的情感表达。然而，AI仍存在局限性——无法替代复杂病例的个体化诊疗，且可能产生"过度流畅性偏差"(即语言流畅但内容空泛)。

^结论

本研究证实LLM可作为ART中心的辅助教育工具，建议将AI应答系统整合至医院官网用于常规咨询。需要建立三重保障机制：1) 专业内容审核；2) 明确使用边界标注；3) 持续的性能监测体系，确保这项技术真正造福不孕症患者群体。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号