ChatGPT-4o在子宫内膜癌患者咨询中的表现：与妇科肿瘤医生的前瞻性对比研究及其在分级诊疗中的应用价值

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月20日 来源：European Journal of Oncology Nursing 2.7

编辑推荐：

　　【编辑推荐】本研究针对AI在妇科肿瘤领域的应用空白，首次系统评估ChatGPT-4o回答子宫内膜癌问题的表现。通过对比100个临床问题发现，AI在准确性(3.86 vs 3.36)、同理心(3.47 vs 1.66)和完整性(3.00 vs 1.97)上显著优于医生，但存在回答过长(403.51词)和可读性高(Flesch-Kincaid 14-16级)的问题，为AI辅助肿瘤护理提供了实证依据。

在人工智能(AI)席卷医疗领域的今天，ChatGPT等大型语言模型(LLM)正逐步改变患者获取健康信息的方式。子宫内膜癌作为发达国家发病率持续上升的妇科恶性肿瘤，其复杂的分子分型(如子宫内膜样癌和浆液性癌)和个体化治疗需求，对患者教育提出了更高要求。尽管前期研究显示ChatGPT在子宫内膜异位症(91.4%准确率)和癌症谣言破解方面表现优异，但其在肿瘤治疗指导中的可靠性仍存疑，特别是回答长度常超400词且需大学以上阅读能力(Flesch-Kincaid 14-16分)，可能影响患者理解。

这项发表在《European Journal of Oncology Nursing》的研究开创性地将ChatGPT-4o与妇科肿瘤医生的回答进行系统对比。研究人员采用前瞻性设计，从2024年10月1日至15日收集了100个子宫内膜癌相关问题，其中50个涉及初级保健(如风险因素和预防)，50个涉及二级保健(如诊断和治疗)。所有问题均由ChatGPT-4o和资深妇科肿瘤医生分别作答，再由两位独立肿瘤专家从准确性、同理心和完整性三个维度进行盲法评估，同时计算可读性分数和词数统计。

关键技术方法包括：1)通过专家共识确定100个临床高频问题；2)采用Likert 4分量表(1=完全错误至4=全面正确)进行双盲评估；3)使用Flesch-Kincaid量表评估文本可读性；4)统计学分析采用Mann-Whitney U检验比较组间差异。

研究结果揭示：
• 准确性比较：ChatGPT-4o平均得分(3.86±0.47)显著高于医生(3.36±0.75)，其"全面且正确"回答占比达91%，远高于医生的49%。
• 同理心表现：AI在情感支持方面展现优势(3.47 vs 1.66)，尤其在初级保健场景中差异更显著。
• 内容完整性：ChatGPT-4o提供的信息更系统全面(3.00 vs 1.97)，但二级保健问题的准确性略低于初级保健。
• 可读性分析：两者均需高等教育水平才能理解，但AI回答长度是医生的16倍(403.51 vs 25.06词)。

讨论部分指出，ChatGPT-4o展现的"三位一体"优势——高准确性、强同理心和完整信息，使其有望成为肿瘤护士的得力助手。特别是在初级保健场景中，AI能有效分担常见咨询压力，让医护人员更专注于复杂临床决策。研究同时强调需警惕"信息过载"风险，建议未来开发应注重响应定制化，例如根据患者教育水平自动调节回答详略程度。

该研究基于技术接受模型(TAM)框架，证实了AI工具在肿瘤护理中的实用价值。这些发现不仅为子宫内膜癌患者教育提供了新思路，更对AI在分级诊疗体系中的定位具有启示意义——既能作为初级保健的信息守门人，又可成为二级保健的决策支持工具。后续研究应着重优化AI输出的简明性和情境适应性，真正实现"精准健康传播"。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号