
-
生物通官微
陪你抓住生命科技
跳动的脉搏
ChatGPT-4o在子宫内膜癌患者咨询中的表现:与妇科肿瘤医生的前瞻性对比研究及其在分级诊疗中的应用价值
【字体: 大 中 小 】 时间:2025年07月20日 来源:European Journal of Oncology Nursing 2.7
编辑推荐:
【编辑推荐】本研究针对AI在妇科肿瘤领域的应用空白,首次系统评估ChatGPT-4o回答子宫内膜癌问题的表现。通过对比100个临床问题发现,AI在准确性(3.86 vs 3.36)、同理心(3.47 vs 1.66)和完整性(3.00 vs 1.97)上显著优于医生,但存在回答过长(403.51词)和可读性高(Flesch-Kincaid 14-16级)的问题,为AI辅助肿瘤护理提供了实证依据。
在人工智能(AI)席卷医疗领域的今天,ChatGPT等大型语言模型(LLM)正逐步改变患者获取健康信息的方式。子宫内膜癌作为发达国家发病率持续上升的妇科恶性肿瘤,其复杂的分子分型(如子宫内膜样癌和浆液性癌)和个体化治疗需求,对患者教育提出了更高要求。尽管前期研究显示ChatGPT在子宫内膜异位症(91.4%准确率)和癌症谣言破解方面表现优异,但其在肿瘤治疗指导中的可靠性仍存疑,特别是回答长度常超400词且需大学以上阅读能力(Flesch-Kincaid 14-16分),可能影响患者理解。
这项发表在《European Journal of Oncology Nursing》的研究开创性地将ChatGPT-4o与妇科肿瘤医生的回答进行系统对比。研究人员采用前瞻性设计,从2024年10月1日至15日收集了100个子宫内膜癌相关问题,其中50个涉及初级保健(如风险因素和预防),50个涉及二级保健(如诊断和治疗)。所有问题均由ChatGPT-4o和资深妇科肿瘤医生分别作答,再由两位独立肿瘤专家从准确性、同理心和完整性三个维度进行盲法评估,同时计算可读性分数和词数统计。
关键技术方法包括:1)通过专家共识确定100个临床高频问题;2)采用Likert 4分量表(1=完全错误至4=全面正确)进行双盲评估;3)使用Flesch-Kincaid量表评估文本可读性;4)统计学分析采用Mann-Whitney U检验比较组间差异。
研究结果揭示:
• 准确性比较:ChatGPT-4o平均得分(3.86±0.47)显著高于医生(3.36±0.75),其"全面且正确"回答占比达91%,远高于医生的49%。
• 同理心表现:AI在情感支持方面展现优势(3.47 vs 1.66),尤其在初级保健场景中差异更显著。
• 内容完整性:ChatGPT-4o提供的信息更系统全面(3.00 vs 1.97),但二级保健问题的准确性略低于初级保健。
• 可读性分析:两者均需高等教育水平才能理解,但AI回答长度是医生的16倍(403.51 vs 25.06词)。
讨论部分指出,ChatGPT-4o展现的"三位一体"优势——高准确性、强同理心和完整信息,使其有望成为肿瘤护士的得力助手。特别是在初级保健场景中,AI能有效分担常见咨询压力,让医护人员更专注于复杂临床决策。研究同时强调需警惕"信息过载"风险,建议未来开发应注重响应定制化,例如根据患者教育水平自动调节回答详略程度。
该研究基于技术接受模型(TAM)框架,证实了AI工具在肿瘤护理中的实用价值。这些发现不仅为子宫内膜癌患者教育提供了新思路,更对AI在分级诊疗体系中的定位具有启示意义——既能作为初级保健的信息守门人,又可成为二级保健的决策支持工具。后续研究应着重优化AI输出的简明性和情境适应性,真正实现"精准健康传播"。
生物通微信公众号
知名企业招聘