
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用ChatGPT优化肿瘤学干预Cochrane系统评价通俗摘要的可读性与情感表达:一项横断面研究
【字体: 大 中 小 】 时间:2025年06月06日 来源:JMIR Cancer 3.3
编辑推荐:
推荐:为解决Cochrane肿瘤学系统评价通俗摘要(PLS)可读性不足、情感表达欠缺的问题,研究人员采用ChatGPT-4通过三种提示词重构PLS。结果显示AI生成文本SMOG指数(8.2-11.4)显著低于原版(13.1),且提升了情感语调(54.8 vs 22.1)与真实性,同时保持证据结论一致性,为医学知识传播提供了自动化解决方案。
在肿瘤治疗决策中,患者参与度日益提升,但复杂的医学信息成为关键障碍。Cochrane系统评价虽提供面向公众的通俗摘要(Plain Language Summary, PLS),但现有研究显示这些摘要存在双重困境:阅读难度远超美国医学会推荐的六年级水平(SMOG指数中位数13.1),且语言缺乏情感共鸣。更棘手的是,约半数癌症患者难以理解治疗方案的科研文献,而传统人工优化方案成本高昂且效率低下。这种信息鸿沟直接影响患者依从性和临床结局,凸显出开发自动化解决方案的紧迫性。
来自克罗地亚的研究团队开展了一项开创性研究,探索大型语言模型ChatGPT-4在重构肿瘤学PLS中的潜力。研究人员从Cochrane图书馆提取275篇肿瘤干预系统评价的科学摘要及对应PLS,通过三类提示词指令让AI生成新版本:1)指定SMOG指数为6的改写;2)增强情感表达;3)通用简化指令。采用SMOG指数、语言查询与词数统计(Linguistic Inquiry and Word Count, LIWC)软件量化分析文本特征,并由两名评估者独立验证结论一致性。
关键技术方法包括:1)基于275篇肿瘤学Cochrane评价构建数据集;2)ChatGPT-4三阶段提示词生成策略;3)SMOG指数评估可读性;4)LIWC分析情感语调等语言特征;5)Friedman非参数检验比较组间差异。
研究结果呈现多重突破:
可读性提升:第一提示词生成的PLS最短(中位240词)且最易读(SMOG 8.2),较原版(364词,SMOG 13.1)显著优化,虽未达目标SMOG 6,但已接近美国国立卫生研究院推荐标准。
情感表达进化:所有AI生成文本情感语调中位数达54.8(原版仅22.1),其中第二提示词版本情感得分最高(63.9),但伴随可读性下降(SMOG 11.4)。值得注意的是,要求"更情绪化"的提示反而使分析性语调升高至85.7,揭示情感与复杂性间的微妙平衡。
语言特征转型:AI文本呈现"三升一降"特征——真实性(50.5 vs 28.6)、确信度(67.2 vs 50.0)、情感表达显著提升,分析性语调(55.9 vs 95.5)大幅降低,使文本更具亲和力。
结论保真度:关键发现是AI重构未改变原始科学结论的分类(阳性/阴性/不确定),证明技术可在保持科学严谨性前提下优化表达形式。
讨论部分指出,这项发表于《JMIR Cancer》的研究标志着AI在医学知识转化中的里程碑。ChatGPT生成的PLS语言特征更接近专业撰写的新闻稿,解决了长期存在的"科学语言鸿沟"。但研究也揭示局限性:依赖摘要而非全文可能导致细节缺失,且文化适应性有待验证。作者建议将AI作为Cochrane作者辅助工具,而非替代人工,并强调需建立监督机制确保信息准确性。这项研究为实现"以患者为中心"的循证医学传播提供了可扩展路径,其方法论框架可拓展至其他医学领域的多语言PLS生成,最终助力全球健康素养提升。
生物通微信公众号
知名企业招聘