利用ChatGPT优化肿瘤学干预Cochrane系统评价通俗摘要的可读性与情感表达：一项横断面研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月06日 来源：JMIR Cancer 3.3

编辑推荐：

　　推荐：为解决Cochrane肿瘤学系统评价通俗摘要(PLS)可读性不足、情感表达欠缺的问题，研究人员采用ChatGPT-4通过三种提示词重构PLS。结果显示AI生成文本SMOG指数(8.2-11.4)显著低于原版(13.1)，且提升了情感语调(54.8 vs 22.1)与真实性，同时保持证据结论一致性，为医学知识传播提供了自动化解决方案。

在肿瘤治疗决策中，患者参与度日益提升，但复杂的医学信息成为关键障碍。Cochrane系统评价虽提供面向公众的通俗摘要(Plain Language Summary, PLS)，但现有研究显示这些摘要存在双重困境：阅读难度远超美国医学会推荐的六年级水平（SMOG指数中位数13.1），且语言缺乏情感共鸣。更棘手的是，约半数癌症患者难以理解治疗方案的科研文献，而传统人工优化方案成本高昂且效率低下。这种信息鸿沟直接影响患者依从性和临床结局，凸显出开发自动化解决方案的紧迫性。

来自克罗地亚的研究团队开展了一项开创性研究，探索大型语言模型ChatGPT-4在重构肿瘤学PLS中的潜力。研究人员从Cochrane图书馆提取275篇肿瘤干预系统评价的科学摘要及对应PLS，通过三类提示词指令让AI生成新版本：1）指定SMOG指数为6的改写；2）增强情感表达；3）通用简化指令。采用SMOG指数、语言查询与词数统计(Linguistic Inquiry and Word Count, LIWC)软件量化分析文本特征，并由两名评估者独立验证结论一致性。

关键技术方法包括：1）基于275篇肿瘤学Cochrane评价构建数据集；2）ChatGPT-4三阶段提示词生成策略；3）SMOG指数评估可读性；4）LIWC分析情感语调等语言特征；5）Friedman非参数检验比较组间差异。

研究结果呈现多重突破：
可读性提升：第一提示词生成的PLS最短（中位240词）且最易读（SMOG 8.2），较原版（364词，SMOG 13.1）显著优化，虽未达目标SMOG 6，但已接近美国国立卫生研究院推荐标准。
情感表达进化：所有AI生成文本情感语调中位数达54.8（原版仅22.1），其中第二提示词版本情感得分最高（63.9），但伴随可读性下降（SMOG 11.4）。值得注意的是，要求"更情绪化"的提示反而使分析性语调升高至85.7，揭示情感与复杂性间的微妙平衡。
语言特征转型：AI文本呈现"三升一降"特征——真实性（50.5 vs 28.6）、确信度(67.2 vs 50.0)、情感表达显著提升，分析性语调(55.9 vs 95.5)大幅降低，使文本更具亲和力。
结论保真度：关键发现是AI重构未改变原始科学结论的分类（阳性/阴性/不确定），证明技术可在保持科学严谨性前提下优化表达形式。

讨论部分指出，这项发表于《JMIR Cancer》的研究标志着AI在医学知识转化中的里程碑。ChatGPT生成的PLS语言特征更接近专业撰写的新闻稿，解决了长期存在的"科学语言鸿沟"。但研究也揭示局限性：依赖摘要而非全文可能导致细节缺失，且文化适应性有待验证。作者建议将AI作为Cochrane作者辅助工具，而非替代人工，并强调需建立监督机制确保信息准确性。这项研究为实现"以患者为中心"的循证医学传播提供了可扩展路径，其方法论框架可拓展至其他医学领域的多语言PLS生成，最终助力全球健康素养提升。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号