大型语言模型赋能甲状腺眼病患者教育:潜力评估与效能革新

【字体: 时间:2025年07月20日 来源:Endocrine 3.0

编辑推荐:

  研究人员针对甲状腺眼病(TED)患者教育材料(PEMs)生成的可及性挑战,开展了大型语言模型(LLMs)如ChatGPT-4o、Claude 3.5和Gemini 1.5的性能评估研究。通过创新提示设计,生成的内容在质量(DISCERN≥4)、可理解性(PEMAT≥70%)、准确性和同理心上表现优异,但行动性(PEMAT Actionability<70%)和可读性(FKGL/SMOG)需提升。该研究证实LLMs能高效改善患者认知,为AI驱动的健康教育解锁新路径。

  本研究聚焦于评估大型语言模型(LLMs)在生成甲状腺眼病(TED)患者教育材料(PEMs)中的效能,旨在提升患者对这一复杂疾病的理解和认知。研究人员巧妙设计不同提示策略,测试了ChatGPT-4o、Claude 3.5和Gemini 1.5的表现:首先生成基于提示A和提示B的TED教育手册,其中提示B特别要求内容简化为六年级学生水平;接着,针对TED常见问题(FAQs),设计标准回答和简化版本,后者通过特定提示优化。所有产出内容在多个维度接受系统评估,包括质量(采用DISCERN工具,得分≥4视为优秀)、可理解性(PEMAT Understandability≥70%为达标)、行动性(PEMAT Actionability<70%表示不足)、准确性(主观评分≥4)和同理心(评分≥4),同时利用在线工具Readable.com分析可读性指标,如FKGL(Flesch-Kincaid Grade Level)和SMOG(Simple Measure of Gobbledygook)。

结果令人振奋:提示A和B生成的手册均在质量、可理解性、准确性和同理心上表现卓越,两者差异不显著,却双双在行动性上栽了跟头(PEMAT Actionability<70%)。可读性方面,提示B的内容虽比提示A更易消化,但优化后仍未能达到理想水平。有趣的是,当对比Google搜索的TED FAQs时,LLMs生成的标准或简化回答均碾压式胜出,准确性和同理心媲美手册水平。

总而言之,大型语言模型作为革新工具,在TED患者教育中展现出强大潜力:它能高效产出高质量、易理解、精准且富同理心的内容,但可读性这块短板还需加把劲补强,以真正解锁患者教育的全民化未来。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号