ChatGPT在腘绳肌损伤常见问题中的应答准确性及可读性调整能力评估

【字体: 时间:2025年06月10日 来源:Arthroscopy, Sports Medicine,and Rehabilitation CS2.7

编辑推荐:

  本研究针对ChatGPT在腘绳肌损伤(hamstring injury)患者教育中的潜在应用,系统评估了其对10个高频问题的应答准确性及可读性调整能力。研究人员通过分级评价体系(A-D级)和Flesch-Kincaid可读性评分(FRES/FKGL)发现,ChatGPT应答准确率达90%(7/10为B级以上),但70%存在信息不完整问题;更重要的是,其能根据指令将应答可读性从默认的10年级水平(FKGL 10.28)精准调整为6年级(FKGL 6.1)或研究生水平(FKGL 17.23),为AI辅助医疗咨询提供了循证依据。

  

在运动医学领域,腘绳肌损伤是最常见的下肢损伤之一,约占运动员下肢伤病的30%,复发率高达12-31%。这种损伤不仅影响运动员的职业生涯,也给普通人群的日常生活带来困扰。随着互联网的普及,越来越多患者倾向于通过网络获取医疗信息,这种趋势在新冠疫情期间尤为明显。然而,网络信息的质量参差不齐,患者往往难以辨别真伪,这给医患沟通带来了新的挑战。

2022年问世的ChatGPT作为新一代人工智能对话模型,以其强大的自然语言处理能力迅速风靡全球。在医疗领域,它展现出作为患者教育辅助工具的潜力,但其在骨科特别是腘绳肌损伤方面的应用效果尚不明确。更关键的是,美国国立卫生研究院(NIH)建议患者教育材料应控制在7-8年级阅读水平,而此前研究显示ChatGPT应答的阅读等级普遍偏高,达到大学水平。这种"专业鸿沟"可能影响患者对信息的理解,进而影响治疗效果。

为解答这些问题,来自某医疗机构的研究团队开展了一项开创性研究。他们从患者教育网站中筛选出10个关于腘绳肌损伤的最常见问题,通过三个实验组评估ChatGPT-4.0的性能:无提示的初始应答、要求调整为7年级阅读水平的应答,以及要求调整为研究生水平的应答。研究采用双盲评价和标准化可读性分析工具,系统评估了应答质量和适应性。

研究方法上,团队首先通过文献回顾确定了评估框架。15个初始问题来自多家机构的患者教育网站,最终筛选出10个最高频问题。每个问题分别进行三种查询模式:基础查询、7年级阅读水平提示查询和研究生水平提示查询。两位骨科住院医师采用改良的DISCERN评分标准独立评估应答质量,分为A(准确充分)到D(错误)四个等级。可读性分析采用Flesch-Kincaid阅读难易度评分(FRES)和年级水平(FKGL)两个指标,前者分值越高表示越易读,后者直接对应美国教育年级。

研究结果呈现出三个重要发现:

  1. 应答准确性方面
    初始查询中,20%应答获评A级(准确充分),70%为B级(准确但不充分),10%为C级(含正确和错误信息)。值得注意的是,关于"腘绳肌损伤症状"和"基本定义"的问题获得最高评价,而"何时恢复活动"的问题因提供无文献支持的康复时间表而被评为C级。

  2. 可读性调整能力
    初始查询的平均FRES为61.64(标准难度),FKGL为10.28,相当于10年级水平。当要求调整为7年级水平后,FRES升至75.2(较易读),FKGL降至6.1;而研究生水平要求的应答FRES骤降至12.08(极难读),FKGL飙升至17.23,显示出惊人的适应性。

  3. 临床相关性分析
    虽然大多数应答(90%)包含准确信息,但普遍存在细节不足的问题。例如在"预防措施"应答中,虽然列出了常规方法,但缺乏针对不同运动项目的个性化建议;"手术指征"应答中未提及关键的肌腱受累数量和回缩程度等决策因素。

讨论部分指出,这项研究首次系统评估了ChatGPT在腘绳肌损伤患者教育中的应用潜力。与既往关于髋关节镜、ACL重建等主题的研究相比,本研究发现ChatGPT在腘绳肌损伤方面的表现更为优秀,准确率提升约10-20%。更重要的是,研究证实通过适当的提示工程(prompt engineering),ChatGPT能够可靠地将应答可读性调整至NIH推荐水平,这一发现对解决"健康素养鸿沟"具有重要意义。

然而,研究也揭示了关键局限:首先,ChatGPT的知识截止于2022年1月,无法纳入最新研究进展;其次,应答质量高度依赖提问方式,存在"垃圾进垃圾出"(GIGO)风险;最后,约40%的应答需要专业医师补充说明才能确保临床适用性。

这项发表在《Arthroscopy, Sports Medicine, and Rehabilitation》的研究为AI辅助医疗咨询提供了重要循证依据。结论强调,虽然ChatGPT目前不能替代专业医疗咨询,但其作为患者教育的补充工具具有独特价值,特别是在可读性调整方面展现的灵活性,为未来开发智能化、个性化的患者教育系统指明了方向。研究者建议医疗机构在使用这类工具时,应建立质量控制机制,并持续更新知识库,以确保信息的准确性和时效性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号