
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用流行的生成式人工智能聊天机器人揭穿关于复杂区域疼痛综合征的误区并开展患者教育
《A&A Practice》:Debunking Myths and Patient Education About Complex Regional Pain Syndrome Using Popular Generative Artificial Intelligence Chatbots
【字体: 大 中 小 】 时间:2025年11月05日 来源:A&A Practice 0.6
编辑推荐:
本研究比较了ChatGPT、Gemini、Llama生成的CRPS患者教育材料与传统机构资源的准确性和可读性,发现传统资源在全面性上更优,但AI在特定指标表现良好,提示两者互补。
复杂区域疼痛综合征(CRPS)是一种具有复杂病理生理学的慢性疼痛疾病,严重影响患者的生活质量。有效的患者教育对于管理CRPS至关重要,但现有的资源往往缺乏可读性和易用性,导致许多错误观念的持续存在。本研究评估了人工智能生成的患者教育材料(PEMs)与传统在线资源相比,在准确性、可读性、完整性、情感表达以及纠正错误观念方面的能力。
采用比较设计方法,评估了由三个AI聊天机器人(ChatGPT、谷歌的Gemini和Meta的Llama)生成的患者教育材料与传统在线资源(来自克利夫兰诊所和梅奥诊所)的表现。可读性通过Flesch阅读难度指数、Gunning Fog指数、Flesch-Kincaid年级水平指数和SMOG指数进行评估。准确性和完整性由五位疼痛专家使用李克特量表(1-5分)进行评估。情感分析用于测量情感表达,同时通过敏感性、特异性等指标比较AI聊天机器人在纠正15个常见CRPS错误观念方面的能力。
克利夫兰诊所生成的患者教育材料在准确性方面表现最佳(平均分为4.8±0.40,显著优于Gemini(3.4±0.49,P=0.004)和Llama(3.6±0.49,P=0.014)。克利夫兰诊所的材料在完整性上也更高(4.8±0.40,对比Gemini为3.8±0.40,P=0.031;对比Llama为3.6±0.49,P=0.008)。Gemini的可读性较高(Flesch得分为62,而其他AI生成的材料得分均低于52),但在纠正错误观念方面的特异性较低(66.67%)。ChatGPT的特异性最高(100%)。情感分析显示,Gemini生成的内容最积极(情感得分为83分),而克利夫兰诊所的材料则呈中性(情感得分为-8.0分)。
人工智能生成的患者教育材料作为CRPS患者教育的有效工具具有潜力,能够提供准确且易于理解的内容。然而,来自知名机构的传统在线资源仍能提供更全面的信息。该研究强调了AI在补充传统在线教育资源方面的潜力,但需要进一步验证和改进才能优化其在临床实践中的应用。