
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大语言模型聊天机器人在风湿病医疗中的应用现状:一项揭示医患认知差异的横断面调查
【字体: 大 中 小 】 时间:2025年07月13日 来源:Rheumatology Advances in Practice
编辑推荐:
为解决LLM-chatbots在风湿病医疗中的准确性争议及患者使用行为不明确的问题,加拿大阿尔伯塔大学联合关节炎患者组织ACE开展了一项横断面调查(n=270)。研究发现:44%的风湿病患者已使用LLM-chatbots(如ChatGPT),其中15%涉及健康咨询,但多限于通用查询而非个人医疗问题;年轻群体(aOR=4.20, 95%CI 2.09-8.39)和自由主义倾向者(aOR=2.23, 95%CI 1.33-3.71)使用率更高。该研究警示需紧急开发风湿病领域专用AI工具以规避误诊风险,成果发表于《Rheumatology Advances in Practice》。
在人工智能(AI)席卷医疗领域的浪潮中,大型语言模型聊天机器人(LLM-chatbots)如ChatGPT、Claude和Copilot以其强大的自然语言处理能力,为健康咨询提供了新途径。然而,风湿病学作为涉及全身多系统、临床表现复杂的专科,其诊疗高度依赖专业经验。当前全球面临风湿科医生短缺的困境,而LLM-chatbots在回答专业问题时的准确性却存疑——研究显示,患者对AI生成答案的满意度与医生回答相当,但专科医生却发现其中存在关键错误。更令人担忧的是,患者无法辨别答案来源。当数百万风湿病患者开始向AI寻求健康建议时,这种认知鸿沟可能引发误诊风险。
为厘清LLM-chatbots在风湿病群体中的真实使用现状,加拿大阿尔伯塔大学(University of Alberta)联合患者倡导组织"关节炎消费者专家"(ACE),开展了一项创新性的双模横断面调查。研究人员通过在线社交平台与线下诊所同步招募270名风湿病患者(109名在线+161名线下),采用18项问卷探究其使用行为及社会人口学关联。研究发现:近半数(44%)患者已使用LLM-chatbots,其中15%涉及健康咨询。令人意外的是,使用者主要查询通用健康知识(70%),而非个人医疗问题(仅35%);政治倾向更自由者使用概率翻倍(aOR=2.23),而年轻患者使用率是年长者的4.2倍(aOR=4.20)。这一结果发表于《Rheumatology Advances in Practice》,为AI医疗工具的开发敲响警钟。
双模招募策略:通过ACE组织邮件/社交媒体(覆盖约5万人)在线招募,同步在埃德蒙顿风湿科诊所进行纸质问卷发放,确保样本多样性。
分层统计分析:采用卡方检验评估社会人口学变量与AI使用的粗关联,通过多变量逻辑回归计算调整后比值比(aOR),年龄/收入等有序变量进行线性趋势检验。
混合内容分析:对"AI使用犹豫"的开放式回答进行主题编码(如隐私顾虑、偏好人工服务等),结合Likert量表量化患者对AI医疗应用的接受度(0-10分)。
1. AI使用行为的分化特征

在线受访者使用率(74%)显著高于线下(24%),反映数字鸿沟。15%用户将AI用于健康咨询,但仅3.5%会验证咨询专业医疗的必要性。未使用者中,39%明确拒绝AI,11%因"不信任AI答案"(26%)或"担忧隐私"(22%)而犹豫。
2. 健康咨询的潜在风险点

健康咨询者中,70%仅搜索通用信息(如"类风湿关节炎是什么"),仅35%涉及个人健康问题(如生育影响)。值得注意的是,50%用户用AI解答药物相互作用等专业问题,但患者无法评估答案可靠性——此前研究证实,AI在回答复杂风湿问题时错误率高达34%。
3. 社会因素驱动使用差异
政治倾向每向自由主义偏移一级,使用概率上升123%(p=0.002);18~29岁群体使用率超70岁者4倍。与传统认知相反,性别、收入、教育水平及语言背景未显著影响使用行为,暗示AI普及正突破传统技术接纳壁垒。
4. 患者对AI医疗角色的矛盾认知

患者最支持AI处理行政事务(中位数评分7/10),但对诊断功能持保留态度(中位数5/10)。这种"功能分层接受"现象反映公众期待AI辅助而非替代医生——当涉及诊疗决策时,人类专业判断仍不可替代。
本研究首次揭示:LLM-chatbots已成为风湿病管理的"隐形第二诊疗意见",但患者使用行为存在显著安全隐患。年轻群体更易接纳AI,却缺乏甄别错误信息的能力;而AI在复杂风湿问题中的知识盲区(如药物相互作用、罕见病表现)可能引发误判。基于此,研究团队提出三大变革方向:
开发风湿病专用AI工具:采用检索增强生成(RAG)技术限定知识来源,整合开源医学LLM(如Meditron)提升透明度,并通过"人类-AI协作"机制确保高风险问题转交医生。
构建患者教育框架:针对"70%用户仅用AI查基础信息"的特点,设计AI辅助的疾病教育模块,同时训练患者识别答案可靠性指标(如引用文献、置信度提示)。
消除技术接纳差异:尽管当前未发现种族/语言壁垒,仍需开发多语言界面及无障碍功能,避免技术红利局限于特定群体。
该研究犹如一剂清醒剂:当44%的患者已拥抱AI医疗时,行业必须加速填补专业AI工具的空缺。正如作者警示:"在风湿病领域,一个错误答案的成本可能是不可逆的关节损伤——我们没有试错的时间。"
生物通微信公众号
知名企业招聘