
-
生物通官微
陪你抓住生命科技
跳动的脉搏
生成式人工智能在抗抑郁药减量临床咨询中的应答能力评估:准确性、完整性与安全警示分析
【字体: 大 中 小 】 时间:2025年06月25日 来源:Research in Social and Administrative Pharmacy 3.7
编辑推荐:
随着精神科用药需求激增,抗抑郁药减量(tapering)成为患者线上咨询热点。本研究首次系统评估GPT-4模型应对抗抑郁药减量临床咨询的表现,发现其应答相关性达100%但存在剂量计算错误、虚构文献等"AI幻觉"现象,强调医疗专业人员不可替代的监管作用。
在精神健康领域,抗抑郁药处方量正以每年4%的速度增长,仅英格兰地区过去十年处方量就从4730万飙升至8560万。然而约30-60%的长期用药者缺乏明确临床指征,且患者常因体重增加、性功能障碍等副作用尝试自行停药。传统减量方案缺乏标准化指导,迫使患者转向网络论坛获取信息,但这类渠道存在严重质量隐患。
针对这一临床痛点,研究人员开展了一项开创性研究,评估GPT-4模型应对抗抑郁药减量咨询的能力。研究团队从NICE指南、皇家精神科医师学会文件及患者论坛提炼10个核心问题,涵盖停药时机、双曲减量法(hyperbolic tapering)、停药症状鉴别等关键场景。通过标准化提示词在GPT-4模型进行两轮独立查询,采用四维评估体系(相关性、准确性、完整性、清晰度)对答案进行双盲评价。
关键技术方法包括:1)基于临床指南和患者优先议题构建10项标准化咨询问题;2)采用GPT-4模型进行两次独立查询以评估应答一致性;3)参照NICE指南等权威文献建立评估矩阵;4)双研究者背对背评价机制;5)对AI提供的参考文献进行真实性核验。
研究结果揭示:
讨论部分指出,尽管GPT-4展现出临床咨询的潜力,但其在剂量计算(如将10mg西酞普兰减量方案错误表述)、专业概念解释(如将双曲减量误为对数模型)等方面的缺陷可能引发用药风险。研究特别强调,AI倾向于引用维基百科等非同行评议来源,在回答"哪些抗抑郁药更易引发停药症状"时,竟遗漏文拉法辛(venlafaxine)等高危药物。
该研究的价值在于首次建立了抗抑郁药减量AI应答的评估框架,为后续研究提供方法论基础。作者Miriam Boland等提出,需要开发专门的评估工具监测"模型漂移"(model drift),并建议将AI定位为临床决策的辅助工具而非替代方案。这些发现对正在制定中的AI医疗应用监管政策具有重要参考意义,尤其警示需建立防止"AI幻觉"的核查机制。论文发表于《Research in Social and Administrative Pharmacy》,为数字心理健康时代的人机协作模式提供了关键实证依据。
生物通微信公众号
知名企业招聘