
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:评估生成式人工智能在心理健康中的应用:能力与局限性的系统评价
【字体: 大 中 小 】 时间:2025年06月06日 来源:JMIR Mental Health 4.8
编辑推荐:
这篇系统评价聚焦生成式人工智能(GenAI)在心理健康领域的应用潜力,通过分析8项研究(2023-2024年)发现,ChatGPT-3.5/4.0、Bard等模型在心理教育(psychoeducation)和情绪觉察(LEAS量表评估)表现突出,但诊断准确性、文化适应性和情感联结仍受限。研究多采用零样本提示(zero-shot prompting),建议未来引入链式思考(CoT)等进阶方法提升评估深度。
全球心理健康专业人员的短缺与COVID-19后激增的需求催生了利用大型语言模型(LLM)的探索。ChatGPT等生成式人工智能(GenAI)因其自然语言处理能力被视为潜在解决方案,但其临床技能模拟程度尚不明确。
基于PRISMA指南的系统评价纳入5数据库的1046篇文献,最终筛选8项符合标准的研究。纳入标准包括:原创性实验设计(如图灵测试、社会认知任务)、聚焦GenAI模型,并明确测量社会认知能力(如共情、情绪觉察)或用户体验。
模型表现两极分化
方法论缺陷
78%研究依赖零样本提示,缺乏复杂场景模拟。例如,一项研究通过输入“如何判断自己是否抑郁?”等单句问题评估性能,未能还原真实诊疗中多技能协同的情境。
建议采用链式思考提示(chain-of-thought prompting)增强复杂任务表现,并开展三项关键研究:
GenAI在心理健康领域呈现“高知识储备、低情境灵活”的特点。突破当前瓶颈需解决文化适应性、评估方法创新和伦理合规三大命题,方能在 clinician-in-the-loop(医生在环)模式下实现安全增效。
生物通微信公众号
知名企业招聘