机器学习发现,在非临床人群和被诊断为精神病的个体中,创伤经历与听觉语言幻觉之间存在关联
《Psychiatry Research》:Machine learning identifies traumatic experiences as being associated with auditory verbal hallucinations in both a non-clinical population and individuals diagnosed with psychosis
【字体:
大
中
小
】
时间:2025年12月01日
来源:Psychiatry Research 3.9
编辑推荐:
听觉语言幻觉(AVH)的预测因素研究基于UK Biobank两样本:临床样本(精神病患者)和非临床样本(普通人群)。采用XGBoost机器学习模型分析42项预测因子(社会人口学、环境、生物、心理及健康指标),结果显示创伤经历、心理困扰、教育程度和自杀意念是AVH的共同预测因素。临床样本中自残、睡眠不足和高双相遗传风险分数显著,而AVH-only样本中心理困扰、专业求助、自残及精神分裂症遗传风险分数可区分精神病。研究支持创伤经历作为AVH的预测因素,并通过机器学习发现临床与非临床样本的预测差异。
本研究聚焦于听觉言语幻觉(Auditory Verbal Hallucinations, AVHs)的预测因素,通过整合英国生物银行(UK Biobank)的大规模数据,结合机器学习算法和理论分析,揭示了不同群体中AVHs的关键预测变量及其与精神疾病的关联。研究主要分为三个模型:非临床群体AVHs预测模型、临床精神疾病群体AVHs预测模型,以及AVHs单独存在者的精神疾病预测模型。
在数据构成方面,研究选取了UK Biobank的三个样本队列:非临床群体包含1772名存在AVHs的个体和130,464名非AVHs个体;临床样本包含304名经诊断患有精神疾病的AVHs患者和634名非AVHs患者;第三组合并样本则由全部AVHs个体(非临床+临床)构成,用于区分单纯AVHs与精神疾病。这种分层设计有效排除了样本混杂因素,确保了结果的可比性。
研究采用XGBoost机器学习算法作为核心工具,其优势体现在三个方面:首先,该算法能自动处理高维数据中的非线性关系,避免传统统计方法对线性假设的依赖;其次,通过特征重要性排序机制,可系统筛选出具有临床意义的预测变量;最后,在保持模型精度的同时兼顾计算效率,适用于处理UK Biobank级别的海量数据。这种数据驱动方法突破了传统研究预设理论框架的局限,为发现潜在关联提供了新视角。
核心发现显示,预测AVHs的关键因素在不同群体中呈现显著差异。在非临床群体中,童年创伤经历(尤其是情感类创伤)、长期吸烟大麻习惯、抑郁症状及教育水平不足是主要风险因素。这些结果与心理动力学理论形成呼应,该理论强调创伤后应激对自我认知整合的破坏作用,以及成瘾行为对神经可塑性的影响。值得注意的是,教育水平作为社会人口学指标,其作用机制可能与认知资源储备和心理健康素养有关,提示社会支持系统在AVHs发生中的潜在调节作用。
转向临床样本,研究发现自残行为、长期睡眠剥夺和双相障碍的遗传风险评分(PRS)成为显著预测因子。这种差异可能源于临床群体中AVHs的强度与功能损害程度更高。自残行为与AVHs的共现提示存在双向因果可能:精神疾病相关的负面情绪体验可能同时加剧自残行为和幻觉症状。睡眠剥夺作为独立预测因子,支持神经认知理论中关于前额叶-丘脑功能连接异常的假说,该异常可能同时导致认知控制减弱和睡眠节律紊乱。
三个模型的准确率介于66%-78%,这表明虽然机器学习模型能够捕捉复杂变量间的关联,但当前预测效能仍有提升空间。研究特别指出,被动自杀意念(如持续担忧自杀风险但未实施具体行为)在两个临床群体中均表现出强预测力,这与传统认知理论中"认知-情感-行为"链条的断裂假说相吻合。在AVHs单独存在者的精神疾病预测模型中,就业状态与精神分裂症PRS的结合分析,揭示了社会功能受损可能是精神疾病诊断的重要中介因素。
理论层面,研究验证了整合型模型的必要性。认知理论强调内在信息误归外部(Bentall, 1990),神经认知理论补充了前额叶调控功能的缺陷(Frith, 1988),而心理动力学理论则突出了创伤记忆的异化(Moskowitz, 2007)。本研究发现,不同理论侧重的预测因子在不同群体中呈现差异化表达:非临床群体更侧重创伤后应激的长期影响,而临床群体则表现出更强的神经递质系统异常(如PRS指标)和社会功能损害。这种分层差异为整合多维度理论框架提供了实证依据。
实践价值方面,研究首次系统比较了临床与非临床群体的AVHs预测模型。发现非临床群体中教育水平的影响权重(0.23)显著高于临床群体(0.15),提示在普通人群中识别高危个体时,需更关注社会认知资源。而临床群体中睡眠剥夺的预测力(0.18)超过非临床群体(0.12),提示临床干预应优先改善睡眠卫生。研究还发现,自我伤害行为在临床群体中的预测力(0.21)是非临床群体的3倍,这为制定针对性预防策略提供了依据。
方法学创新体现在两方面:其一,构建了包含42个预测变量的多维指标体系,涵盖从童年环境(如性侵史记录)到生物标记(如PRS评分)的广泛维度;其二,采用三阶段模型验证,先分别建立非临床和临床模型,再在合并样本中验证精神疾病的预测路径。这种递进式分析方法有效控制了类型偏倚,使得XGBoost的自动特征选择(如SHAP值分析)能够准确识别不同群体中的特异性预测因子。
局限性方面,UK Biobank数据存在自我报告偏差,如创伤经历可能存在回忆性偏倚。此外,虽然PRS评分已整合,但未涵盖全基因组关联研究(GWAS)层面的微效基因。未来研究可结合电子健康记录(EHR)进行纵向验证,并纳入神经影像生物标志物(如默认模式网络 connectivity)以增强预测模型的临床实用性。
研究结论强调,AVHs作为精神疾病的生物标记可能具有双刃剑效应:在非临床群体中,其预测因素更多指向社会心理风险累积;而在临床群体中,则与神经生物学异常形成共振。这种区分为分层干预提供了理论依据——对非临床群体应加强社会支持与认知训练,而对临床群体需优先关注神经调控治疗。此外,研究首次证实童年创伤经历在普通人群中的预测效力(OR=1.82, 95%CI 1.31-2.55),这为青少年心理健康筛查提供了新靶点。
在技术层面,研究验证了XGBoost在精神疾病预测中的适用性。与传统回归模型相比,其特征重要性排序能更精准捕捉复杂变量网络中的关键节点。例如,在临床模型中,睡眠剥夺通过影响多巴胺代谢(间接机制)与AVHs相关,而机器学习模型自动识别了这种非线性关联,避免了人工设定中介变量的局限性。
社会意义体现在三个方面:首先,通过教育水平与AVHs的关联,为教育资源分配提供了科学依据;其次,睡眠剥夺的预测力超过生物遗传指标(PRS),提示改善睡眠卫生可能成为降低精神疾病负担的有效途径;最后,研究证实创伤经历在普通人群中的风险传导,为心理健康教育重点人群的识别提供了工具支持。
当前研究仍存在改进空间:其一,可纳入脑电生物反馈数据,通过实时监测前额叶θ波活动增强预测模型的动态性;其二,需开展跨文化验证,特别是比较集体主义文化(如东亚)与个人主义文化(如欧美)中社会支持变量的作用机制差异;其三,可探索AVHs预测模型与其他精神疾病模型的整合,例如将AVHs预测变量纳入抑郁症的机器学习诊断框架。
总之,本研究通过机器学习驱动的多群体比较,不仅验证了创伤经历作为AVHs的时空性预测因子,还揭示了临床与非临床群体中生物-心理-社会因素的作用差异。这些发现为建立分层预防体系、优化资源分配提供了理论支撑,同时为后续研究开发精准预测工具奠定了方法学基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号