可解释的机器学习模型用于预测首次发病的精神分裂症患者的攻击性行为

《Journal of Psychiatric Research》:Interpretable Machine Learning Model to Predict Aggressive Behavior in First-episode Schizophrenia

【字体: 时间:2025年10月02日 来源:Journal of Psychiatric Research 3.2

编辑推荐:

  精神分裂症首次发作患者攻击行为预测研究采用队列设计,纳入2019-2022年北京安定医院216例患者,通过随机分割70%训练集和30%测试集,构建随机生存森林、Cox比例风险促进和传统Cox模型预测攻击行为,结果显示随机生存森林模型C-index达0.79,时间依赖AUC平均0.91,优于其他模型,且 impulsivity(冲动性)和月收入为关键预测因子。

  
华凡|杨泽熙|余欣怡|王倩|王晓楠|徐佳颖|朱慧萍|高琦
中国北京市安定医院

摘要

背景

本研究旨在利用时间至事件机器学习模型预测首次发作的精神分裂症患者出现攻击性行为的风险。

方法

本研究采用队列研究设计,对象为2019年12月至2022年9月期间在北京安定医院新诊断的精神分裂症患者。基线调查使用了人口统计问卷和社会心理量表,对患者进行24个月的随访以评估其攻击性行为。研究数据被随机分为训练集(70%)和测试集(30%)。开发了三种代表性的生存模型来预测首次发作的精神分裂症患者的攻击性行为,通过一致性指数(C指数)、布里尔评分、敏感性、特异性、阳性预测值(PPV)、阴性预测值(NPV)、精确度-召回率曲线下面积(AUPRC)和时变接收者操作特征曲线下面积(时变AUC)等指标来评估模型性能。使用Shapley加性解释(SHAP)方法确定特征重要性排序。

结果

根据纳入和排除标准,共有216名患者纳入研究,在随访期间有36例(16.67%)出现攻击性行为。在三种模型中,随机生存森林模型表现出最高的预测性能,C指数为0.79,平均时变AUC为0.91,平均AUPRC为0.59。三种模型在每个时间点的预测性能差异具有统计学意义(p < 0.05)。SHAP方法确定高冲动性、较高的月平均收入、较大的家庭规模、失业状态以及较低的EPQ-L分数是影响模型决策的五大因素。

结论

随机生存森林模型有效预测了首次发作的精神分裂症患者的攻击性行为,其中冲动性和月平均收入是最重要的因素。

引言

精神分裂症是一种严重的心理健康问题,其特征是功能障碍、社会隔离和认知障碍(Faden和Citrome,2023)。根据2019年全球疾病负担(GBD)研究,全球精神分裂症的患病率估计为每百万人287.4例,并且近年来呈上升趋势(Collaborators,2022)。这可能导致严重的不良后果。被诊断为精神分裂症谱系障碍的个体大约会有15.37年的潜在生命损失(Chan等人,2023),并且有5%至10%的终生自杀风险(McCutcheon等人,2020)。
攻击性行为是精神分裂症患者的一个主要问题,其患病率为33.3%(Li等人,2020)。此外,许多先前的研究表明,与普通人群相比,精神分裂症患者更容易出现攻击性行为(Gao等人,2023;Soyka,2011)。精神分裂症患者的攻击性行为对其护理和治疗造成了显著负担,导致住院时间延长、入院次数增加以及需要更高剂量的精神药物。这也会导致严重的临床和社会后果(Li、Wen等人,2020;Ose等人,2017;Serrano-Blanco等人,2017;Utz等人,2019)。
与普通人群相比,精神分裂症患者攻击性行为的病因更为复杂和多因素(Herceg等人,2022),例如攻击史(Araya等人,2020)、易怒(Fritz等人,2020)和阳性症状(Sun等人,2023)。Kirchebner等人发现,由于工作能力下降或失业,精神分裂症患者的社会经济状况往往会恶化,从而增加犯罪的可能性(Kirchebner等人,2022)。精神分裂症中的攻击性和暴力行为也可以用病理性症状(如妄想或幻觉)、共病物质使用、社会功能下降和其他临床症状来解释(Soyka,2011)。
机器学习(ML)是人工智能的一个分支,是一系列数据分析方法,能够捕捉复杂数据背后的模式(Mhasawade等人,2021)。近年来,ML在各种医学应用中得到了广泛应用,成为传统统计方法的宝贵补充(Moncada-Torres等人,2021;Qiu等人,2022)。大多数ML模型在复杂的高维数据集背景下比传统模型表现得更好(Huang等人,2023)。通过聚合大量社会人口统计和临床预测因子,机器学习模型可以产生高质量的预测结果(Elshawi等人,2019)。
在这项研究中,我们使用了两种ML模型(随机生存森林和Cox比例风险提升)和一个传统模型(Cox比例风险模型)来预测首次发作的精神分裂症患者是否会表现出攻击性行为以及何时表现出攻击性行为。这是首次使用RSF和CoxBoost构建精神分裂症攻击性行为预测模型的研究。我们的目标是评估机器学习的预测价值和临床实用性,并探索影响精神分裂症患者攻击性行为的因素。

研究设计

本研究采用队列研究设计,对象为2019年12月至2022年9月期间在北京安定医院新诊断的精神分裂症患者。纳入标准如下:1)因首次发作精神分裂症住院时年龄在18-64岁之间;2)符合《国际疾病及相关健康问题统计分类》第十版(ICD-10)的精神分裂症诊断标准(ICD-10代码:F20)(组织,1992);3)自愿参与本研究

患者特征

如表1所示,经过纳入和排除标准后,共有216名精神分裂症患者被纳入研究,其中女性75名(34.7%),男性141名(65.8%)。研究人群的平均年龄为33.50±11.70岁。在整个随访期间,有36例(16.67%)患者出现攻击性行为。所有患者被随机分为训练集和测试集,比例为7:3(训练集n = 149,测试集n = 67)。

讨论

目前关于精神分裂症患者攻击性行为的研究主要集中在使用横断面数据分析其影响因素。基于纵向数据构建预测模型的研究相对较少。在这项队列研究中,我们开发并评估了传统(Cox)和时间至事件ML模型(RSF和CoxBoost)在18个月随访期间预测中国首次发作精神分裂症患者攻击性行为的性能。

结论

随机生存森林模型有效预测了首次发作的精神分裂症患者的攻击性行为,其中冲动性和月平均收入是最重要的因素。

作者贡献声明

杨泽熙:撰写——审稿与编辑,撰写——初稿,调查。华凡:撰写——初稿,正式分析,概念化。徐佳颖:正式分析,数据管理。王晓楠:撰写——审稿与编辑,软件操作。高琦:撰写——审稿与编辑,监督,方法学,资金获取。朱慧萍:调查,数据管理。王倩:撰写——审稿与编辑,调查。余欣怡:撰写——审稿与编辑,软件操作

未引用参考文献

Li等人,2020;Markiewicz等人,2020。

伦理

所有涉及人类受试者的程序均获得了首都医科大学伦理委员会的批准(Z2019SY006)。所有参与研究的患者均自愿参与并提供了书面知情同意书。

资助

本研究由中国国家自然科学基金资助(项目编号:81872688)。

利益冲突声明

作者声明没有利益冲突。

致谢

作者感谢北京安定医院的数据收集合作者李湛江和王虎。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号