通过基于表格先验数据的拟合网络来区分精神病性重度抑郁与非精神病性重度抑郁

《Journal of Affective Disorders》:Differentiation between psychotic and non-psychotic major depression by the tabular prior-data fitted network

【字体: 时间:2026年02月19日 来源:Journal of Affective Disorders 4.9

编辑推荐:

  基于电子病历数据,本研究采用LASSO算法筛选特征并构建TabPFN模型,旨在区分双相情感障碍中的精神症性抑郁(PMD)与非精神症性抑郁(NPMD)。结果显示,TabPFN模型在AUC(0.798)上优于七种传统机器学习模型,SHAP分析表明甲状腺素(T4)和年龄是关键预测因子,提示年轻患者及T4升高与PMD风险相关。研究验证了TabPFN在精神科诊断中的潜力,其算法优势与简化预处理流程可提升辅助诊断工具的开发效率。

  
郑宏新|甘文新|刘一子|段书雨|李坤|李公平|薛彦秋|谢宇
安徽师范大学认知科学研究中心,中国芜湖

摘要

背景

将精神病性重度抑郁症(PMD)误诊为非精神病性重度抑郁症(NPMD)可能导致治疗效果不佳。本研究旨在利用电子病历(EMR)数据和表格先验数据拟合网络(TabPFN)模型,开发并验证一种基于机器学习的模型,以区分PMD和NPMD。

方法

研究纳入了2020年1月至2025年2月期间共666名PMD患者和808名NPMD患者。首先应用最小绝对值收缩和选择算子(LASSO)算法进行特征筛选,然后基于筛选结果构建TabPFN模型。将TabPFN模型与七种传统机器学习模型进行比较,并使用SHapley加性解释(SHAP)方法解释预测结果。

结果

与其它传统机器学习模型相比,TabPFN模型表现出较强的性能,曲线下面积(AUC)为0.798。根据SHAP值,甲状腺素(T4)与年龄一样是最重要的特征。特别是,T4水平升高和年龄较小与PMD的患病风险增加有关。

局限性

仅使用来自单一中心的电子病历数据可能会限制研究结果的普遍性,使其难以应用于其他临床环境或人群。

结论

与传统的机器学习模型相比,本研究基于LASSO选出的八个重要变量构建的TabPFN模型在辅助诊断PMD和NPMD方面具有很大潜力。由于其独特的算法优势和简单的预处理流程,该模型有助于开发辅助诊断工具,以帮助识别精神疾病。

引言

重度抑郁症(MDD)是最常见的精神疾病之一,其核心临床特征包括反复发作的抑郁症状、情绪低落、兴趣减退、认知功能受损、睡眠障碍和食欲紊乱(Otte等人,2016年)。MDD可分为两类:非精神病性重度抑郁症(NPMD)和精神病性重度抑郁症(PMD)(Schatzberg和Rothschild,1992年)。流行病学研究表明,PMD的终生患病率在0.35%至1%之间(J??skel?inen等人,2018年),而在MDD患者中,PMD的患病率高达20%–30%(Yan等人,2022年)。PMD也被称为伴有精神病症状的抑郁发作,这些症状可能是间歇性的或持续性的,核心特征包括触觉、躯体、妄想、听觉和内疚相关的幻觉(Dubovsky等人,2021年;Nelson等人,2018年)。
研究表明,与NPMD相比,PMD患者通常表现出更严重的抑郁症状、更高的自杀风险、更差的临床进程、更高的复发率以及更严重的社会功能损害和较差的治疗效果(Gaudiano等人,2009年;Palj?rvi等人,2023年;Rothschild,2003年)。然而,在大约三分之一的PMD患者中,精神病症状可能被临床忽视而未能得到准确诊断(Liu等人,2024年;Palj?rvi等人,2023年)。这种误诊常常导致治疗延误和预后不良,并可能增加自杀、暴力行为等不良事件的风险(Palj?rvi等人,2023年)。目前区分PMD和NPMD的鉴别诊断仍依赖于临床访谈和患者主观症状的评估。这些方法具有主观性、耗时且灵敏度较低,导致许多PMD病例未能被准确识别(Chen等人,2024年)。因此,迫切需要开发能够整合电子病历(EMR)数据和先进算法的临床可行诊断模型,以辅助诊断PMD和NPMD。
机器学习(ML)作为一种利用计算机系统分析数据的技术,在医学图像分析、疾病预测和个性化治疗等领域已成为重要工具(Asif等人,2024年;Banegas-Luna等人,2021年;Chen等人,2024年)。与传统诊断方法相比,ML在区分PMD和NPMD方面具有显著优势,能为临床医生提供更可靠的诊断结果(Asif等人,2024年)。此外,SHapley加性解释(SHAP)值提供了一种清晰直观的方式,用于解释不同特征对模型预测结果的影响,有效解决了ML模型缺乏透明度的问题(Li,2022年;London,2019年)。
已有研究应用ML算法识别区分PMD和NPMD的生物标志物和临床特征(Liu等人,2023年;Park等人,2014年;Yan等人,2022年)。Park等人(2014年)使用逻辑回归(LR)算法分析了PMD和NPMD患者的心理特征,发现高水平的紧张、兴奋和自杀念头可能是PMD的独立相关因素。Liu等人(2023年)应用LR分析证实,HAMA评分、HAMD评分和TSH可以作为区分PMD和NPMD的有效指标。Yan等人(2022年)也使用LR分析发现,三酰甘油可能是区分PMD和NPMD的潜在生物标志物。
上述研究为区分PMD和NPMD提供了新的思路,但仍存在一些局限性。大多数研究的样本量较小,且仅使用了LR算法,这可能影响模型在临床应用中的泛化能力(Sufriyana等人,2020年)。例如,Huang等人(2025年)选取了51名NPMD患者和49名PMD患者,并使用LR算法构建了诊断模型,其曲线下面积(AUC)仅为0.781,表明诊断准确性有限。此外,现有的研究方法相对单一,未能充分利用不同ML算法在处理复杂问题时的独特优势,导致模型多样性不足,从而影响预测结果的准确性和可靠性(Huang等人,2020年;Sarker,2021年)。
表格先验数据拟合网络(TabPFN)模型有效解决了研究中算法多样性不足导致的性能限制(Hollmann等人,2025年)。TabPFN适用于中小型表格数据,其主要功能包括分类、回归和数据生成。通过上下文学习机制,TabPFN在特定任务中能够做出更高效的预测(Dong等人,2022年)。与传统机器学习模型相比,TabPFN在默认配置和优化配置下都表现良好,尤其是经过超参数调整后,其性能提升显著超过传统模型(Hollmann等人,2025年)。将TabPFN模型与传统机器学习模型结合进行性能比较,不仅提高了诊断准确性,还解决了现有研究中算法多样性不足的问题。将TabPFN应用于区分PMD和NPMD,可以为识别和治疗心理健康问题提供更高效可靠的解决方案,并促进科学研究和临床实践的进一步发展。
在本研究中,首先应用最小绝对值收缩和选择算子(LASSO)算法进行特征筛选,然后基于筛选结果构建TabPFN模型。为了全面评估模型性能,我们绘制并分析了接收者操作特征(ROC)曲线、精确度-召回率(PRC)曲线、决策曲线和混淆矩阵。此外,还将TabPFN模型的性能与七种传统机器学习模型进行了比较,并使用SHAP方法解释了模型预测结果。本研究的目标是构建一个高精度的区分模型,并提供可视化和可解释的分析。

数据收集

本研究选取了2020年1月至2025年2月期间入住安徽省合肥市第四人民医院的患者作为研究对象。纳入标准如下:(1)根据《国际疾病分类》(ICD-10)诊断为PMD或NPMD;(2)入院次日完成血液和生化检查。排除标准如下:(1)共病精神疾病;(2)严重身体疾病

特征描述性分析

表1显示了PMD(n=666)和NPMD(n=808)之间的差异。两组在自杀念头(χ2=6.637,p<0.01)和婚姻状况(χ2=156.043,p<0.01)方面存在显著差异。与PMD组相比,NPMD组年龄显著更大(Z=-16.035,p<0.001),病程也更长(Z=-4.652,p<0.001)。(见图1。)(见表2。)

特征选择

为了识别和区分与PMD和NPMD最相关的变量,本研究进行了训练

讨论

本研究使用TabPFN模型构建了一个用于区分PMD和NPMD的预测模型。通过LASSO方法从38个特征中筛选出潜在的生物标志物,并对这些特征进行了分析。结合这些筛选出的预测特征,研究使用了七种传统机器学习算法与TabPFN模型共同构建了诊断模型,并通过多种定量指标评估了其性能。结果表明,TabPFN模型

CRediT作者贡献声明

郑宏新:撰写——审稿与编辑、初稿撰写、可视化、验证、监督、软件开发、资源管理、项目统筹、方法论设计、研究实施、资金获取、数据分析、概念化。甘文新:撰写——审稿与编辑、初稿撰写、可视化、验证、数据分析、概念化。刘一子:撰写——审稿与编辑、初稿撰写、可视化、验证

资助声明

本研究得到了中国电信股份有限公司安徽分公司的支持,项目名称为“面向中小学和高等教育的综合智能心理健康教育研究项目”(项目编号:24AHEKYF5020)。

未引用参考文献

Asif等人,2025年

利益冲突声明

本文不存在利益冲突。

致谢

本研究得到了中国电信股份有限公司安徽分公司的支持,项目名称为“面向中小学和高等教育的综合智能心理健康教育研究项目”(项目编号:24AHEKYF5020)。资助方未参与研究的设计与实施、数据收集与分析、数据解释、手稿的编写与审核或发表决策。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号