基于医疗大数据与机器学习的严重精神障碍人群风险筛查模型构建与验证

【字体: 时间:2025年07月19日 来源:Schizophrenia Research 3.6

编辑推荐:

  本研究针对美国约3%人群罹患的严重精神障碍(SMIs),创新性地利用商业医保索赔数据(77.4百万样本)和八家医院电子健康档案(EHRs),开发出可扩展的机器学习筛查工具。模型在独立测试集中表现优异(保险数据AUC 0.76,EHR数据AUC 0.83),首次证实了跨数据源的模型迁移能力,为大规模精神障碍早期筛查提供了切实可行的解决方案。

  

在当代精神健康领域,严重精神障碍(Severe Mental Illnesses, SMIs)如同潜伏的冰山,影响着全球约3%人口的生活质量。这类疾病包括精神分裂症(schizophrenia)、分裂情感障碍(schizoaffective disorders)和双相情感障碍(bipolar disorders)等,其早期症状隐匿且诊断复杂,传统依靠临床访谈的筛查方式难以应对大规模人群需求。更棘手的是,现有医疗系统中分散的电子健康档案(EHRs)和保险索赔数据如同未开发的矿藏,缺乏有效的挖掘工具。

哈佛医学院生物医学信息系(Harvard Medical School, Department of Biomedical Informatics)与麻省总医院的研究团队率先破局。他们构建了首个基于人工智能的SMIs预测模型,这项发表在《Schizophrenia Research》的研究,犹如在数据迷宫中点亮了指路明灯。研究人员巧妙运用深度神经网络技术,分别处理了美国Aetna保险公司77.4百万参保人的索赔数据,以及麻省八家教学医院的EHRs数据,通过对比分析301,221例SMIs患者与近300万对照样本,揭示了机器学习在精神健康筛查中的突破性潜力。

关键技术路线包含三个核心环节:首先建立病例对照队列(保险数据含301,221病例/2,439,890对照;EHR含59,319病例/297,993对照),其次开发基于诊断代码、用药记录和人口特征的神经网络模型,最后通过交叉验证评估模型在特定场景(如18岁青年群体)的适用性。

主要结果
Abstract
研究证实SMIs预测模型在保险数据测试集达到AUC 0.76(灵敏度61.9%,特异度79.1%),EHR数据表现更优(AUC 0.83,灵敏度66.4%,特异度85.1%)。

Study cohort
队列分析显示保险数据平均随访25个月(SD 27.1),模型对青年群体12个月风险预测优于规则基准方法,但在物质滥用相关病例中稍逊。

Accuracy of SMIs risk screening model
跨数据源验证表明,基于保险数据训练的模型可有效迁移至EHR环境,反之亦然,证实了医疗大数据的协同效应。

这项研究的里程碑意义在于:首次实现SMIs筛查工具从"象牙塔"到"现实世界"的跨越。相比传统量表筛查,该方案可直接整合到现有医疗信息系统,无需额外检查设备。特别值得注意的是,模型在18岁临界年龄群体的优异表现,为青春期精神障碍早期干预提供了黄金窗口。尽管在物质滥用亚群中表现有待提升,但研究揭示的"数据-模型"双轮驱动范式,已然为全球精神卫生防控体系升级指明了方向。正如作者Dianbo Liu团队强调的,这种可扩展的筛查工具将重塑SMIs防治格局——从被动治疗转向主动预防,从专科诊疗转向全民覆盖。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号