利用自然主义驾驶行为与机器学习识别老年人重度抑郁症的前沿探索

【字体: 时间:2025年02月16日 来源:npj Digital Medicine 12.4

编辑推荐:

  为解决老年人抑郁症漏诊及缺乏有效筛查方法的问题,华盛顿大学医学院研究人员开展通过自然主义驾驶行为和机器学习识别老年人 MDD 的研究。结果显示该方法有效,这为抑郁症诊断提供新思路,强烈推荐科研读者阅读。

  
华盛顿大学医学院(Washington University School of Medicine)的研究人员在《npj Digital Medicine》期刊上发表了题为 “Identifying major depressive disorder in older adults through naturalistic driving behaviors and machine learning” 的论文。这篇论文在老年抑郁症诊断领域具有重要意义,为寻找客观且经济有效的诊断方法提供了新的思路和方向,有望改善老年抑郁症患者的心理健康状况,同时提升道路驾驶安全水平。

一、研究背景


抑郁症在老年人中常常被漏诊,这一现象带来了诸多不良后果,其中就包括机动车碰撞事故风险的增加。在美国,老年司机群体不断壮大,如何创新筛查方法,精准识别出那些健康状况可能下降、面临较高风险的老年人,成为了亟待解决的问题。

从全球范围来看,抑郁症的影响不容小觑。2022 年,美国抑郁症患病率达 13%,由此产生的经济负担估计高达 2330 亿美元(按 2016 年美元计算),且女性患病率高于男性。在美国,14.4% 的老年人受到重度抑郁症(Major Depressive Disorder,MDD)的影响,其中 5.4%(220 万)被确诊为现患 MDD,9.0%(370 万)有过 MDD 病史。全球范围内,对 48 项研究的荟萃分析发现,约 28% 的老年人受到抑郁症的困扰。

在医疗诊断场景中,MDD 经常被漏诊和未治疗。在初级保健诊所,6% - 9% 的老年患者患有抑郁症,但在疗养院居民中,这一比例上升至 12% - 14%。抑郁症的症状与认知能力下降的症状存在重叠,比如记忆障碍、注意力难以集中、思维迟缓等,这些症状既是抑郁症的表现,也是轻度认知障碍(Mild Cognitive Impairment,MCI)和早期阿尔茨海默病(Alzheimer’s Disease,AD)的核心临床特征。反过来,MCI 和早期 AD 也可能出现情绪变化,如冷漠或退缩,这又常被误认为是抑郁症。这种诊断上的模糊性,极易导致治疗延迟或不当,进而加重患者的病情。有研究报道,约 32% 被诊断为 MCI 的人同时也经历着抑郁症状。所以,早期精准诊断对于确保患者接受有效、个性化的治疗至关重要。

另外,MDD 与驾驶表现不佳密切相关,会使驾驶员转向反应时间变慢,增加撞车风险。老年司机,尤其是 65 岁以上的司机,本身就更容易卷入交通事故,随着老年人口的增长,这一风险还会进一步上升。除了年龄因素,视力下降、反应迟缓、注意力不集中、记忆受损等因素,再加上药物副作用以及痴呆、抑郁症等疾病的影响,都大大增加了老年司机的撞车风险。抗抑郁药的嗜睡等副作用也会影响驾驶安全。研究发现,在两年半的随访期内,患有抑郁症的老年人在标准化道路测试中获得边缘评级或不合格的可能性是未患抑郁症老年人的三倍。

当前用于筛查老年人抑郁症的方法存在诸多不足。由于症状与其他常见疾病(如 MCI、AD)或药物副作用重叠,现有的筛查措施缺乏特异性和敏感性。而且,老年人受社会污名化、对心理健康的传统观念影响,或者因分不清疲劳、睡眠障碍等症状是衰老的正常表现还是抑郁症症状,不太愿意主动报告情绪困扰并寻求心理健康治疗。

在这样的背景下,通过研究老年人在自然驾驶过程中的行为,利用其作为潜在的诊断指标,具有重要的现实意义。因为驾驶不仅是老年人保持独立生活、获得生活满意度和维持社交联系的重要方式,而且自然主义驾驶数据有可能像一种功能性数字神经行为标记物,为人工智能识别老年人抑郁症提供新的途径。

二、研究方法


研究人员采用了一系列先进的技术方法来开展此项研究。

  1. 数据收集:参与者来自华盛顿大学医学院关于衰老、驾驶和抑郁症的纵向研究项目(R01AG068183,R01AG067428)。他们需要满足一系列条件,如年龄在 65 岁及以上、认知正常(临床痴呆评定量表 CDR 为 0)、拥有有效驾照、每周至少驾驶一次,并完成年度临床和神经心理学评估。参与者提供了书面知情同意书,研究程序也获得了华盛顿大学人类研究保护办公室的批准(202010214,202003209)。

自然主义驾驶数据的收集借助了驾驶现实车载评估系统(Driving Real-world In-Vehicle Evaluation System,DRIVES)。通过商业 GPS 数据记录器(G2TrackingDevice?,AzugaInc,San Jose,CA),利用 GPS、加速度计和陀螺仪,从老年人的私人车辆中收集驾驶行为数据。该数据记录器由车辆电池供电,插入车辆的 OBDII 端口,从点火到熄火,每 30 秒传输一次数据。行程总结报告包含日期、时间戳、GPS 位置、车速以及加速度计触发的事件,如超速、急刹车和突然加速等。研究收集了 2022 年 7 月 1 日至 2024 年 7 月 1 日的数据,每个参与者至少有 10 个月的驾驶数据,以涵盖一年中的大部分时间,同时排除了与他人共用车辆的参与者。

抑郁症状态的确定则是由临床医生根据 MDD 诊断,并通过患者健康问卷 - 9(Patient Health Questionnaire - 9,PHQ - 9)评分进行确认。PHQ - 9 评分达到 10 分或以上,对应中度至重度抑郁症,这类参与者被归类为抑郁症患者;自我报告无 MDD 且 PHQ - 9 评分为 0 的参与者则被归为非抑郁症患者。

人口统计学数据(年龄、性别、受教育年限)和药物使用数据通过参与者自我报告收集,药物分类依据美国医院处方集服务分类系统。其中,抗抑郁药使用情况被编码为二元变量,药物总类别数作为连续变量记录。
2. 数据分析:研究运用了极端梯度提升(Extreme Gradient Boosting,XGBoost)算法进行数据分析。XGBoost 是一种集成学习算法,它利用二阶梯度最小化损失,并采用先进的正则化(L1 和 L2)技术,能够有效减少过拟合,提高模型的泛化能力和性能。该算法在处理大数据集时,具有处理异常值、可扩展性强、速度快和准确性高的优点,还能通过超参数调整实现优化。

同时,研究还使用了逻辑回归,并纳入人口统计学变量(年龄、性别、受教育年限)、抗抑郁药使用情况以及两者的组合,以此为识别抑郁症状态建立基线模型。

研究构建了六个 XGBoost 模型,分别基于不同的数据组合进行训练:(1)驾驶特征;(2)人口统计学特征(年龄、性别、受教育年限)和驾驶特征;(3)抗抑郁药使用和驾驶特征;(4)药物总类别使用和驾驶特征;(5)抗抑郁药使用、人口统计学特征和驾驶特征;(6)药物总类别使用、人口统计学特征和驾驶特征。

在数据处理过程中,使用 OneHotEncoder 对分类变量进行编码。通过 GridSearchCV 进行超参数调整,它会对指定的超参数值进行详尽搜索,并与 10 折 GroupKFold 交叉验证相结合,在训练集上寻找能够最大化模型性能(重点优化召回率)的最佳超参数组合。最终,在测试集的自举子样本(1000 次迭代,25% 测试集)上评估模型性能,计算精度、召回率、F1 分数和受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic,AUC)等指标,并给出 95% 置信区间。所有分析均在 Python 3.11.5 版本的 Jupyter Lab 环境中进行,使用了 TableOne 0.9.1、Scikit - learn 1.5.1 和 XGBoost 2.1.1 等工具。

三、研究结果


  1. 参与者特征:研究共招募了 157 名参与者,其中 81 名被归类为抑郁症患者,76 名被归类为非抑郁症患者。参与者的平均年龄为 72.93 岁(标准差 SD = 5.36),抑郁症患者组的平均年龄(70.2 岁,SD = 4.0)显著低于非抑郁症患者组(75.84 岁,SD = 5.09),两组性别分布也存在显著差异,抑郁症患者组中女性比例更高(70.37% vs. 34.21%)。两组的受教育年限没有显著差异,但抑郁症患者组报告服用的药物数量更多(mean = 0.52,SD = 0.85),且使用抗抑郁药的比例更高(13.58% vs. 2.63%)。

在驾驶特征方面,抑郁症患者组的急刹车事件发生率显著高于非抑郁症患者组,而非抑郁症患者组的急转弯事件更多。非抑郁症患者组短于 1 英里的行程次数更多,抑郁症患者组 1 - 5 英里的行程次数更多。在每月驾驶天数、随机熵、回转半径、离家最远距离、最大行驶距离和独特目的地数量等方面,两组没有显著差异。
2. 模型性能:不同模型的性能评估结果表明,仅使用驾驶特征的模型识别抑郁症状态的 F1 分数为 0.82(95% 置信区间 CI:0.77 - 0.87);结合人口统计学特征和驾驶特征的模型 F1 分数为 0.79(95% CI:0.73 - 0.84);将药物总类别与驾驶特征相结合的模型总体性能有所提升,F1 分数达到 0.81(95% CI:0.76 - 0.86),抗抑郁药使用和驾驶特征相结合的模型 F1 分数同样为 0.81(95% CI:0.76 - 0.87)。在添加人口统计学变量后,抗抑郁药模型的 F1 分数为 0.78(95% CI:0.72 - 0.84),药物总类别模型的 F1 分数为 0.79(95% CI:0.74 - 0.84)。

综合来看,在所有六个 XGBoost 模型中,结合药物总类别和驾驶特征的模型表现最佳,其 AUC 达到 0.86。而抗抑郁药和驾驶特征模型虽然排名第五,但在敏感性(84%)和特异性(81%)之间达到了较好的平衡。相比之下,逻辑回归模型仅使用人口统计学变量识别抑郁症的 F1 分数为 0.63,单独使用抗抑郁药的 F1 分数仅为 0.11,人口统计学变量和抗抑郁药结合的 F1 分数为 0.62。此外,将数据按周聚合后运行相同模型,与按月聚合的结果没有显著差异。在去除 13 名使用抗抑郁药的参与者后进行敏感性分析,结合药物总数、人口统计学特征和驾驶特征的模型在所有四个模型中排名最佳。

四、研究结论与讨论


研究结果表明,自然主义驾驶行为能够有效区分患有和未患有 MDD 的老年人。仅使用驾驶特征的单一模型就取得了良好的 F1 分数(0.82)、80% 的特异性和较高的 AUC(0.84),这一结果有力地反驳了研究的第一个零假设(即 MDD 和非 MDD 老年司机之间没有差异),证明了驾驶行为在识别老年抑郁症方面的潜力。

当将药物总类别与驾驶特征相结合时,模型性能进一步提升,F1 分数达到 0.81,AUC 为 0.86,精度为 74%,召回率为 90%。较高的召回率意味着该模型在识别可能患有抑郁症的个体方面特别有效。在所有模型中,结合药物总类别和驾驶特征的模型综合表现最佳。

然而,研究的第二个零假设(即添加人口统计学和药物特征不会改善模型)并未完全被否定。添加药物特征确实提高了模型的准确性,但添加人口统计学变量(年龄、性别、受教育年限),无论是单独添加还是与抗抑郁药等药物结合添加,都导致模型在特异性和敏感性方面表现较差。总体评估指标显示,包含人口统计学变量的模型存在过拟合现象,泛化能力较差,可能是因为年龄和性别等人口统计学变量存在潜在的共线性,导致模型将一些非抑郁的年轻和 / 或女性个体错误地标记为抑郁症患者。

这一研究结果具有多方面的重要意义。从临床诊断角度来看,驾驶行为作为一种复杂的日常生活工具性活动,其差异能够预测诸如临床前期 AD 等疾病,也同样可以用于识别老年抑郁症。由于老年人口不断增长,抑郁症患病率较高且常被漏诊、未治疗,早期准确诊断对于改善老年人的整体健康和生活质量至关重要。而现有的传统筛查方法存在诸多局限性,如受主观因素影响大、易受其他疾病症状干扰等。本研究提出的基于自然主义驾驶数据和机器学习的方法,为抑郁症筛查提供了新的方向。

从技术发展角度,随着人工智能(Artificial Intelligence,AI)、机器学习算法和数字健康工具的不断进步,利用这些技术分析大量患者数据,包括行为和生理指标,有助于更精准、高效地识别抑郁症模式,实现早期检测。基于数字平台的标准化、规模化筛查工具,能够减少诊断的变异性,提高可及性,对不同患者群体进行更频繁、准确的评估。

从社会影响角度,本研究具有一定的应用前景。通过简单的车载诊断设备收集驾驶数据,并结合智能手表等可穿戴设备获取实时生理数据,能够更便捷、低成本地实现抑郁症的早期检测。同时,数据记录器收集的匿名健康数据还可以用于公共卫生领域,帮助追踪特定疾病在人群中的流行情况,为医疗资源分配和区域疾病监测提供依据。

当然,该研究也存在一些局限性。例如,虽然排除了与他人共用车辆的参与者,但仍有可能存在他人影响驾驶数据的情况,不过大量行程数据的每月聚合在一定程度上可以降低这种干扰。此外,自我报告的药物使用情况可能不准确或不及时,研究未跟踪药物使用的时间变化,且缺乏参与者的详细电子健康记录数据以及非处方药物(如镇静抗组胺药)的数据,这些因素可能会影响模型的性能。另外,老年抑郁症患者可能表现出非典型症状,部分参与者可能存在认知能力下降或临床前期 AD,这些因素在研究中未得到控制,可能影响驾驶行为和抑郁症状。未来的研究需要进一步改进,如扩大样本量、延长观察期,采用更复杂的建模技术(如深度学习算法),更好地区分驾驶员数据,同时纳入更多的背景数据(如认知评估或健康记录),以更深入地了解认知障碍或临床前期 AD 对驾驶行为和抑郁症的影响。

综上所述,这项研究为未来识别老年人抑郁症的研究提供了极具前景的方向,有望在改善老年人心理健康和提升驾驶安全方面发挥重要作用,尽管存在一些不足,但也为后续研究指明了改进的方向,推动该领域不断发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号