《European Psychiatry》:Early detection of adults ADHD using electronic health records: A machine learning study
编辑推荐:
本研究聚焦于成人注意缺陷多动障碍(ADHD)的早期识别难题,通过机器学习技术分析电子健康档案数据,构建了有效的预测模型。研究发现,利用常规健康记录中的结构化与文本数据,能够以较高准确度识别潜在的ADHD病例,为临床早期筛查和干预提供了新的数据驱动工具,有望提升诊疗效率并改善患者预后。
注意缺陷多动障碍(ADHD)常被视为一种儿童期疾病,但越来越多的证据表明,有相当一部分患者其症状会持续到成年期,甚至在成年后才首次被诊断。然而,成人ADHD的诊断充满挑战:其症状(如注意力不集中、多动冲动)与焦虑、抑郁等其他精神障碍存在重叠,且缺乏像儿童那样明确的、由家长和老师提供的多情境行为报告。这导致大量成人ADHD患者未被识别,错失了有效的治疗与管理时机,进而影响其学业、职业表现、人际关系及整体生活质量。那么,能否利用现代医疗系统中日益普及的电子健康档案,从中挖掘出识别成人ADHD的早期信号呢?一篇发表在《European Psychiatry》上的研究为此提供了新的思路。
研究人员开展了一项机器学习研究,旨在评估利用常规电子健康档案(EHR)数据早期识别成人ADHD的可行性。为了回答这个问题,他们需要从海量的、看似与ADHD不直接相关的医疗记录中,找到具有预测价值的特征模式。
本研究主要采用了机器学习方法。具体而言,研究人员从一个大型医疗系统的电子健康档案中构建了研究队列,包括确诊的成人ADHD病例和匹配的对照组。他们从EHR中提取了包括人口统计学信息、诊断代码、药物处方、实验室检查结果以及临床笔记文本在内的多维特征。随后,使用多种机器学习算法(如逻辑回归、随机森林等)来训练和验证预测模型,并通过交叉验证等方式评估模型在区分ADHD病例与非病例方面的性能,包括准确度、灵敏度、特异度等指标。
研究结果
模型开发与特征选择
研究人员成功开发了多个基于EHR的机器学习模型。通过特征重要性分析,他们识别出了一系列对预测成人ADHD有贡献的关键变量。这些特征不仅包括精神科相关的诊断(如情绪障碍、焦虑障碍)和药物使用记录,还涵盖了一些看似不直接相关的躯体健康状况、特定的实验室检查模式以及在临床自由文本笔记中通过自然语言处理技术提取的关键词和短语。
模型性能评估
研究评估了不同机器学习算法的性能。结果显示,基于集成学习(如随机森林)或能够处理高维非线性关系的模型,在测试集上表现出了较好的区分能力。模型的主要性能指标(如受试者工作特征曲线下面积AUC)达到了具有临床参考价值的水平,表明利用常规EHR数据预测成人ADHD是可行的。同时,研究也对比了仅使用结构化数据(如诊断编码)与结合了非结构化文本数据(临床笔记)的模型性能,发现纳入文本信息能够显著提升模型的预测力。
早期检测的潜力分析
通过回溯性分析EHR数据的时间线,研究发现,模型能够在患者得到正式ADHD诊断之前的数年里,就识别出其风险升高的特征模式。这些早期信号可能表现为多次因注意力相关问题就诊、共病特定精神或躯体疾病、或使用某些特定药物等。这证明了该方法的“早期检测”潜力。
研究结论与讨论
本研究证实了利用常规电子健康档案,通过机器学习方法早期识别成人ADHD的可行性与潜在价值。它开辟了一条不依赖于专门评估、而是从日常医疗接触中被动发现高危人群的新途径。这种方法的意义在于其可扩展性和高效性:它可以无缝整合到现有的医疗信息系统中,自动对大规模人群进行风险筛查,从而辅助临床医生提高诊断意识,促使对高危个体进行更早、更主动的专业评估。尽管模型性能有待在前瞻性研究和不同人群中进一步验证,且需谨慎处理伦理和隐私问题,但这项研究无疑为改善成人ADHD这一长期被忽视的公共卫生问题,提供了一个强有力的数据科学工具。将机器学习与丰富的真实世界医疗数据结合,有望改变精神障碍的识别与诊疗模式,推动精准精神病学的发展。