基于自然语言处理的退伍军人健康管理局脊椎治疗记录中患者报告结局测量文档识别研究

【字体: 时间:2025年06月06日 来源:JMIR Medical Informatics 3.1

编辑推荐:

  【编辑推荐】本研究针对退伍军人健康管理局(VHA)脊椎治疗中患者报告结局测量(PROMs)文档难以规模化监测的问题,开发了基于medspaCy和spaCy的规则型自然语言处理(NLP)模型。通过对377,213份临床笔记分析,模型在软边界文本匹配(精确率81.1%,召回率96.7%)和笔记分类(精确率90.3%,召回率99.5%)任务中表现优异,揭示PROMs总体文档率仅17.0%。该研究为医疗质量监测提供了自动化解决方案,对改善退伍军人脊椎治疗质量具有重要实践意义。

  

在医疗质量监测领域,患者报告结局测量(PROMs)作为评估治疗效果的重要指标,其标准化应用一直面临实践困境。特别是在美国退伍军人健康管理局(VHA)的脊椎治疗服务中,尽管PROMs被明确列为高质量护理的核心指标,但这些数据往往散落在非结构化的临床文本记录中。传统依赖人工病历审查的方法不仅效率低下,更难以应对VHA系统内迅速扩张的脊椎治疗服务规模——数据显示,提供脊椎治疗的VHA设施从2017财年的87家激增至2024财年的299家。这种规模化需求与质量监控手段之间的鸿沟,催生了利用人工智能技术实现自动化文档分析的研究需求。

针对这一挑战,VA Connecticut Healthcare System等机构的研究团队开展了一项开创性研究。研究人员从VHA肌肉骨骼诊断/补充与整合健康(MSD/CIH)队列中提取2017-2020年间56,628名患者的377,213份脊椎治疗记录,构建了迄今为止最大的脊椎治疗临床文本语料库。通过创新性地应用规则型自然语言处理技术,该研究成功实现了PROMs文档的自动化识别与分类,相关成果发表在《JMIR Medical Informatics》上,为医疗质量监测领域提供了方法论突破。

研究团队采用多阶段技术路线:首先通过medspaCy和spaCy构建规则型NLP管道,采用TargetMatcher组件匹配18种预定义PROMs文本模式;随后添加sectionizer组件排除药物清单等干扰区域;最终开发词袋模型(BOW)、卷积神经网络(CNN)和集成模型进行性能对比。所有模型在300份人工标注训练集上迭代优化,并通过蒙特卡洛和k折交叉验证评估稳定性。

研究结果呈现三个关键发现:在文本匹配任务中,规则模型在严格边界匹配表现一般(F值52.2%),但采用软边界匹配后性能显著提升(F值88.2%);在笔记分类任务中,规则模型展现出近乎完美的召回率(99.5%)和94.7%的F值,显著优于机器学习模型;横跨377,213份笔记的分析显示,PROMs总体文档率仅17.0%,其中初诊咨询记录使用率(32.7%)显著高于中间访视(13.8%),且2018-2020年间文档率持续下降(19.1%→13.2%)。

讨论部分揭示了多重意义:方法论层面,研究证实规则型NLP在稀疏数据场景下的优越性,其精确度(90.3%)和效率为临床文本分析树立了新标准;临床实践层面,发现的低文档率与调查显示的60%日常使用率形成鲜明对比,提示VHA可能存在"实践-文档脱节"现象;质量改进层面,研究为VHA国家脊椎治疗质量监测提供了可行方案,其自动化流程每年可节省数千小时人工审查时间。

值得注意的是,COVID-19疫情期间文档长度和PROMs使用率的同步下降,反映了公共卫生危机对医疗文档完整性的冲击。研究者建议未来工作应聚焦:1)探究影响PROMs使用的多维度因素;2)开发基于NLP的实时质量反馈系统;3)将方法扩展至其他疼痛管理场景。这项研究不仅解决了VHA脊椎治疗的质量监测难题,其技术框架更为电子健康记录(EHR)的二次利用提供了普适性范例,对提升医疗系统整体质量监控能力具有深远影响。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号