Vitabel:用于重症监护机器学习的高分辨率生理数据可视化与标注的 Python 框架

《Journal of Medical Systems》:Vitabel: A Python Framework for Visualizing and Labelling High-Resolution Physiological Data for Critical Care Machine Learning

【字体: 时间:2026年06月10日 来源:Journal of Medical Systems 5.7

编辑推荐:

  人工智能(AI)在重症监护领域具有巨大应用前景,尤其是在纳入海量连续采集的生理数据时更是如此。高质量且标注可靠的数据,是开发与训练人工智能方法的关键前提。然而,重症监护中的常规记录数据往往噪声较大,而且高分辨率数据体量庞大,难以管理。针对这些问题,当前仍缺乏具

  
人工智能(AI)在重症监护领域具有巨大应用前景,尤其是在纳入海量连续采集的生理数据时更是如此。高质量且标注可靠的数据,是开发与训练人工智能方法的关键前提。然而,重症监护中的常规记录数据往往噪声较大,而且高分辨率数据体量庞大,难以管理。针对这些问题,当前仍缺乏具有良好泛化性的解决方案,从而限制了相关进展。为应对上述障碍,研究人员开发了 Vitabel——一个开源的 Python 框架,用于对医学时间序列进行事后加载、可视化、时间对齐与标注。该框架提供了合理的默认设置与交互式组件,可在预配置工作流中高效使用,同时保持对自定义分析与标注流程的灵活性和可扩展性。Vitabel 可无缝集成到 Jupyter Notebooks 中,提供一个可交互、可定制的数据可视化界面。在本研究中,研究人员通过 3 个使用场景展示了其应用价值。相关代码与示例数据以基于浏览器的演示形式提供。Vitabel 可免费获取,并以与本文配套发布的 MIT 许可证开源。
该文发表于《Journal of Medical Systems》,围绕重症监护研究中高分辨率生理数据的整理、对齐、标注与后续分析这一基础性难题,系统介绍了开源 Python 框架 Vitabel 的设计理念、数据模型、交互流程及其在多个场景中的应用价值。研究背景在于,重症医学决策具有高度时效性、复杂性与异质性,患者生理状态动态变化明显,同时接受多种治疗干预,传统研究方法难以充分应对。另一方面,监护仪、生命支持设备及其他诊断工具持续产生大量数据,尤其是波形级别的连续高频数据,为数据驱动研究和人工智能(AI,人工智能)应用创造了条件。然而,任何数据驱动方法均依赖完整、清洁且标注可靠的“真实值”数据,而现实中的重症监护数据常存在格式异构、设备时钟不同步、信号噪声大、标签缺失等问题,使得高质量数据集构建成为限制研究进展的关键瓶颈。因此,开发一套既能整合多源时间序列、又能支持人工校阅与标签生成的通用研究框架,具有明确的现实必要性。

研究人员据此提出 Vitabel。该框架并非面向床旁实时处理,而是面向科研语境下的事后(post hoc)数据整理与分析。其核心目标包括:从多种来源加载时间序列数据;以直观交互式图形展示数据;对不同来源的时间轴进行可视化对齐;自动预处理数据并生成派生标签;支持研究者手动修订标签并完成可视化注释;最终以标准化开放格式保存原始数据、处理操作与汇总结果,以增强可访问性、互操作性与可复用性。研究结论表明,Vitabel 将数据加载、时间对齐、自动标注、人工审阅和结果导出整合在同一科学 Python 生态中,能够为重症监护研究构建更清洁、更可重复的数据整理流程。其重要意义在于降低领域专家处理高采样率复杂生理数据的门槛,并促进临床研究者、数据科学人员与开发者之间的协作。

在技术方法上,研究人员构建了以 `Vitals` 对象为核心的数据模型,将数据抽象为 `channels` 与 `labels` 两类时间序列,并支持元数据存储、时间偏移校正和程序化线性时间轴重缩放。框架基于 `matplotlib` 实现交互式绘图,并嵌入 `Jupyter Notebook` 工作流,支持多源医学设备数据导入、可视化总览与局部细节联动、手动注释以及标签导出。样本或数据来源主要包括院外心脏骤停除颤仪记录、心肺复苏(CPR)动物实验中的多设备监测数据,以及模拟手术麻醉记录数据。研究中还集成了若干自动化处理方法,如胸外按压检测、自主循环恢复概率预测、呼气末二氧化碳(end-tidal CO2,ETCO2)提取、通气相关指标计算及低血压阈值下面积计算等。

在结果部分,论文通过 3 个使用案例展示了框架的功能边界与实用性。

First Use Case: Emergency Medical Service
该部分展示了 Vitabel 在真实院外心脏骤停除颤仪记录中的应用。研究目标是回顾复苏过程,并人工标注自主循环恢复(return of spontaneous circulation,ROSC)的发生时点。研究人员首先加载除颤仪导出的单例记录,随后利用包内已有方法,基于二氧化碳波形自动生成单次通气与 ETCO2 标签,并基于加速度计和心电图(ECG)自动生成自主循环概率标签。之后,为后续人工标注创建新的全局标签,用于记录 ROSC 发生时间,并设置相应元数据与绘图样式。通过交互式图形界面,研究人员能够在自动生成标签辅助下,对复苏过程中关键事件进行人工确认和添加。结果说明,Vitabel 能够将自动衍生标签与人工审阅有机结合,用于高噪声急救现场记录中的关键临床结局标注。

Second Use Case: Animal Laboratory
该部分展示了 Vitabel 在心肺复苏动物实验中的多源异构数据整合能力。研究场景包含多个设备记录,如 LUCAS 胸外按压事件、VitalDB 患者监护数据以及通气监测信号,研究目标是整合不同设备的记录并完成时间对齐。研究人员加载 3 种不同格式的输入数据,并初始化与特定通道关联的区间标签,用于手动标记有创动脉压信号中的噪声时段。随后建立交互式图形,对多个信号进行并列展示。由于不同设备时钟未同步,研究人员通过识别胸外按压导致的气流反向伪迹和脉压波形等特征,对按压标记、血压信号及其余信号之间的时间偏移进行人工校正;若固定偏移不足以纠正误差,还可在交互界面之外进行线性时间轴重缩放。对齐完成后,研究人员进一步用区间标签标注血压伪迹区段,以便后续分析时进行过滤。该结果表明,Vitabel 可有效支持多设备、非同步、多模态实验记录的时间整合和伪迹标注,为后续生理分析提供一致的数据基础。

Third Use Case: Operating Theatre
该部分展示了 Vitabel 在麻醉图表分析中的任务定制能力。出于隐私保护要求,本例使用模拟真实麻醉图表的人工数据。研究目标是量化术中低血压,因此需要界定分析时段并排除错误测量值。研究人员重新载入先前已保存于 Vitabel 中的数据,新建 `Analysis` 标签以标注分析区间边界,并将其加入 `Vitals` 对象。与前两个案例不同,该场景不包含连续波形数据,而是由离散血压测量值及自动提取的给药标签组成。为校正平均动脉压(mean arterial pressure,MAP)的错误读数,研究人员从 `MAP` 通道生成同名标签,利用标签可增删数据点的特性,对异常测量值进行可视化排除。之后,研究人员构建交互式图形并进一步访问底层图形对象,实现与按钮、文本输入框和指标显示区域相结合的图形用户界面。通过该界面,可逐例浏览病例、高亮显示低血压事件并展示相关指标。该部分结果说明,Vitabel 不仅是通用注释工具,也可作为面向特定研究任务的 Notebook 型用户界面构建模块。

从整体结果来看,3 个案例分别对应自动标签与人工校阅结合、异构多源数据时间对齐、以及针对特定分析任务的定制化界面构建,彼此形成互补,较完整地证明了 Vitabel 作为研究工作流框架而非固定用途查看器的定位。论文强调,在重症监护研究中,真正的瓶颈常不在下游统计学或机器学习模型本身,而在于如何将异构、嘈杂且标签不完整的记录整理为可分析的数据形式。Vitabel 的核心贡献正在于回应这一前处理层面的基础需求,即构建可靠的“真实值”基础。

讨论部分指出,该集成式工作流尤其适用于多设备记录频繁、设备时钟不同步、数据格式不一致且需领域专家人工复核的重症监护研究环境。通过在同一环境中提供即时视觉反馈,Vitabel 有望减轻数据整理负担,并提升下游分析所依赖数据集的清洁度与可重复性。对于临床领域专家而言,合理的默认设置、由数据科学人员预先配置的 Jupyter Notebooks 以及基于浏览器的演示环境,有助于降低其处理复杂高采样率数据的门槛。对于技术背景更强的使用者,框架又保留了自定义数据加载器、预处理例程和任务特异界面的扩展能力。因此,Vitabel 更适合作为科学 Python 生态内促进跨学科合作的框架,而非单一终端用户软件。论文还提到,该框架已在多个项目中成功应用,并作为德国复苏登记系统中自动分析除颤仪记录及精细评估复苏质量服务的基础支撑,这进一步说明其现实应用潜力。

论文同时讨论了局限性与未来方向。当前 Vitabel 不提供独立桌面图形界面,其安装、配置与扩展仍需要基础 Python 编码能力;现阶段其工作流主要围绕 Jupyter 和基于 `matplotlib` 的交互式绘图实现,尽管这对科研中的事后注释与协作式 Notebook 使用已被证明有效,但未必适合所有用户与部署情境。未来开发将同时面向易用性与架构模块化推进,包括改进数据加载与存储流程、增强预定义绘图样式、加深标准单位处理、简化基于元数据的通道选择、加入更便利的常见数据处理函数,以及进一步分离核心数据结构、处理流程和用户界面组件,从而更便于实现和维护项目特异的工作流与界面,并支持如 `plotly` 等替代图形后端及更多设备特异性加载器。开放源代码模式也被认为有助于更广泛的社区参与开发,使 Vitabel 持续发展为贯穿重症监护数据驱动研究全流程的数据处理工具。

研究结论部分可概括为:Vitabel 是一个面向重症监护研究的免费、开源 Python 框架,能够对记录后的生理时间序列数据进行整理、时间对齐、标注与分析。该框架以灵活、可扩展且适合协作的方式,将多源异构数据处理、自动标签生成、人工修订和可重复保存整合到统一环境中。通过 3 个使用案例,研究人员证明了其在除颤仪记录标注、多设备实验数据对齐以及麻醉记录任务化分析中的实用价值。总体而言,该框架为构建高质量标注数据、推进重症监护领域的数据驱动研究与机器学习应用提供了重要技术支撑。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号