
-
生物通官微
陪你抓住生命科技
跳动的脉搏
"多模态睡眠呼吸暂停综合征数据集:基于深度学习的无创诊断新突破"
【字体: 大 中 小 】 时间:2025年07月19日 来源:Scientific Data 5.8
编辑推荐:
为解决睡眠呼吸暂停综合征(SAS)临床筛查耗时耗力、患者依从性差的问题,研究人员开发了首个同步整合智能手机音频与多导睡眠图(PSG)的多模态数据集。该研究通过50例患者400+小时睡眠监测数据,实现了呼吸音与生理参数精准对齐(误差<1秒),为便携式OSA(阻塞性睡眠呼吸暂停)监测算法开发提供标准化资源,显著提升家庭场景诊断准确性。
睡眠呼吸暂停综合征(SAS)作为一种可引发高血压、心律失常甚至认知功能障碍的常见呼吸障碍,其诊断长期依赖多导睡眠图(PSG)监测。然而这种"金标准"需要患者在实验室佩戴数十个传感器,不仅导致睡眠环境不适,更因高昂成本难以普及。更棘手的是,现有基于PSG的公开数据集(如Georgia Korompili团队收集的212例数据)虽标注精确,却与智能手机采集的家庭环境音频存在显著质量差异,致使算法在实际应用中性能骤降。
针对这一工程化瓶颈,深圳市第二人民医院耳鼻咽喉科联合复旦大学附属眼耳鼻喉科医院的研究团队在《Scientific Data》发表了创新解决方案。他们构建了全球首个面向智能手机应用场景的OSA多模态数据集,通过同步采集50例患者智能手机音频(OPPO Reno8)、专业录音笔(Newamy V03)与PSG(Embla SDx)数据,并严格校准至北京时间(误差<1秒)。研究保留关键生理参数如血氧饱和度(SpO2)、心率、气流等数据,由临床医生参照美国睡眠医学会(AASM)标准标注四种呼吸事件:阻塞性呼吸暂停、中枢性呼吸暂停、混合呼吸暂停及低通气。
关键技术包含:1) 三设备时间同步系统(智能手机、录音笔、PSG);2) 基于AASM标准的临床医生人工标注流程;3) 数据匿名化处理(已通过深圳市第二人民医院伦理委员会审批,批号2023-113-01YJ)。特别值得注意的是,团队创新性地保留36例患者气流数据,首次实现呼吸音与气流动力学的关联分析。
箱线图分析显示,患者平均血氧饱和度为92.59%(±2.58%),但25号与45号患者SpO2值显著低于第三四分位数,提示长期低氧血症。

相较于传统PSG数据集,该研究:1) 首次纳入智能手机麦克风原始音频(48kHz采样率),直接匹配家庭场景信噪比;2) 提供呼吸音-生理参数时序对应关系,支持端到端模型训练;3) 开放JSON格式标注文件,包含事件类型、持续时间及睡眠分期等结构化数据。
这项研究为开发适用于家庭环境的OSA无创监测算法奠定数据基础,通过弥合实验室数据与真实场景的"质量鸿沟",使深度学习模型在便携设备上的准确率提升成为可能。数据集已存储于Science Data Bank(DOI:10.57760/sciencedb.19070),包含WAV/MP3音频、CSV生理数据及JSON标注文件,为睡眠医学与人工智能的跨学科研究提供标准化平台。
生物通微信公众号
知名企业招聘