基于机器学习算法的酒精生物传感器非佩戴状态检测系统开发与现场部署研究

【字体: 时间:2025年08月26日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对腕戴式酒精生物传感器(BACtrack Skyn)在非佩戴状态下数据失真的关键问题,开发了基于实验室真实数据的随机森林算法。研究团队通过61次5小时实验室会话获取地面真实数据,创新性地结合温度、运动及其时间序列二次系数等22项特征,实现了非佩戴状态96%的灵敏度和99%的特异性检测,显著优于传统温度截断法(25-30°C)。在114人参与的4周现场研究中,该算法每日平均检测到1.6小时非佩戴时间,与自我报告的一致性优于温度截断法,为酒精使用障碍(AUD)监测提供了更精准的数据质量控制工具。

  

在酒精使用监测领域,腕戴式生物传感器的出现带来了革命性突破。这类设备通过检测皮肤挥发的酒精浓度(TAC),为研究人员提供了连续、客观的饮酒行为数据。然而,一个长期被忽视的技术瓶颈在于:当使用者取下设备充电或沐浴时,传感器产生的数据会严重失真——可能显示虚假的零值、环境酒精干扰信号或不稳定的噪声曲线。这种"非佩戴状态"(non-wear)数据若未经处理,将直接影响对饮酒事件和中毒程度的判断准确性。

传统解决方案依赖单一温度阈值法(26-30°C),但这种方法存在明显缺陷:体温存在个体差异,且传感器温度变化存在滞后性——取下设备后温度缓慢下降,重新佩戴后又逐渐回升。更复杂的是,在温暖环境中,环境温度可能与体表温度相近,使温度指标完全失效。这些问题导致现有方法无法准确识别短暂的非佩戴区间,而后者在实际使用中恰恰十分常见。

为破解这一技术难题,由Nathan A. Didier领衔的多机构研究团队在《Scientific Reports》发表了创新性解决方案。研究分为两个阶段:首先在严格控制条件的实验室中建立"地面真实"(ground truth)数据集,然后开发机器学习算法并验证其在实际场景中的表现。

研究团队采用BACtrack Skyn腕戴设备,该设备每20秒记录一次跨皮肤酒精浓度(TAC)、温度(°C)和运动加速度(g)。关键技术包括:1)通过36名参与者61次实验室会话建立标注数据集,研究助理精确记录120次设备摘戴时间;2)构建包含22个特征的随机森林模型,创新性地引入时间序列二次系数特征;3)采用设备交叉验证(leave-source-out)评估算法泛化能力;4)在114名年轻人的4周现场研究中,将算法检测结果与温度截断法及自我报告数据进行对比。

【实验室算法开发】

研究团队设计了精巧的实验方案:在5小时实验室会话中,参与者被要求在45分钟和180分钟两个固定时间点摘除设备10-20分钟,由此产生明确标注的非佩戴区间。通过分析36名参与者(50%女性,平均50.6岁)的数据,发现佩戴时平均温度为31.2±1.7°C,运动为0.11±0.14g;非佩戴时则降至25.7±2.5°C和0.02±0.04g。

算法开发中,最具创新性的是引入时间序列动态特征。如图2所示,设备摘除后温度呈特征性下降曲线,而重新佩戴时则出现急剧上升。随机森林模型不仅使用当前温度/运动值,还计算前后时间点的变化率、10点移动平均变化量,以及通过二次方程(ax2+bx+c)拟合的曲率、斜率和截距等特征。这种多维时间特征使算法能捕捉温度变化的动态过程,在数值尚未达到临界阈值时就预判状态变化。

【算法性能验证】

设备交叉验证显示,算法整体灵敏度达0.960±0.007,特异性达0.995±0.001,AUC-ROC为0.999。如图3所示,其性能全面超越所有温度截断法(25-30°C)。特征重要性分析揭示,后续温度截距(MDI=0.249)、当前温度(0.219)和前期平均温度变化(0.111)是最具预测力的特征。值得注意的是,虽然运动特征整体重要性较低,但作为第八重要特征(MDI=0.030),它在温度信息模糊的情况下提供了关键补充。

【现场研究应用】

在独立现场验证中,算法平均每日检测到1.62小时非佩戴时间,与自我报告的1.14小时更为接近,而28°C温度截断法则高估为1.87小时。设备型号比较发现,电池续航更强的T15模型(20天)比T10模型(3天)数据缺失更少(1.4 vs 2.6小时/天),但算法检测到的非佩戴时间更多(1.9 vs 1.0小时/天),这可能反映算法对训练所用T15设备更敏感。

【非佩戴区间特征】

算法在现场数据中识别出20,749个非佩戴区间,其中超过半数持续时间≤3分钟(图6),平均时长17分钟。这种对短暂非佩戴的高灵敏度是以往方法无法实现的。浴室充电(63.6%)和设备充电(34.0%)是主要非佩戴原因。

这项研究通过创新的机器学习方法,解决了酒精生物传感器应用中的关键数据质量问题。其重要意义体现在三个方面:技术层面,首次将时间序列动态特征引入非佩戴检测,突破单一温度阈值的局限;临床层面,为酒精使用障碍研究提供更可靠的数据清洗工具,助力精准识别饮酒模式;应用层面,集成该算法的Skyn Data Manager软件已实际投入使用,未来可发展为实时提醒系统,提高设备依从性。

研究也存在若干局限:现场验证缺乏地面真实数据,依赖可能出错的自我报告;算法在极端环境下的稳健性有待验证;未解决"协同非依从"(collaborative non-adherence)问题。未来研究可通过照片验证、多传感器交叉验证等方法进一步完善算法。总体而言,这项工作为可穿戴生物传感器的数据质量控制树立了新标准,其方法论对其它连续监测领域也具有借鉴价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号