呼气模式作为生物识别新途径:基于VOC与机器学习的人体身份与健康状态双重认证研究

【字体: 时间:2025年10月15日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对传统生物识别技术存在的隐私与安全问题,创新性地利用呼气中的挥发性有机化合物(VOC)作为生物标识符,结合便携式电子鼻(e-nose)和机器学习算法,实现了对个体身份、BMI和性别的同步识别与估计。结果表明,VOC模式可可靠估计BMI(MAE=4.09)和性别(准确率87.5%),为无创、隐私保护的生物识别与健康监测提供了新范式,对个性化医疗具有重要意义。

  
在数字化时代,生物识别技术已成为身份认证的核心手段,从指纹解锁到人脸支付,无处不在。然而,传统依赖于个人可识别信息(PII)或外部生理特征(如指纹、面部)的方法正面临严峻挑战:指纹易受皮肤状况和湿度影响,面部识别可能被生成对抗网络(GAN)伪造,且这些数据存在被盗用、遗忘或丢失的风险。更重要的是,这些外部生物特征难以反映人体内部的实时生理状态,无法满足日益增长的个性化健康监测需求。在此背景下,寻找一种既能实现高精度身份认证,又能无创评估健康状态的新型生物标识符,成为学术界和产业界共同关注的焦点。
人体呼出气体中蕴含的挥发性有机化合物(Volatile Organic Compounds, VOC)为这一难题提供了极具潜力的解决方案。呼出气体不仅包含氮气(78-79%)、氧气(13-16%)和二氧化碳(4%)等主要成分,更含有数千种VOC,这些化合物源于内源性代谢过程和外源性环境暴露,可作为多种疾病的生物标志物。更为重要的是,初步研究表明,可能存在一组不受健康状况和吸入环境影响的稳定VOC,它们如同“指纹”一样具有个体唯一性。这为将呼气模式发展为一种新型生物识别技术奠定了理论基础。
在此背景下,由Anna Paleczek、Justyna Grochala等人组成的研究团队在《Scientific Reports》上发表了题为“The exhaled breath pattern as a potential method for biometrics identification”的研究论文。该研究开创性地探索了利用呼气VOC模式同时进行生物识别(区分个体)和生理特征估计(BMI和性别)的可行性。研究人员旨在证明,通过便携式电子鼻设备采集的VOC数据,结合机器学习算法,能够实现快速、非侵入式的身份认证与健康筛查,从而克服传统PII的局限性,为个性化医疗开辟新途径。
关键技术方法概述
本研究与波兰雅盖隆大学医学院合作,招募了94名平均年龄67岁、平均BMI 28 kg/m2的参与者。使用特德拉(Tedlar)袋收集单次呼气样本,随后通过自主研发的便携式电子鼻系统进行分析。该电子鼻集成了TGS1820、TGS2620、MQ3等多种气体传感器。采用传感器相对响应值(RG/R0)作为特征。应用线性回归、随机森林(Random Forest)、LightGBM(LGBM)、XGBoost(XGB)等机器学习算法进行BMI回归预测;使用逻辑回归、支持向量分类器(SVC)等进行性别分类。通过随机搜索交叉验证(Random Search CV)优化模型超参数。
研究结果
BMI预测结果
研究人员利用多种回归模型对参与者的BMI进行预测。线性回归模型的表现引起了特别关注,其平均绝对误差(MAE)为4.09 kg/m2,均方根误差(RMSE)为6.01。尽管平均绝对百分比误差(MAPE)为14.72%略高于其他模型,但该模型展现了最高的皮尔逊相关系数(0.2621)和较好的预测稳定性。研究表明,即使使用相对简单的线性模型,呼气VOC模式与BMI之间也存在可量化的关联。
性别分类结果
在性别分类任务中,逻辑回归算法表现最为突出,达到了87.5%的准确率和精确度,召回率为93%,F1分数高达90%。支持向量分类器(SVC)更是实现了100%的灵敏度。这些结果强有力地证明,呼气成分中存在与性别相关的显著差异,这种差异可以被电子鼻系统捕捉并通过机器学习算法有效识别。
个体区分潜力
虽然本研究未展示具体的个体识别结果,但文中回顾了大量前期研究,为呼气VOC模式的个体唯一性提供了有力支持。例如,Martinez-Lozano Sinues等人的研究表明,即使在长达11天的观察期内,个体的呼气中仍存在恒定化合物组合,足以区分不同个体。Fasola和Incalzi的研究也分别证明了哮喘患者和慢性阻塞性肺疾病(COPD)患者呼气模式在数天至数周内的可重复性。这些发现共同指向一个结论:每个人的呼气都可能包含一个独特的、相对稳定的“化学指纹”。
讨论与结论
本研究成功地将呼气VOC分析的应用范畴从疾病诊断扩展到了生物识别和基础生理特征估计领域,实现了“一石二鸟”的效果。研究证实,基于便携式电子鼻和机器学习的方法,能够从单次呼气中同时获取关于个体身份、BMI和性别的信息,且具有较高的准确性。
与面部识别等传统技术相比,呼气生物识别具有显著优势:VOC源于人体内部复杂的代谢过程,极难伪造或复制,提供了更高的防欺骗能力;同时,它是一种非接触式检测,特别适用于高卫生要求场景。此外,呼气分析能够提供实时的代谢信息,为健康监测提供了可能,这是其他生物特征难以企及的。
然而,研究者也坦诚指出了当前研究的局限性。样本规模较小(94人)且人群单一(主要为白种人),限制了结果的普适性。环境因素(如饮食、昼夜节律)对VOC谱的影响仍需在更大规模、更长期的研究中加以验证。要实现可靠的生物识别,还需要开发更稳定、灵敏的传感器系统,并建立标准化的采样和分析流程。
未来的研究方向包括:扩大样本量和多样性,进行长期纵向研究以验证VOC模式的稳定性;探索将呼气识别与其他生物特征(如步态、声音)相结合的多模态认证系统;开发更高性能的传感器和更先进的AI算法(如深度神经网络、孪生神经网络),以提升识别的准确性和鲁棒性。
综上所述,这项研究为呼气VOC模式作为一种新型生物识别和健康监测工具的可行性提供了有力证据。它展示了一种隐私保护、非侵入性、且能提供丰富生理信息的新范式,尽管走向实际应用仍面临挑战,但其在个性化医疗、安全认证等领域的潜力不容小觑,为未来生物识别技术的发展指明了一个充满希望的方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号