综述:成人阻塞性睡眠呼吸暂停的机器学习预测模型研究进展

【字体: 时间:2025年10月08日 来源:Nature and Science of Sleep 3.4

编辑推荐:

  本综述系统回顾了机器学习(ML)预测模型在成人阻塞性睡眠呼吸暂停(OSA)筛查中的应用。文章详细阐述了从人口统计学、实验室指标到影像学和部分PSG通道等多种预测因子,比较了不同ML算法(如LR、SVM、RF、DL)的效能,并探讨了模型在OSA筛查与严重程度分级中的应用前景与当前挑战,为睡眠专科医生提供了有效的早期识别与诊断建议。

  
摘要
阻塞性睡眠呼吸暂停(Obstructive Sleep Apnea, OSA)是一个全球性的健康问题,其特征是睡眠期间上气道反复塌陷,导致血氧饱和度下降和睡眠碎片化。多导睡眠监测(Polysomnography, PSG)虽是当前诊断OSA的金标准,但其操作繁琐、成本高昂且患者依从性差,难以普及。因此,寻找便捷快速的OSA诊断方法势在必行。近年来,机器学习(Machine Learning, ML)预测模型的发展及其在医学领域的应用,为OSA严重程度的诊断提供了新方法,使得高效、准确地识别OSA严重程度成为可能。本文旨在综述有关ML预测模型用于OSA严重程度诊断的相关研究,并为睡眠专科医生提供更有效早期识别和诊断OSA的建议。
引言
OSA是一种睡眠障碍,根据美国睡眠医学会(American Academy of Sleep Medicine, AASM)2007年指南,常使用呼吸暂停低通气指数(Apnea-Hypopnea Index, AHI)评估其严重程度。全球近10亿30-69岁成年人患有OSA,其中中重度患者接近4.25亿。尽管对OSA的认识不断提高,但其总体患病率仍在9%至38%之间。PSG作为诊断OSA的金标准,虽能通过多通道采集大量生物信号(如脑电图、眼电图、鼻气流、肌电图、心电图(ECG)、呼吸努力和血氧饱和度等),但其应用存在高成本、操作繁琐和环境要求高等问题,难以用于所有疑似OSA患者的评估。家庭睡眠呼吸暂停测试(Home Sleep Apnea Testing, HSAT)及柏林问卷(BQ)、STOP-bang问卷(SBQ)和Epworth嗜睡量表(ESS)等筛查工具虽被广泛使用,但存在主观性高、回忆偏倚、观察困难、阅读量大和准确性低等局限性。随着ML的进步,其在医学领域用于预防、早期诊断和治疗的应用已超越理论范畴成为现实。ML算法相关的疾病预测模型研究激增,尤其在肿瘤学、糖尿病、心脏病、慢性肾病、帕金森病和皮肤病学等领域。AASM指南建议临床预测算法可用于筛查OSA患者,目前已有大量研究通过开发ML预测模型来实现OSA严重程度的诊断。构建ML疾病预测模型主要包括三个步骤:首先基于现有数据筛选可能的预测因子;其次根据数据特征和预测因子特性选择合适的ML算法进行模型构建与验证;最后根据多种评估指标判断预测模型是否达到建模目的及预期效能。
OSA预测模型中常用的预测因子
构建任何预测模型的重要部分是识别研究中使用的特征,这些特征在统计学中常称为预测因子。OSA的预测因子涵盖广泛领域,选择合适的预测因子对构建准确预测模型至关重要。本综述仅检索了PubMed过去十年发表的与OSA预测模型相关的研究,并仅纳入成功构建模型的文献。
基本信息数据:人口统计学、人体测量学和问卷
人口统计学因素(如年龄、性别、种族、地理分布和社会经济状况)可能影响OSA的发生和表现;人体测量学指标能简单直接反映患者的身体状况;问卷是帮助医生和研究者了解患者OSA症状和状况的重要工具。因此,人口统计学、人体测量学和问卷常被用作OSA预测模型中的预测因子。
人口统计学数据
年龄、性别和其他人口统计学数据常用于构建OSA预测模型。例如,Pamela N DeYoung等使用人体测量学数据(呼气末上气道最小横截面积、颈围)结合人口统计学数据(年龄、性别)建立了区分轻度和重度OSA的预测模型。Babak Amra等使用年龄和BMI、Mallampati指数、颈围等人口统计学指标预测中重度OSA。Corrado Mencar等使用人口统计学特征、肺活量测定、气体交换(PaO2, PaCO2)和症状(ESS、打鼾等)进行模型开发。这些模型均取得了良好的预测性能,AUC值均大于0.6。
人体测量学数据
在人口统计学数据中添加人体测量学数据或单独使用人体测量学数据也能构建性能良好的OSA预测模型。Wen-Te Liu等基于三个人体测量学特征(颈围、腰围和体重指数)和年龄开发了OSA严重程度的预测模型。Ahmed Elwali等使用清醒时的五种呼吸音结合人体测量学特征预测PSG相关参数。Liu Zhang等在中国人群中进行横断面研究,基于人口统计学和人体测量学数据开发了性别-年龄-BMI-最大切牙间距-胸骨距离比-颈围和腰围(SABIHC2)模型。Jae Won Choi等在前瞻性队列研究中,使用非接触式双雷达方法捕捉参与者的胸部和身体运动信号,成功开发了OSA二分和四分预测模型。上述模型的AUC均达到0.7,证明了人体测量学数据在OSA预测中的重要价值。值得一提的是,2025年中国学者Fang Lucheng等仅使用模拟打鼾数据建立预测模型,在OSA筛查中取得了惊人的AUC值0.926。
问卷数据
尽管调查问卷本质上是主观的,但将问卷数据与人口统计学和人体测量学等客观指标结合,也可用于构建有效的预测模型。Young Jae Kim等使用人体测量学数据(腰围、鼻唇肌至口肌的长度)和BQ问卷数据建立了OSA预测模型,但OSA患者与非OSA患者的比例为3:1,且数据集仅包含279个个体,可能导致模型偏向OSA组。增加数据量应能减少这种选择偏倚。Han H等一项涉及4,014名患者的研究也证实了这一发现,他们使用患者人口统计学数据(性别、年龄)、人体测量学数据(身高、体重、腰围、颈围和臀围)和自我报告的问卷结果(ESS、失眠严重指数)成功建立了预测模型,在筛查重度OSA时AUC达到0.96。
小结
人口统计学、人体测量学和问卷数据具有获取难度低、成本低的特点,是OSA预测模型的常见预测因子。性别、年龄、颈围和BMI是最常用的指标。未来若能将这些指标结合构建模型,可能取得良好的预测性能。结合简单的ML算法,可能在OSA家庭自测中发挥重要作用。
实验室指标
近年来,OSA的细胞生物学研究取得巨大进展,已识别出一些与炎症、氧化应激、交感神经激活和代谢活动相关的生物标志物,如白细胞介素-6(IL-6)、一氧化氮(NO)、半胱氨酸和载脂蛋白等。此外,OSA在进展过程中伴随一系列并发症,导致机体各项指标异常,进一步反映在实验室检测指标的异常上。
血液相关指标
Jayroop Ramesh等使用电子健康记录数据,包括实验室血液报告,用于OSA预测。Yanqing Ye等基于白细胞计数≥9.5 × 109/L和血红蛋白≥175 g/L等血液生化指标开发并验证了可行的临床预测模型。
生化指标
生化指标也可有效应用于OSA预测。Sofie Ahlin等使用生化检测中的血糖水平等预测指标建立预测OSA的模型,该模型在预测重度OSA时表现良好(C-statistic = 0.83),但未建立独立的外部验证组,仅使用Bootstrap方法进行内部验证,可能影响模型的外部有效性。Huajun Xu等使用LASSO回归分析识别出葡萄糖、胰岛素、载脂蛋白B等显著的OSA预测因子,能很好识别OSA风险个体。Huang等在2024年的一项多中心研究中,基于γ-谷氨酰转移酶和甘油三酯等实验室生化指标,结合年龄和体重指数等人类学数据,建立了OSA预测模型,并使用独立外部测试集进行验证,取得了良好的诊断结果(AUC = 0.73)。
炎症标志物
一篇综述发现氧化/亚硝化应激、促炎标志物增加、NO产生失衡和内皮损伤与OSA显著相关,并发现持续气道正压通气(Continuous Positive Airway Pressure, CPAP)能显著改善OSA患者的氧化应激、炎症和内皮功能障碍。Yifei Fang等使用ELISA检测264名OSA患者和231名正常对照者血清中CRP、IL-6、IL-8和TNF-α的自身抗体水平,探讨C反应蛋白、白细胞介素-6、白细胞介素-8和肿瘤坏死因子-α自身抗体在OSA诊断中的潜在价值,发现结合这四种自身抗体能很好地改善OSA预测。可见一些炎症标志物可能是OSA预测模型中的潜在预测因子,但目前使用此类指标的预测模型研究较少,需进一步研究探索此类指标在OSA预测中的价值。
基因检测指标
鉴于OSA相关的遗传因素,使用遗传相关指标构建OSA预测模型也是一种可行方法。Jie Zhu等识别出360个与OSA相关的显著差异表达基因(Differentially-Expressed Genes, DEGs)和393个与CPAP相关的DEGs,并选择重要性排名前10的基因作为开发模型的变量。Xiaofeng Wu等评估了缺氧相关显著DEGs对OSA的诊断价值,筛选出16个DEGs开发了多个OSA预测模型(AUCs > 0.7)。此外,其他研究者探索了阿尔茨海默病(Alzheimer’s Disease, AD)患者与OSA的联系,发现血浆中的microRNA信号与AD患者OSA的存在相关,他们观察到OSA和非OSA患者中15种microRNAs的表达存在差异,其中10种与OSA严重程度显著相关,并基于此开发了预测模型(AUC = 0.95)。除Xiaofeng Wu等构建的预测模型AUC为0.79外,其余研究的AUC值均超过0.95,且仅包含与OSA相关的遗传因素。这表明此类指标在OSA预测中潜力巨大,未来值得进一步探索该领域的潜在机制。随着未来体外遗传诊断技术的发展,这些因素可能成为新的诊断生物标志物。
小结
总之,与OSA预测相关的实验室指标众多,从常见且易于获取的临床血常规、生化指标和炎症指标,到基因水平的生物标志物。包含客观指标的预测模型比传统模型更难以推广和获取指标,但具有更好的评估能力。若基于客观实验室指标的OSA预测模型被广泛采用,不仅能减少基于问卷的预测因子的主观偏倚,还可能解决基层医疗机构医疗设施不足的短板,使此类机构能够进行OSA筛查,有助于降低漏诊率,促进早期诊断、治疗和预防。
并发症
OSA与并发症之间存在密切联系。OSA可能导致机体缺氧,从而引发高血压、心律失常和冠状动脉粥样硬化性心脏病。OSA还可能导致慢性肺源性心脏病和呼吸衰竭,以及缺血性或出血性脑病。未经治疗或治疗不充分的OSA可能导致抑郁或躁狂性精神病等心理健康问题。同时,OSA可能并发糖尿病。因此,合并症也常被纳入相关研究作为预测因子。OSA预测模型中常用作预测因子的常见合并症包括肥胖、糖尿病、窒息、情绪障碍和高血压。
影像学数据
颅面结构是OSA发生的重要因素之一。OSA患者大多存在颅面结构异常,如鼻狭窄、口腔狭窄和扁桃体肥大等。这些因素可能导致睡眠期间气道阻塞,也可能影响睡眠质量,从而加重OSA症状。因此,关注颅面结构的影像学数据也常被用作OSA预测模型中的预测因子。
Shuai He等基于上气道结构影像学数据(包括舌面积、悬雍垂面积、系带长度和后倾距离)结合一般人口学特征,开发了逻辑回归预测模型(AUC = 0.90)。此外,该研究者还使用扁桃体与气道之间、腭咽弓与舌直径之间的影像人体测量学数据进行建模,取得了更好的预测结果。Fabrice Monna等使用3D颌面模型进行ML建模,发现添加人体测量学数据进一步提高了AUC。但该研究仅限于成年高加索男性,并排除了肥胖患者,可能引入了选择偏倚。Ziyu Su等提出基于二维正面颅面图像的DeepXGBoost模型,在预测OSA严重程度方面表现良好,平均AUC值为0.78,显著优于传统的STOP-BANG问卷(AUC为0.52)。Min-Jung Kim等基于侧位头影测量切片开发了基于特征的知识提取OSA诊断模型,以避免模态差异造成的影响。另一位研究者将患者的计算机断层扫描(Computed Tomography, CT)图像重新开发为3种类型(骨骼结构、外部皮肤结构和气道结构),并在6个方向(前、后、顶、底、左侧平面和右侧平面)捕捉重新开发模型,以实现更好的预测效能。随着研究的深入,除颅面结构外的影像学数据也被纳入OSA预测模型的预测因子,Bo Pang等提出脑扩散张量成像(Diffusion Tensor Imaging, DTI)作为预测因子,并使用RF和SVM开发了预测模型,两者均取得了良好的预测效能[AUC(RF) = 0.85, AUC(SVM) = 0.84],可用于特定人群的OSA筛查。2024年,Kim等基于鼻窦CT数据结合临床数据(年龄、性别、BMI等)开发了多模态深度学习模型,在评估OSA严重程度方面也表现出优异性能(AUC = 0.91)。
总体而言,当前大多数关于影像学数据模型开发的研究都是单中心研究,样本量有限。仅有一项在韩国进行的研究是多中心的,并包含了较大的样本量(n=1018),这可能会给结果带来统计偏倚。这可能是因为影像学数据获取困难、硬件要求高且数据处理过程复杂。对OSA的整体预测性能良好,AUC值达到约0.8。然而,多中心、大样本研究可以实现更优的预测性能,例如Kim等的模型AUC达到0.9156。未来的研究应关注大样本数据研究。
PSG部分通道
典型的夜间PSG检查包含多个通道以采集大量生物信号,相关领域的学者尝试使用PSG多个通道中的一个作为OSA严重程度的预测因子,并结合其他预测因子通过ML建模完成OSA严重程度预测任务,以实现与PSG相似的预测效能,从而推动OSA预测和诊断技术的可用性和普及。
Prashant Hemrajani等使用单导联信号(如ECG、血氧饱和度等)设计了各种ML算法,均取得了超过90%的准确率,并开发了用于监测ECG信号的可穿戴设备,使OSA预测更加便捷。Alaa Sheta等进行了类似研究,提出了基于ECG的呼吸暂停事件自动诊断计算机辅助系统,在验证阶段准确率达到86.25%。Yuxing Lin等使用小波变换将一维ECG信号转换为二维时频图像用于开发OSA预测模型,当使用Dice损失函数进行训练时,准确率和AUC均高于90%。MengHsuan Liu等通过将单导联ECG信号转换为频谱图来开发OSA预测模型,也取得了优异结果,在PhysioNet数据集上表现出良好的泛化能力(AUC=0.944)。Zhiya Wang等使用心电图(ECG)开发了一个OSA预测框架,该框架基于深度学习技术结合有效连接网络(Effective Connectivity Networks)开发,在跨数据库测试中表现出良好的泛化能力。Yitong Zhang等也利用单导联ECG信号构建了深度学习模型,在公共数据库验证时,每个ECG信号的准确率可达91.66%。除使用ECG信号外,一些学者还使用了其他PSG部分通道信号。例如,Ross Mandeville等基于经膜EMG数据开发了OSA诊断模型,在区分对照组、神经源性患者和睡眠呼吸暂停患者方面取得了较好结果。由于仅凭ML技术难以提取单导联ECG信息,Lingxuan Hou等开发了一种基于扩张卷积和长短期记忆神经网络混合架构的混合OSA预测模型,结合多尺度特征融合策略以改进ECG信号提取,被证明可有效提高OSA诊断的准确性。
值得注意的是,上述大多数使用ECG数据的研究都利用了相同的公共数据库。随着算法复杂度和计算能力的提高,模型的整体准确率和AUC也有所增加,表明模型算法仍有显著发展空间。未来有望构建出更精确的基于ECG数据的预测模型。然而,这也增加了模型转化和实施的难度,因为模型性能的改进依赖于训练和推理过程中计算资源的增加,且更高的复杂性会导致可解释性降低。与基于影像学的预测因子类似,大多数研究采用了小样本量;仅有一项2024年来自台湾的研究包含了较大的样本量(n=1,656)。这表明未来的研究可以利用更大的样本量来开发更科学、可靠的预测模型。
OSA预测中常用的机器学习算法
早在20世纪50年代,Arthur Samuel就使用了“机器学习”这一术语,将其定义为“使计算机能够在没有明确编程的情况下学习的研究领域”。ML的主要类型包括监督学习和无监督学习,此外还有半监督学习和强化学习。
监督学习最常用于解决分类任务和回归任务。常见的监督学习算法包括决策树、随机森林、支持向量机、朴素贝叶斯、人工神经网络等。本文纳入的OSA预测模型大多使用上述算法进行分类构建。例如,Zhang L等使用SVM构建机器学习模型,在预测中度和重度OSA方面取得了良好的预测性能,AUC值分别为0.88和0.92。无监督学习最常用于聚类、降维、密度估计、特征学习、发现关联规则、异常检测等。一些学者在构建OSA预测模型之前也使用无监督学习处理数据。例如,Han H等在构建OSA模型之前使用K-means聚类处理数据,实现了AUC值0.84和0.96。
机器学习模型的评估指标日益完善,在分类问题中,模型的常见评估指标是AUROC、准确率、F1分数等,而在回归问题中,通常使用均方误差(MSE)、平均绝对误差(MAE)或决定系数(R2)来评估模型。已成功用于开发OSA分类预测模型的算法和评估指标如表1所示。
美国睡眠医学会(AASM)指南明确指出“临床预测算法可用于睡眠诊所中疑似OSA的患者,但不一定用作PSG的替代品”,并且“在非睡眠诊所环境中,这些工具可能更有助于识别OSA风险增加的患者”。用于识别OSA风险的初步OSA筛查具有价值。除基于问卷的筛查工具外,OSA的决策支持模型可以利用统计机器学习技术预测临床结果,从而以较低成本促进临床决策。
目前,用于实现OSA分级预测的机器学习算法大多是监督学习。接下来,本文将简要扩展描述OSA预测中常用机器学习算法的基本应用特性。
逻辑回归(Logistic Regression, LR)
逻辑回归(LR)计算量小、速度快、存储资源需求低,可以解决多重共线性问题,并且易于理解和实现。然而,当特征空间很大时,LR的性能不是很好,它只能处理二分类问题,容易欠拟合,且通常准确率不高。LR是同时分析多个解释变量的强大工具,用于在存在多个解释变量的情况下获得优势比,以解决二分问题,同时减少混杂因素的影响。
线性回归(Linear Regression)
线性回归属于较传统的模型,包括简单线性回归和多元线性回归。当结果变量是连续的,并且研究者试图理解单个自变量与因变量之间的相关性时,使用简单线性回归;在现实世界的研究中,通常存在多个自变量,在多元线性回归模型中解决多自变量问题相对容易实现且计算简单。然而,它不能拟合非线性数据。
随机森林(Random Forest, RF)
随机森林(RF)是性能最好的学习算法之一,RF容易适应数据中的非线性,该算法非常适合中小型数据集,当自变量数量大于观测数量时,线性回归和逻辑回归算法将无法工作,而RF是有效的,因为它不同时使用所有预测变量。RF极其准确,可以有效地运行于大型数据集,不易过拟合,具有良好的抗噪声能力,训练速度快,并且能够获得变量的重要性顺序,但当RF中的决策树数量很大时,训练所需的空间和时间将会很大,这会导致模型速度变慢。
贝叶斯方法(Bayesian Method)
贝叶斯方法基于贝叶斯原理,利用概率统计知识对样本数据集进行分类,由于其坚实的数学基础,贝叶斯方法的误分类率非常低。贝叶斯方法的特点是将先验概率和后验概率相结合,即避免了仅使用先验概率的主观偏倚,也避免了仅使用样本信息的过拟合现象。贝叶斯方法在大数据集上显示出高准确性,而算法本身相对简单。
K-最近邻算法(K-Nearest Neighbor, KNN)
K-最近邻(KNN)算法可用于非线性分类,理论上简单且易于实现。该方法的思想支持直接将新数据添加到数据集中,而无需重新训练。该方法的缺点是计算量大、内存需求大,并且对样本不平衡的处理较差。
决策树(Decision Trees)
决策树以非参数方式处理特征之间的交互作用,在测试数据集上更容易提取规则且运行速度更快。然而,它们容易过拟合,并忽略数据集中属性的互连。决策树技术与人类推理非常相似,可以可视化分析且更易于理解,因此被广泛用于构建分类模型;决策树的缺点之一是存储空间和计算量增加。
XGBoost
XGBoost是一种集成多棵树模型以形成非常强大的分类器,该算法添加正则项以简化模型并防止模型过拟合,模型快速、高效且具有较强的泛化能力。然而,XGBoost算法需要调整更多参数,并且会产生收敛速度慢和陷入局部最优等问题。
支持向量机(Support Vector Machines, SVM)
支持向量机(SVM)是Vapnik于1995年基于统计学习理论提出的一种线性和非线性分类方法,可用于分类和回归。近年来,SVM已被用于解决多种医学问题,并在生物医学领域得到广泛应用,表现出良好的性能。SVM适用于小样本量研究,并且该算法对数据分布的要求低,适用性广。其优点是SVM通过核函数将非线性数据映射到高维空间,并开发最优超平面以实现分类作用,避免了大量复杂操作,可以对非线性数据进行分类和判别,但该算法对缺失数据敏感,消耗大量内存,且可解释性差。
人工神经网络(Artificial Neural Networks, ANN)
人工神经网络(ANN)是有效模拟生物神经网络结构的数学工具,并用于许多领域,例如实现疾病预测、疾病分类和图像分析。ANN模型具有并行分布式数据存储和数据处理、良好的容错性、处理高级非线性、强大的自适应能力、自学习能力等特点。ANN的主要缺点是不适用于小样本,并且对预测变量的选择有较高要求。
ML算法的选择
一篇关于OSA的ML方法的综述发现,开发模型最常用的是逻辑回归(35/63, 56%),其次是线性回归(16/63, 25%)、支持向量机(9/63, 14%)、神经网络(8/63, 13%)、决策树(8/63, 13%)、贝叶斯网络(4/63, 6%)等。可见,计算速度快且能解决多重共线性问题的逻辑回归算法在OSA诊断的ML研究中更受广大研究者青睐。本文也对纳入的文献进行了统计分析。在纳入的41项研究中,共构建了58个OSA预测模型。在模型数量分布方面,单模型研究最多(28),其次是双模型研究(9),而构建三个或以上模型的研究相对较少(4)。在算法选择方面,与Ferreira-Santos D的研究相似,最受欢迎的算法是回归模型,其次是深度学习算法,然后是SVM(图2)。考虑到抽样误差和结果的可靠性,本研究仅对构建模型数量超过10个的算法进行了纵向分析,以深入了解算法选择趋势。我们发现传统的机器学习算法LR和SVM在2020年后相当流行,但在过去两年中,与深度学习的快速发展相比,它们逐渐失去了势头(图3)。这种趋势可能源于算法的快速进步,特别是深度学习在处理复杂、高维数据方面的能力日益突出。然而,这并不意味着传统算法在未来缺乏竞争力。具体来说,在利用新兴和复杂数据源(如心电图和影像数据)的研究中,由于深度学习模型具有卓越的特征提取和模式识别能力,因此更受青睐;而在基于相对结构化、低维数据(如人口统计学特征、人体测量学指标和常规实验室检查)的研究中,回归模型和SVM等传统算法应用更广泛。正如Eiseman等分析了一个大型睡眠相关心血管健康研究数据库,并使用SVM算法成功构建了具有良好预测性能的模型。同样,Wen-Chi Huang等基于6,875名疑似OSA的中国患者的基本数据(如性别和年龄),结合SVM算法构建了预测模型,也表现出优异性能。此外,Farahnaz Hajipour等使用颈围和呼吸音等低维数据构建OSA预测模型,发现RF算法取得了良好的预测性能。在加拿大进行的一项大规模研究中,研究人员使用32项健康和健康指标进行建模,结果表明LR达到了预期的预测性能。当应用于相对复杂的数据(如心电图)时,深度学习算法模型更常用(表2)。
上述分析表明,当前的OSA预测模型研究在算法选择上呈现出明显的分化趋势。传统统计模型(如回归)在结构化数据场景中保持优势,而深度学习在新兴复杂数据类型处理中迅速崛起并占据重要地位。可见,对于具有不同数据特征和模型目的的研究,选择不同的ML算法会具有不同的预测效能和泛化能力。为了选择与研究相对应的最佳模型,当前主流方法是先开发多种机器学习算法模型,然后通过比较模型评估指标来选择最佳模型。
预测模型的目的与效能
早期识别和治疗是降低OSA发病率的关键,在OSA早期阶段进行合理干预治疗有助于防止其进一步发展并避免并发症。ML通过纳入相应的预测因子,分析变量相关性,并通过算法拟合构建预测模型,提供OSA的早期诊断和分类。目前,OSA的机器学习预测模型主要出于两个目的开发:筛查OSA的存在和预测其严重程度(表2)。
OSA筛查模型
当前的OSA筛查模型开发过程通常基于不同的诊断阈值设计。大多数研究者倾向于遵循AASM的OSA诊断标准,并将AHI设置为5作为截止阈值(表1)。正如Young Jae Kim等所示,他们采用SVM算法并将OSA诊断阈值设置为5进行模型构建,实现了最佳预测性能,敏感性、特异性和AUC值分别为80.33%、86.96%和0.87。2025年一项使用深度学习算法构建预测模型的研究也将OSA诊断阈值设置为5,并取得了优异性能,AUC为0.97。一些学者主张使用AHI=10或AHI=15作为阈值。He S等使用逻辑回归算法基于光度测量以AHI≥10为阈值构建了OSA预测模型
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号