基于不规则自回归时间序列模型提升青光眼患者平均偏差预测精度
《Scientific Reports》:Forecasting mean deviation in glaucoma patients using an irregular autoregressive time series method
【字体:
大
中
小
】
时间:2025年12月21日
来源:Scientific Reports 3.9
编辑推荐:
为解决普通最小二乘回归(OLSR)在拟合纵向视野数据时存在残差相关、违反统计假设的问题,研究人员开展了一项关于不规则自回归IAR(1)方法预测青光眼患者平均偏差(MD)的研究。结果表明,IAR(1)模型能有效处理不规则时间间隔数据,显著改善模型有效性,并在72%的病例中实现了比OLSR更低的预测均方误差(MSE),为青光眼进展监测提供了更可靠的统计工具。
青光眼是全球范围内导致不可逆性失明的主要原因之一,其特点是进行性视神经病变和视野(VF)损伤。在青光眼管理中,准确评估疾病进展至关重要,而监测功能变化(即视野)是其中的关键环节,因为它直接关系到患者的日常生活能力。目前,标准自动视野检查(SAP)是检测功能损伤最广泛使用的测试方法。
为了预测青光眼患者的视野衰退,过去的研究提出了多种统计技术。其中,对纵向收集的视野数据(如平均偏差(MD)系列、视野指数和点状视野敏感度数据)进行趋势分析越来越普遍。尽管存在更复杂的统计方法,但普通最小二乘回归(OLSR)仍然是目前最常用于对单眼视野数据进行建模和趋势分析的统计方法。然而,OLSR方法存在明显的局限性。它假设模型误差是独立的、不相关的,并且服从正态分布。但研究表明,使用OLSR方法对纵向视野数据进行趋势分析是不充分的,因为其拟合残差往往表现出相关性(自相关)和异方差性。这导致OLSR方法会高估趋势的显著性,从而可能提供关于疾病进展的不准确信息。此外,OLSR方法在预测时通常只考虑时间与MD的线性关系,而忽略了数据点之间的时间依赖性,这使得其外推预测往往不可靠。
为了解决OLSR的这些问题,时间序列模型(如自回归移动平均(ARMA)模型)被设计用于分析随时间顺序收集的数据。其中,一阶自回归(AR(1))模型是常用的方法之一。然而,常规的时间序列模型(如AR(1))要求观测值在时间上是等间隔的,并且序列是平稳的。但在临床实践中,患者的门诊随访时间通常是不规则的,且数据可能不服从正态分布,这使得常规时间序列模型也不适用于拟合视野数据。
因此,本研究旨在探索一种不规则自回归(1)模型,即IAR(1)模型,作为OLSR的替代方法。IAR(1)模型是AR(1)模型的扩展,专门设计用于拟合在时间上不规则测量的平稳时间序列数据。与OLSR和常规AR(1)模型相比,IAR(1)模型具有两大优势:首先,它能够处理不规则时间间隔的观测数据;其次,它不仅适用于高斯(正态)误差,还可以扩展到重尾分布(如学生t分布),这使其更符合视野数据的实际分布特征。
为了验证IAR(1)模型的有效性,研究人员开展了一项回顾性研究,旨在比较IAR(1)模型与OLSR方法在拟合和预测青光眼患者MD系列数据方面的表现。该研究基于美国俄勒冈州波特兰市Devers眼科研究所正在进行的波特兰进展项目的数据。研究纳入了43只眼(共1232个MD数据点),这些眼均具有至少25次随访记录,且MD系列显示出显著的进展或显著的时间相关性。研究采用RStudio和Python编程语言进行统计分析,通过比较两种模型的预测均方误差(MSE)来评估其预测准确性。
最终分析共纳入43只眼,平均随访时间为18.34年。这些眼平均有28.78次随访记录,首次访视的平均MD为0.30 dB,末次访视的平均MD为-3.97 dB,表明研究人群的视野功能在随访期间出现了明显的恶化。
在纳入的43只眼中,有16只眼(37.2%)的MD系列表现出显著的时间相关性(即残差在滞后1阶的自相关函数(ACF)显著)。在这16只眼中,约69%的眼同时表现出显著的视野恶化(即进展率显著小于0)。这表明,在青光眼患者中,时间相关性与疾病进展常常并存。
研究人员以一个具有代表性的眼为例,比较了OLSR和IAR(1)模型的拟合效果。结果显示,OLSR模型的残差在滞后1阶表现出强烈的正相关,这明显违反了OLSR关于误差不相关的核心假设。相比之下,IAR(1)模型的残差则表现为不相关,满足了模型假设。这表明IAR(1)模型在统计上比OLSR模型更有效。
研究人员将每个眼的后5次观测值作为测试集,比较了OLSR和IAR(1)模型的预测准确性。结果显示,在16只具有时间相关性的眼中,IAR(1)模型在12只眼(75%)中取得了比OLSR更低的预测均方误差(MSE)。在27只无时间相关性但显著恶化的眼中,IAR(1)模型在19只眼(70.4%)中取得了更低的MSE。综合所有43只眼,IAR(1)模型在72%的眼中取得了比OLSR更低的预测MSE,这一差异具有统计学显著性(p < 0.001)。这表明,无论MD系列是否存在时间相关性,IAR(1)模型在预测未来MD值方面均优于OLSR模型。
本研究的主要结论是,OLSR方法不适合用于建模纵向收集的MD系列数据,因为它违反了正态性和误差不相关的核心假设。基于OLSR的预测没有考虑MD值之间的时间依赖性,因此其预测结果存在偏差。
相比之下,IAR(1)模型作为一种时间序列方法,专门设计用于处理时间顺序数据之间的依赖性。该模型在预测时不仅考虑了数据自身的模式,还考虑了数据之间的滞后依赖关系。此外,IAR(1)模型能够处理不规则时间间隔的数据,并且适用于正态分布和重尾分布的数据,这使其成为拟合青光眼患者MD系列数据的更优选择。
尽管IAR(1)模型比OLSR更有效,但它也存在一定的局限性。与常规时间序列模型一样,它假设数据是平稳的,并且通常假设方差恒定(同方差性),而视野数据可能不满足这些假设。此外,OLSR和IAR(1)都是线性模型,可能无法最优地预测由视野检查算法在0 dB以下截断数据所导致的渐近线。
尽管如此,本研究证实了IAR(1)模型在统计上比OLSR更有效,并且具有更好的预测能力。考虑到其处理相关误差、高斯和非高斯数据的能力,IAR(1)模型可以作为拟合和预测青光眼患者MD系列数据的更优替代方法,为临床医生提供更可靠的疾病进展信息,从而有助于制定更精准的治疗决策。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号