阈值边界回归模型的高效估计算法:基于加权支持向量机(WSVM)与最小二乘法的迭代优化

【字体: 时间:2025年09月16日 来源:Computational Statistics & Data Analysis 1.6

编辑推荐:

  本文提出一种创新的迭代两阶段算法(TBR-WSVM),用于估计阈值边界回归(Threshold Boundary Regression, TBR)模型。该算法将不可微的最小二乘(LS)问题转化为加权分类优化,结合加权支持向量机(WSVM)实现非线性边界的高效拟合,无需预设阈值参数或关键变量,显著提升了模型灵活性与计算效率,为时间序列与健康医学领域的样本分割问题提供了强大工具。

  

Section Snippets

阈值边界回归模型(Threshold Boundary Regression Models)

考虑数据集 { (yt, xt) },其中 t = 1, …, T,yt 为响应变量,xt 为 q×1 协变量向量。令 zt = (1, y′t-1, x′t)′,其中 yt-1 = (yt-1, …, yt-p)′,xt = (xt,1, …, xt,q)′。定义函数 Φ: {1}×Rp+q → {1}×Rd(d ≥ p+q),将 zt 映射到高维空间。TBR 模型可表述为:

yt = h(zt; θh) + { g(zt; θg) ? h(zt; θh) } I( Φ(zt)′θb ≤ 0 ) + ?t

其中 h(·) 和 g(·) 为自回归函数,θh、θg、θb 为参数向量,I(·) 为示性函数,?t 为误差项。

TBR模型估计算法(Algorithms for Estimating TBR Models)

基于真实模型 yt = h(zt; θh(0)) + { g(zt; θg(0)) ? h(zt; θh(0)) } I( Φ(zt)′θb(0) ≤ 0 ) + ?t,提出两阶段估计流程:

Step 1. 通过最小二乘法(LS)获取初始参数估计 (θ?h,0, θ?g,0)。

Step 2. 将最小二乘损失优化问题转化为加权分类问题,利用加权支持向量机(WSVM)求解阈值边界参数 θb,并通过迭代更新状态标签与回归参数实现高效拟合。

模拟研究(Simulation Studies)

通过多组模拟实验评估TBR-WSVM算法在有限样本下的性能,并与Algorithm M(MCMC方法)和Algorithm MIQP(混合整数规划)对比。Algorithm M中设置 (B1, B2) = (2000, 100) 以平衡偏差与计算成本。所有对比算法均需预设参数范围与关键变量,而TBR-WSVM无需此类先验设定,在非线性边界与高维协变量场景中表现更优。

实际应用(Application)

将TBR模型应用于比利时2014–2019年电力负荷数据(来源:Elia电网公开平台)。原始数据为15分钟间隔负荷记录,经日聚合后生成每日平均负荷序列。与传统基于日历启发式(如工作日/假日)的分类方法不同,TBR-WSVM通过数据驱动方式挖掘潜在消费 regime,实现更精准的 regime 特异性预测。

讨论(Discussion)

本文深入探讨了TBR模型估计的复杂性,提出以WSVM为替代方法解决NP难分类问题,在保证理论收敛性的同时显著提升计算效率。该方法为时间序列分析、健康状态评估(如生物年龄阈值建模)等领域提供了灵活且可扩展的建模框架。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号