《Sports Medicine - Open》:Machine Learning-Based Prediction of Track Sprint Cycling Performance in Elite-Level Male Cyclists: A Multinational Cross-Sectional Analysis
编辑推荐:
传统的线性分析方法可能无法充分捕捉实验室测得的短跑测试指标之间的非线性关系与交互作用。本研究旨在利用基于无氧测功仪指标的多重线性回归(multiple linear regression, MLR)和随机森林(random forest, RF)模型,预测精英
传统的线性分析方法可能无法充分捕捉实验室测得的短跑测试指标之间的非线性关系与交互作用。本研究旨在利用基于无氧测功仪指标的多重线性回归(multiple linear regression, MLR)和随机森林(random forest, RF)模型,预测精英男子场地自行车运动员的飞行启动短跑成绩。本研究纳入333名精英男子场地自行车运动员,完成30秒全力蹬车测功仪冲刺测试以及室内赛车场飞行100米和200米短跑测试。从测功仪测试结果衍生的8个预测变量(体重、峰值功率输出、30秒平均功率、平均踏频、相对峰值功率、标准化至体重的5秒最大平均功率、最大5秒功率下降值以及百分比功率下降值)被用于构建多重线性回归和调优随机森林模型。模型性能在独立保留的测试集上进行评估,随机森林超参数通过训练数据的嵌套交叉验证进行优化。100–200米分段耗时(飞行200米减去飞行100米耗时)在未调整和经峰值功率调整的模型中进行分析,以评估功率衰减指标与后半程短跑成绩的独立关联。在相互调整的多重线性回归模型中,30秒平均功率是飞行100米和200米耗时的唯一独立预测因子(p < 0.001)。测试集预测性能对于线性回归而言较为适中(100米:R2 = 0.326;200米:R2 = 0.329),经调优的随机森林模型略高(100米:R2 = 0.369;200米:R2 = 0.393)。随机森林重要性分析一致地将相对峰值功率和30秒平均功率列为两项结果中最具影响力的预测因子。百分比功率下降值在未调整或峰值功率调整模型中均与100–200米分段耗时无独立关联。研究人员得出结论:冲刺成绩可通过常规采集的测功仪指标以中等准确度进行预测,其中持续输出功率能力和相对峰值功率为主要贡献因素。在控制峰值功率后,功率衰减指标与后半程冲刺成绩无独立关联,这提示30秒全力蹬车测功仪冲刺测试所测量的砾下来的疲劳抵抗力可能并不能直接转化为竞技性后半程冲刺成绩。
该研究旨在解决精英场地短跑自行车运动员成绩预测中的关键问题。传统线性分析方法难以充分捕捉实验室测得的短跑测试指标之间的非线性关系与交互作用,导致预测精度有限。尽管实验室测功仪测试可提供峰值功率、相对峰值功率以及疲劳相关 suvconnectedthat is参数等客观指标,但实验室环境与真实竞技条件存在显著差异,包括空气动力学阻力、战术决策需求以及动态自行车操控要求等因素均无法完全复制,因此实验室测量参数与实际比赛结果之间常存在明显差距。此外,传统统计方法假设变量间存在简单线性关系,可能无法反映短跑自行车成绩形成的复杂机制。研究人员开展此项研究的目的在于,利用基于无氧测功仪指标的多重线性回归和随机森林模型,预测精英男子场地自行车运动员的飞行启动短跑成绩,并检验功率衰减指标是否与后半程短跑成绩存在独立关联,以期为教练员和运动员提供更精准的成绩预测工具和训练指导依据。该论文发表于《Sports Medicine - Open》。
研究采用的关键技术方法包括:基于333名来自韩国、英国、澳大利亚和日本的精英男子场地自行车运动员的跨国样本队列,这些运动员均持有国际自行车联盟(Union Cycliste Internationale, UCI)或国家联合会执照,并参与结构化短跑训练计划。所有受试者完成30秒最大蹬车测功仪冲刺测试(使用Wattbike Pro测功仪)以及室内250米赛车场飞行200米短跑测试(附带100米中间分段计时),实验室与场地评估在7天内完成。建模方法采用多重线性回归和经嵌套交叉验证调优的随机森林回归,固定训练-测试分割比例为80%训练集(n=266)和20%测试集(n=67),模型泛化性能通过保留测试集上的决定系数(R
2)、均方根误差(root mean square error, RMSE)、平均绝对误差(mean absolute error, MAE)以及中位绝对误差(median absolute error, MedAE)和Pearson相关系数进行评估。预测重要性通过基于不纯度(平均不纯度减少,mean decrease in impurity, MDI)和基于置换的重要性两种互补方法量化,并以100–200米分段耗时作为后半程短跑性能的探索性分析指标。
多重线性回归分析结果显示,在相互调整的八预测因子模型中,30秒平均功率是飞行100米和200米耗时的唯一独立预测因子(p < 0.001),更高的平均功率与更快的短跑成绩相关。预测性能在独立测试集上表现为:飞行100米的R
2为0.326,RMSE为0.136秒,MAE为0.107秒;飞行200米的R
2为0.329,RMSE为0.286秒,MAE为0.223秒。方差膨胀因子(variance inflation factor, VIF)范围为1.37至158.71,表明功率衍生指标之间存在显著多重共线性。
随机森林回归分析结果显示,调优随机森林模型相较于多重线性回归显示出略优的泛化性能:飞行100米的R
2为0.369,RMSE为0.132秒,MAE为0.102秒;飞行200米的R
2为0.393,RMSE为0.272秒,MAE为0.214秒。嵌套交叉验证的外折R
2表明泛化性能存在一定变异性(飞行100米:外折R
2 = 0.295 ± 0.200;飞行200米:外折R
2 = 0.301 ± 0.181)。预测重要性分析一致显示,相对峰值功率(W·kg
-1)和30秒平均功率(W)为两项结果中影响力最大的两个预测因子,其次为标准化至体重的5秒最大平均功率和峰值功率输出。两种重要性评估方法的结果大体一致,支持预测因子排序的稳健性。具体而言,相对峰值功率和30秒平均功率在飞行100米中的联合贡献约为68%(分别为35.2%和32.7%),在飞行200米中约为71%(分别为35.2%和35.7%)。
功率下降百分比与后半程冲刺性能的分析结果显示,在双变量模型中,百分比功率下降值与100–200米分段耗时无关联(β = -0.00144秒·%
-1, p = 0.227)。在控制峰值功率后,该关联仍无统计学意义(β = 0.000876秒·%
-1, p = 0.426),而峰值功率本身与后半程性能显示强独立关联(β = -0.000361秒·W
-1, p < 0.001)。
讨论部分,研究人员首先指出本研究的主要发现:在纳入八个相关短跑测试预测因子的相互调整线性回归模型中,30秒平均功率是飞行100米和200米短跑性能的唯一独立预测因子。在预测建模框架内,调优随机森林模型相较于线性回归在保留测试集上显示出适度的性能提升,并一致将相对峰值功率和30秒平均功率识别为两项结果中最具影响力的预测因子。功率衍生预测因子之间存在显著多重共线性,这反映为升高的VIF值,可归因于纳入了数学和生理上相关的变量,如绝对和体重标准化功率指标。在此条件下,30秒平均功率最好被理解为整合性标志物,反映了最大输出能力和在短时长全力努力中维持高功率输出的能力,这解释了其在相互调整后作为短跑性能唯一独立相关因子的稳健性。
针对机器学习方法学,研究人员强调该程序结构设计旨在限制过拟合并评估小样本高相关性预测因子条件下的泛化性,遵循了Vos等人关于小样本骑行性能预测研究的原则。因此,研究者采用固定训练-测试分割进行最终测试集性能评估,通过嵌套交叉验证调优随机森林超参数,比较基线和调优随机森林模型以验证过拟合情况,并同时报告基于不纯度和基于置换的重要性。因此,随机森林结果应被解释为反映优先考虑泛化性而非训练数据拟合的保守模型。
研究人员进一步解释,其他功率指标包括峰值功率和相对功率在相互调整后未保持独立统计显著性,这归因于数学和生理相关功率指标之间的大量共享方差。在探索性分段耗时分析中,百分比功率下降值在双变量模型中与后半程短跑成绩无关联,在控制峰值功率后仍无统计学意义,而峰值功率显示出强独立关联。这一模式提示,30秒测功仪冲刺衍生的功率衰减指标在控制整体短跑功率能力后,可能不能直接转化为飞行短跑100–200米段的成绩,任何明显的未调整关联可能反映了整体短跑功率能力的混杂效应。
研究人员将本研究结果与现有文献进行比较,指出Smirniotou等人报告下肢力量和功率指标解释了约46%的100米短跑成绩方差,与本研究模型达到的0.33–0.39测试集R
2相当。同时,研究人员也指出本研究的适度测试集R
2(0.33–0.39)应结合预测因子集仅限于30秒Wattbike衍生变量来理解;更全面的预测因子集可产生更高的解释力,如Van der Zwaard等人使用肌纤维和形态学变量解释标准化短跑性能达R
2 = 0.65,Vos等人使用生理、训练负荷和体成分预测因子预测4公里计时赛成绩达R
2≈0.79–0.88。
尽管体重在相互调整模型中并非独立预测因子,相对峰值功率(W·kg
-1)在随机森林重要性分析中始终位列最具影响力预测因子之一,支持功率-质量特性在短跑自行车性能中的实际相关性。随机森林回归持续优于线性模型预测短跑时间,尽管幅度适中,暗示预测因子间存在非线性关系和交互作用。R
2的提升幅度适中(约0.04–0.06),表明虽随机森林方法增加了增量预测价值,但性能方差的相当比例仍未被解释。研究人员指出,由于个体多重线性回归系数在显著多重共线性条件下可能不稳定,随机森林基于重要性的排序(特别是置换重要性)提供了较少依赖系数估计的补充视角,因此在共线性条件下更为稳健。
针对嵌套交叉验证中外折R
2的较大变异性,研究人员解释这主要归因于各外折的小样本量(n ≈ 26–27),这是小样本预测中不稳定的性能估计的公认来源,加之精英自行车运动员狭窄的性能范围以及预测因子集中缺少场地特定因素(如空气动力学、齿轮比、技术技能)。
在局限性方面,研究人员明确指出:分析仅限于30秒全力蹬车测功仪冲刺测试衍生的无氧指标,未纳入可能影响竞技表现的技术、空气动力学和心理因素;仅纳入男性运动员,限制了研究结果向女性场地短跑自行车运动员的推广;横断面设计限制了因果推断能力;预测因子集包含数学和生理相关的功率指标导致显著多重共线性,个体回归系数应谨慎解释为相互调整关联而非孤立因果效应。
研究结论部分原文翻译如下:"In this multinational cohort of elite-level male track cyclists, sprint performance was predicted with modest accuracy from routinely collected 30-s ergometer metrics. After mutual adjustment, 30-s average power was the only factor that was independently correlated with flying 100-m and 200-m times, whereas RF models consistently identified relative peak power and 30-s average power as the most influential predictors. Percentage power drop was not independently associated with second-half sprint performance after adjustment for peak power. Future studies should externally validate these findings in female cohorts and incorporate additional technical and biomechanical variables to improve predictive performance."(在该跨国精英男子场地自行车运动员队列中,冲刺成绩可通过常规采集的30秒测功仪指标以中等准确度进行预测。相互调整后,30秒平均功率是唯一与飞行100米和200米耗时独立相关的因素,而随机森林模型一致地将相对峰值功率和30秒平均功率识别为最具影响力的预测因子。在控制峰值功率后,百分比功率下降值与后半程冲刺成绩无独立关联。未来研究应在女性队列中外部验证这些发现并纳入额外的技术和生物力学变量以改善预测性能。)