人工智能在德甲比赛分析中的应用:通过预期控球价值(EPV)与预期进球数(xG)来预测足球比赛的结果
《Frontiers in Sports and Active Living》:AI in Bundesliga match analysis—expected possession value (EPV) vs. expected goals (xG) to predict match outcomes in soccer
【字体:
大
中
小
】
时间:2025年11月11日
来源:Frontiers in Sports and Active Living 2.6
编辑推荐:
预测足球比赛结果的有效性比较:xG与EPV的赛前和赛后应用
本研究对比了预期进球(xG)和预期控球价值(EPV)在赛前和赛后预测比赛结果中的有效性。基于德甲2022/23至2024/25赛季的918场比赛数据,开发了四类预测模型:xG/EPV赛前和赛后预测。结果显示,赛后xG预测表现最佳(RPS=0.148,准确率65.6%),而赛前EPV略优于xG(RPS=0.194 vs 0.199)。研究证实xG在赛后分析中更精准,EPV在赛前预测中更具优势,且结合两者可提升战术评估的客观性。
在现代足球运动中,数据分析和关键绩效指标(KPI)的运用已成为提升球队表现和理解比赛动态的重要工具。随着技术的进步,越来越多的KPI被开发出来,用于衡量球队和球员在不同情境下的表现。这些KPI不仅帮助教练和分析师更准确地评估球队的战术执行能力,还为预测比赛结果提供了科学依据。然而,面对如此多的KPI,如何筛选出最具预测价值的指标,成为足球数据分析领域的一个核心问题。本研究聚焦于两个广受关注的KPI——预期进球(xG)和预期球权价值(EPV),探讨它们在预测比赛结果方面的有效性,尤其是在赛前和赛后情境下的表现差异。
足球比赛的不确定性一直是其魅力所在,从弱队逆袭强队的杯赛奇迹,到强队在常规赛中遭遇意外失利,这些现象都表明了比赛结果并非完全取决于球队实力。因此,数据分析的引入为这一不确定性提供了更系统、更客观的解释方式。通过分析比赛数据,可以识别出那些对结果具有显著影响的指标,从而帮助教练和球队在战术安排和人员调配中做出更精准的决策。在这一背景下,xG和EPV作为衡量进攻表现的重要指标,被广泛应用于比赛分析和预测研究。
xG作为一种衡量球队进攻效率的KPI,其核心在于量化每脚射门转化为进球的概率。这种方法通过考虑射门位置、角度、身体接触、防守压力等因素,提供了对进攻质量的评估。然而,xG的局限性在于,它仅关注射门这一单一行为,忽略了其他重要的进攻环节,如传球、跑动、控球等。相比之下,EPV则提供了一个更全面的视角,它不仅关注射门,还考虑了每一次控球行为的潜在得分机会。EPV通过分析球员在场上的位置、球队的组织结构、防守压力等因素,评估每个控球行为的得分概率,从而为球队的整体进攻表现提供更细致的刻画。这种全面性使得EPV在预测未来比赛结果时表现出更强的适应性和准确性。
本研究的数据来源于三个连续的德甲赛季(2022/23、2023/24和2024/25),涵盖了918场比赛的事件数据和追踪数据。事件数据包括了比赛中发生的各种动作,如传球、射门、拦截等,而追踪数据则记录了球员和球在场上的位置变化。这些数据的结合为构建更精确的预测模型提供了基础。通过同步事件数据和追踪数据,研究团队能够更全面地捕捉比赛中的动态变化,并为模型训练提供高质量的输入特征。
在赛前预测方面,研究团队开发了基于xG和EPV的两种预测方法。这些方法利用了球队最近三场比赛的表现,以及比赛的上下文因素,如主场优势、对手实力等。结果显示,EPV在赛前预测中表现优于xG,其RPS为0.194,准确率为0.583,而xG的RPS为0.199,准确率为0.556。这一结果表明,EPV在预测未来比赛结果时具有更高的准确性和可靠性。EPV能够综合考虑球队在比赛中的多个关键因素,如控球质量、球员跑动效率、球队整体组织等,从而提供更全面的进攻表现评估。相比之下,xG虽然在衡量进攻效率方面有其独特优势,但其关注范围较为狭窄,可能遗漏了一些对比赛结果具有重要影响的细节。
在赛后预测方面,研究团队同样采用了xG和EPV两种方法。然而,与赛前预测不同,赛后预测基于已经发生的比赛数据,因此能够提供更直接的评估。结果显示,xG在赛后预测中表现最佳,其RPS为0.148,准确率为0.656,而EPV的RPS为0.191,准确率为0.596。这一结果可能与xG的聚焦性有关,因为赛后数据更直接地反映了球队在比赛中的实际表现,而xG作为衡量进攻效率的指标,能够更精确地捕捉射门质量的变化。此外,xG的计算方式相对简单,且数据可获得性较高,这可能也是其在赛后预测中表现优异的原因之一。
为了进一步评估这些KPI的预测能力,研究团队采用了多种评价指标,包括RPS、准确率和Brier Score。RPS用于衡量预测概率与实际结果之间的匹配程度,而准确率则直接反映了预测结果与实际结果的一致性。Brier Score则提供了对预测模型整体准确性的量化评估,同时还能分解为不确定性、可靠性与分辨力三个部分。这些指标的综合应用使得研究团队能够全面比较xG和EPV在不同预测情境下的表现。
从实际应用的角度来看,xG和EPV不仅在预测比赛结果方面表现出色,还能够为球队提供更深入的战术分析。例如,通过分析xG数据,教练可以了解球队在比赛中创造的进攻机会的质量,从而调整进攻策略。而EPV则能够揭示球队在控球和进攻组织方面的整体表现,帮助教练识别球队在不同阶段的战术执行情况。此外,这些KPI还可以用于赛后分析,帮助球队回顾比赛中的表现,找出成功或失败的关键因素。
在本研究中,xG和EPV的应用还揭示了一些重要的趋势。例如,xG在赛后预测中的表现优于EPV,这可能是因为赛后数据更直接地反映了球队的进攻效率,而EPV虽然在赛前预测中表现优异,但在赛后预测中可能受到比赛过程中不可控因素的影响。另一方面,EPV在赛前预测中的优势可能源于其对球队整体表现的全面考量,能够捕捉到比赛中未转化为射门的进攻机会,从而提供更丰富的信息。
研究团队还对模型的可解释性进行了深入分析,通过SHAP值(Shapley Additive Explanations)来揭示不同特征对预测结果的影响。SHAP值能够帮助分析人员理解模型的决策过程,识别哪些特征对预测结果起到了关键作用。例如,在赛前预测中,对手实力和主场优势被证明是最重要的因素,而在赛后预测中,球队的射门质量和数量则占据了主导地位。这种可解释性不仅提高了模型的可信度,还为教练和分析师提供了更具体的指导。
此外,本研究还指出了当前足球数据分析领域的一些局限性。首先,模型未能考虑球员个体的表现,如关键球员的贡献、伤病情况等。这些因素可能对比赛结果产生重要影响,因此未来的研究可以进一步引入球员层面的数据,以提高预测的精度。其次,研究仅基于三个连续的德甲赛季数据,可能无法完全反映模型的长期稳定性。因此,未来的研究需要扩展数据范围,以验证模型在不同时间和不同联赛中的适用性。第三,当前的预测模型主要关注单场比赛的预测,而未来的研究可以探索其在多场比赛预测中的表现,例如预测整个赛季的积分排名或特定阶段的比赛结果。
总体而言,本研究通过比较xG和EPV在赛前和赛后预测中的表现,为足球数据分析提供了一个新的视角。结果显示,EPV在赛前预测中具有更高的准确性和可靠性,而xG在赛后预测中表现更优。这种差异可能源于两种KPI在数据收集和分析方法上的不同。EPV能够更全面地评估球队的进攻表现,而xG则更直接地反映比赛中实际发生的进攻机会。因此,在不同的分析场景中,选择合适的KPI对于提高预测的准确性至关重要。
研究还强调了足球数据分析的实际应用价值。通过结合赛前和赛后预测,球队可以更全面地评估自己的表现,并为未来的比赛制定更科学的策略。例如,赛前预测可以帮助球队在比赛前识别对手的潜在优势和劣势,从而调整战术安排。而赛后预测则能够帮助球队回顾比赛中的表现,找出需要改进的地方。此外,这些预测方法还可以用于赛季中期的评估,帮助球队判断当前的战术是否有效,并及时做出调整。
本研究的结果对足球数据分析领域具有重要的启示意义。它不仅展示了xG和EPV在预测比赛结果方面的不同优势,还为未来的研究提供了方向。例如,如何进一步优化模型,使其在不同情境下都能保持较高的预测准确率;如何结合更多数据类型,如球员个体数据、伤病信息等,以提高模型的全面性和实用性;以及如何拓展模型的应用范围,使其不仅适用于联赛,还能应用于杯赛或其他类型的赛事。
最后,研究团队指出,尽管xG和EPV在预测比赛中表现出色,但它们仍然存在一定的局限性。未来的研究需要在这些方面进行深入探索,以进一步完善足球数据分析的体系。同时,随着技术的不断进步,更多的数据和更复杂的模型可能会被引入,从而提升预测的准确性和实用性。这些发展将为足球教练、分析师和球迷提供更丰富的信息,帮助他们更好地理解和预测比赛结果。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号