
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:人工智能会解开运动员发展的谜题吗?人工智能在运动员识别、选拔和发展中应用的批判性评论
【字体: 大 中 小 】 时间:2025年09月16日 来源:Psychology of Sport and Exercise 3.3
编辑推荐:
本综述深入探讨了人工智能(AI)在运动员发展领域(包括人才/运动员识别、选拔和发展)的应用现状与挑战。文章系统回顾了机器学习(ML)、深度学习(DL)等AI技术如何革新运动员评估、选拔分类及训练发展模式,同时指出了数据有效性、管理伦理及技术专业化等关键问题,为未来实现人机协同的 holistic(整体性)运动员发展提供了前瞻性视角。
人工智能(AI)在运动员发展领域的应用浪潮:机遇与挑战并存
近年来,人工智能(AI)技术,特别是机器学习(ML)和深度学习(DL),在运动科学领域经历了爆炸式增长。从迈克尔·刘易斯(Michael Lewis)的《点球成金》(Moneyball)所描述的现代统计学方法,到今天近乎无处不在的AI应用,高性能和职业体育已经全面拥抱了数据驱动的决策方式。然而,尽管兴趣激增,但这些AI方法在运动员发展背景下的实际范围、效用及相关挑战仍相对未知。这篇批判性综述旨在扫描运动科学研究,聚焦于AI在运动员发展背景下的应用,即人才/运动员识别、选拔和发展。
方法学途径
本研究采用了批判性综述的方法,以便在广阔的研究领域(涵盖运动科学、计算机科学、数学科学等)内进行灵活而广泛的搜索。该方法允许检索和报告同行评审期刊文章之外的其他信息资源,如书籍章节、会议论文等,为这一快速发展领域的解释、综合或理论构建奠定基础。
检索过程借鉴了范围综述的初期步骤。研究团队利用了一个为AI在体育中应用的范围综述而近期收集的大型文章数据库。该数据库通过检索Scopus、SPORTDiscus和MEDLINE构建,使用了诸如“machine learning”(机器学习)、“deep learning”(深度学习)、“neural networks”(神经网络)等术语,并与“[sport OR sports OR sporting]”及一系列奥运项目名称组合搜索。之后,对标题和摘要进行了筛选,初步纳入标准包括:考察AI的某个方面、跟踪运动员相关结果至少1年、关注高水平运动、以及有全文且为英文。随后,通过“快速评审”确定了与“运动员发展”、“人才识别”和“运动员选拔”等关键术语相关的核心文章,并补充了外部资源,最终由作者团队讨论并将文章归类为有意义的类别进行述评。
主要发现
提升运动员评估
多项研究专注于开发或测试用于评估运动员的新模型。机器学习方法常被用来探索变量间更高复杂度的相互关系,这超出了传统统计方法的能力范围。
例如,邓肯等人(Duncan et al., 2023)使用ML方法评估了各种人体测量学、技术、心理因素以及教练评分对英格兰基层青年男足运动员技术技能的价值。在40个不同的预测因子中,总功能性运动筛查(Functional Movement Screening)分数是预测足球技术技能的最重要特征,其次是教练对球员技能的年龄评级、运动年限和峰值身高速度年龄。
另一个例子来自卡梅隆等人(Cameron et al., 2024),他们使用ML开发了一套新颖的绩效指标,用于量化运动员在英式橄榄球联盟中对团队成功的整体贡献。这些指标包括进攻(如“创造的胜利”)和防守(如“造成的失败”)的衡量标准,并可合并为一个“净增加胜利”的全局指标。这类指标的价值不仅限于精英发展层面,它们对于在整个高水平技能获取的漫长过程中追踪进展可能具有重要意义。科恩等人(Kohn et al., 2024)评估了大学棒球运动员的力量测量、功能性运动能力和人体测量特征的多维度组合。他们的结果阐明了不同因素组合对比赛表现(如人体测量学因素与功能性运动分数所解释的方差量)的贡献。
新技术也应用于个人项目的绩效分析。例如,在一项关于短跑速度-时间曲线的最新研究中,Tam和Yao(2024)发现支持两种ML模型,它们尽管使用更少的变量,却更易获取且更准确。另一项调查(Lai et al., 2018)使用网络分析来探索运动员对手的质量如何影响其长期排名和表现。尽管缺乏实证研究证明其有效性,此类运动员评估方法已导致许多职业体育俱乐部和组织投入大量资源(人力、财力、时间)于AI应用。
运动员选拔与分类
除了研究AI如何改进运动员评估,许多研究者还关注这些工具如何改善运动员选拔背景。
例如,Jauhiainen等人(2019)使用来自951名14岁芬兰青年男足运动员的数据集训练ML算法,以检测未来可能的“精英”球员(即随后在16岁时与学院签约的球员)。最准确的模型包括技术技能、速度和敏捷性测试。同样,Kelly等人(2022)使用交叉验证的Lasso回归来检查被选拔(即获得职业合同)和未选拔(即未获得职业合同)的英格兰U18男足学院球员的特征。在分析的53个特征中,更强的应对表现和发展压力的感知能力,以及组织和参与高质量训练的强大能力,是获得职业合同的重要因素。
在板球运动中,Jones及其同事(2019, 2020)进行了一系列使用ML方法的研究,以探讨发展变量在预测技能水平方面的价值。在一项研究(Jones et al., 2019)中,他们使用非线性模式识别分析了英格兰高级国际和职业(即一流郡级)男子旋转投手的93个特征。一个包含十二个发展特征的子集,包括更早参与板球、更大数量的领域特异性练习和比赛、以及更强的适应新竞争水平的能力(例如,克服发展挑战的能力),区分了国际组和职业组。作者使用类似方法分析了英国男子板球击球手中“超级精英”(即预先确定的高级国际知名选手)和“精英”(即预先确定的国内高级职业知名选手)之间的差异(Jones et al., 2020)。“超级精英”击球手在16岁时进行了量更大、更具随机性和多样性的技能练习。
除了上述关于足球和板球的研究,ML技术在团队运动背景中尤其突出,例如预测手球运动员的不同移动类型(Oytun et al., 2020)、橄榄球联盟的未来职业成就(Till et al., 2016)、青年英式橄榄球联盟地区人才选拔营的入选者(Owen et al., 2022),以及排球中的高水平和低水平表现者(Musa et al., 2023)。虽然较少见,但这些方法也在个人项目中得到探索,包括赛艇(Liu et al., 2023)、击剑(Aresta et al., 2022)、射箭(Musa et al., 2019)、滑板(Ab-Rasid et al., 2024)和网球(Siener et al., 2021)。这些研究为了解入选与未入选(或等效)队列之间的差异提供了见解,但它们未能捕捉到运动项目以及运动员发展终点随时间演变的方式。预测体育项目随时间的变化对于理解不同项目所需的特点以及为获取这些特点开发合适的环境至关重要。不幸的是,这类工作大多是横断面研究或时间较短(例如,单个赛季),这些设计对于在相当长的时间框架内指导运动员发展模型的价值有限。
运动员训练与发展
在运动员发展背景下,AI也被用于评估参与和训练模式。
例如,Barth等人(2019)采用了一种系统的方法,将决策树和梯度提升应用于先前发布的数据,以检测国际级和国家级运动员在主项和其他项目练习量方面的差异。与先前研究中使用的更传统的统计方法相比,作者得出结论认为AI更优越,并声称这些发现为支持研究者使用更复杂的当代方法重新分析已发布数据提供了证据。延续类似思路,Barth等人(2020)使用监督ML方法探讨了运动员在其主项和其他项目中接受监督和教练指导的练习如何影响其表现和获得国际奖牌的成功。研究显示,“14岁前在其他项目中进行教练指导的练习”是获得奖台名次的最重要因素。作者总结说,这两项研究的综合结果强调了将传统统计方法与AI结合以增强测试和发现变量间模式的价值。
在另一个例子中,Güllich等人(2019)使用AI分析了赢得奥运会和世界冠军的运动员与发展传记中未赢得任何重大奖牌的国际运动员之间的差异。使用一种称为模式识别分析的ML方法,作者发现更成功的运动员:(a) 在重要的积极运动里程碑附近经历了早期的负面生活经历;(b) 将运动的相对重要性置于其他生活方面之上;(c) 表现出更强的强迫症/完美主义和对运动相关的无情/自私;以及 (d) 拥有与其身体和心理社会需求更匹配的教练。作者强调使用AI是该研究的一个主要优势,并表明发展建模可能是体育领域进一步研究的一个富有成果的领域。
最近,Anderson等人(2022)在一项纵向、前瞻性设计中使用AI来整体建模奥运举重运动员的发展。作者基于一个多学科的专长主题框架,采用了四种ML算法(即朴素贝叶斯、J48决策树、支持向量机和K近邻)。由此分析产生的摘要模型选择了一组关键的九个特征,以91%的平均准确率区分了高表现者和低表现者。总的来说,这些研究展示了AI在支持运动员发展研究中的前瞻性、纵向和多学科方法方面的效用。
在运动员发展背景下使用AI面临的挑战
无论好坏,这些技术正迅速成为全球许多运动员发展背景的一部分。一个例子是2024年1月的一则新闻报道(Smith, 2024);英超足球俱乐部切尔西将使用一款新的应用程序——aiScout——允许球员上传自己进行特定训练和技能的视频片段,俱乐部可以在远离赛场的地方进行评估。其他职业俱乐部也纷纷效仿。虽然这些方法可以从多种方式进行批评(例如,缺乏对负面影响的考虑、在未建立输出效度和信度的情况下快速实施、可能加剧“拥有”和“未拥有”组织及国家之间的分歧),但这些批评可能会掩盖对一个存在众所周知缺陷和局限的运动员发展系统进行积极变革的潜力。下面我们讨论与在体育背景下使用AI相关的若干挑战和机遇。
确立新兴方法的有效性
高性能体育技术进步的现实是不断变化。这给试图为新测量方法建立明确效度、信度、敏感性和特异性证据的科学家和产品开发者带来了挑战。然而,许多这些新技术(包括aiScout)相比传统测量有一个关键优势——更容易获取运动员数据。这一直是高性能体育传统研究设计的关键限制,这些设计依赖于难以接触的小样本群体。对测量质量的担忧可能会在一定程度上被大样本的力量所抵消,大样本更能代表它们所要反映的群体。
然而,确定新数据源的价值仍将是一个挑战,原因有几个。首先,新的数据获取和建模方法假设我们知道关键的信息来源是什么。虽然这个问题在数据分析环境中可能不那么重要,因为其关注点是表现,但在发展过程中进行预测的广泛时间范围使这变得 substantially( substantially)更加复杂和困难。相关地,使用现有数据集的ML方法可能使用的是与它们试图预测的队列显著不同的数据(即队列效应)。因此,过去解释某些运动员/群体成功的原因可能不再相关,因为背景已经发生了变化。
数据管理中的新兴问题
可以说,AI给运动科学许多领域带来的最显著变化是可用数据量的激增。计算机视觉的进步提供了生物力学信息的非侵入性测量(例如,Fitzpatrick et al., 2023; Mecheri et al., 2016),激光雷达和多普勒雷达的使用允许远程收集心率数据(Bouazizi et al., 2022),3D跟踪系统的集成允许在竞技场、体育场和棒球场进行运动员跟踪和评估。虽然以前的研究需要招募运动员进行运动科学研究,通常涉及侵入性的数据收集方法,但未来数据收集将主要在“运动员体外”进行。
直接由于AI产生的大量数据,关于正在被大量收集和分析的数据的所有权问题日益受到关注。所有权在这里指的是由运动员产生的数据的存储、可访问性、使用和销售。因此,利益相关者发现自己处于确定数据合法所有者的挑战性位置。不幸的是,尽管数据是由运动员产生的(通过可穿戴技术或外部动作捕捉),但运动员自己很少在决定所有权的过程中成为决策者。正如Fonseca及其同事(2022)在他们关于个人项目运动员数据所有权的叙述性综述中所阐明的,通常是运动员自己受到他们产生的数据的负面影响(有时是被剥削),这使得他们的声音在数据所有权决策中被听到变得更加关键。
由于对道德、尊重和严谨的数据所有权实践的日益关注,法规、法律和协议(体育内外)正在整合数据所有权条款和实践。例如,美国国家篮球协会(NBA)禁止在合同谈判和球员交易中使用可穿戴技术数据,以减轻对运动员数据的不当使用和剥削(Socolow & Jolly, 2017)。一方面,这代表了在运动员权益倡导方面迈出的充满希望的一步,但另一方面,它也为第三方访问以货币化(如增强广播收视率和球迷参与度)以及进一步使用和共享运动员数据创造了问题。
技能专业化的加剧
最后一个挑战关系到在AI背景下工作和蓬勃发展所必需的专业知识。当前的理论和政策强调运动员发展的“整体性”或“系统级”方法,这需要多领域的多样化知识。同时,该领域使用的知识和方法正在以惊人的速度增长,这有可能在理解和使用这些方法的群体(例如,分析团队)和不理解它们的群体(例如,教练、训练师)之间造成障碍。这给两个群体都带来了压力,前者可能没有能力向没有受过他们培训的群体解释其分析的复杂性(即知识诅咒;Pinker, 2015),后者可能因为害怕尴尬而在不理解时不倾向于提问。
在一篇关于AI在体育中的综述中,Hammes等人(2022)强调了研究人员面临的五个广泛挑战,这些挑战在这里也很适用。这些挑战涉及:(a) 评估对AI有用的正确类型和数量的数据;(b) 连接AI和体育社区以允许创建和访问所需的数据;(c) 允许教练和训练师等从业者保持控制感;(d) 确保AI输出是可解释的,并且最终用户不需要专业知识;以及 (e) 记住AI输出是预测性的而非解释性的,这限制了它们直接为理论发展和/或测试提供信息的能力。
设计未来:进一步研究的方向
AI有潜力彻底改变运动员的训练方式、教练的指导方式以及球探的评估方式。与此同时,在没有深思熟虑和主动 approach(方法)的情况下拥抱这些技术,可能会浪费 time(时间)(最好情况),和/或导致基于不准确或不完整信息的糟糕政策(最坏情况)。虽然该领域的未来研究可能希望拥抱AI将给运动员识别和发展背景带来的明显优势,但研究人员也需要承认这些方法的潜在局限性。
确定AI的局限性
尽管有关于广泛可用数据潜力导致“理论终结”的言论(Anderson, 2008),但这些技术成为解决运动员发展复杂过程的万灵药的可能性很小,至少在可预见的未来是这样。人机协同(Jarrahi, 2018; Licklider, 1960)要现实得多,因为许多AI专家认为,人类与计算机结合在许多事情上的表现将优于任何一方单独行动(Davenport, 2016; Siegel, 2016; Yun et al., 2021),用Jarrahi (2018) 的话说,“AI系统的设计意图应该是增强而非取代人类的贡献”。
为了达到最佳效果/结果,确定人类和计算机在给定任务中的优势和劣势非常重要。一方面,计算机在执行某些定量任务的准确性和速度上已经超越了人类(Parry et al., 2016)。计算机在知识生成、知识综合和记忆 recall(回忆)方面具有远超任何人类或人类群体的能力(Simon, 1982)。另一方面,人类在更主观和定性的任务上胜过AI,并且很可能在很长一段时间内保持如此。通过利用人类和计算机的最佳优势,可以产生强大的协同效益。这可能部分与这样一种观念有关,即计算机(拥有适当信息)在形成判断和做出决策时可能不易受到某些类型的偏见的影响(Bersoff, 2001; Kamiran & Calders, 2010)。在他们的工作中,Grgi?-Hla?a及其同事(2019)进行了一系列实验,研究机器生成的建议是否能提高人类在司法背景下的决策质量。他们实验的结果表明,在某些条件下,计算机的建议有助于提高决策质量和准确性。作者总结说,在设计和使用建议给予机器和建议接收人类决策者之间的强大接口方面存在益处。
运动员球探是一个完美的例子,说明在复杂动态环境中的“真实世界”困难决策中如何实现增强。虽然计算机可以非常可靠地评估和处理运动员及其表现统计数据,但计算机视觉的任何进步都无法“看到”球探通过与运动员会面、与其父母、教练等交谈所能洞察到的品格特质。然而,当混合使用时,利用球探的专家眼光和计算机的数字处理能力,很可能产生比任一系统单独运作更大的力量。以医学判断和决策为例。在淋巴结图像中检测癌症的背景下,完全AI方法的错误率为7.5%,而样本中病理学家的错误率为3.5%。当检查病理学家结合AI和专家输入时的表现时,错误率降至0.5%(提高了85%;Wang et al., 2016)。未来工作的一个关键领域将是确定这些工具的哪些方面是开创性和革命性的,哪些是当前可用工具的有用扩展和省时选项,以及哪些是导致研究者偏离解决该领域实际挑战的干扰因素。相关地,鉴于运动员(和人类)发展的复杂过程,理解AI驱动数据化带来的心理社会风险将非常重要,特别是在越来越关注绩效结果的环境中对待年轻运动员方面(参见Lupton & Williamson, 2017; Millington & Millington, 2015)。
整体运动员发展的综合方法
传统的运动科学方法在很大程度上按学科(如生理学、心理学、生物力学)孤立进行。理解运动员表现和发展的单维方法的局限性是众所周知的。然而,新数据的快速可用性可能帮助研究者和其他利益相关者建立更全面的运动员健康、表现和发展模型。跨更广泛类别的可用数据量的增加将使研究者能够接受基于复杂性科学或其他综合人类表现和发展方法的方法。
AI的潜在价值体现在更容易地将运动科学许多方面日益增多的信息整合到可管理的数据集中。重要的是,这些信息的可访问性比以往任何时候都更广泛,随着时间的推移,这应该会拉平各国在运动科学领域传统上的差距。可用数据的广度也更大,意味着可以考虑变量间相互作用的更复杂模型,这一直是先前研究的一个显著局限性。最后,也许最关键的是,这些增加的数据在大多数情况下对运动员的要求 significantly(显著)降低。
虽然未来需要研究来探索这些技术在这些背景下的 benefits(益处)和 drawbacks(弊端),但就如何(以及如何不)使用它提供指导将是宝贵的下一步。虽然本文显然无法讨论AI影响运动员发展背景的所有方式,从增加运动科学家和从业者可用的数据的深度和广度、改进统计分析和数据建模方法(Bai & Bai, 2021),到影响运动员、教练和其他从业者的培训(Passmore & Woodward, 2023),以及预测运动科学和表现的未来趋势(Naik et al., 2022),但一场深思熟虑和理性的讨论可能会提供重要线索,说明AI如何被整合以改善运动员识别、发展和选拔背景。虽然运动员发展之谜仍未解开,至少在可预见的未来是如此,但AI将帮助我们比以往任何时候都更容易地贡献更多数据,并具有更大的统计复杂性。重要的是,一种拥抱创新和批判性评估的平衡方法是必要的,以确保这些工具增强而非 disrupt(破坏)运动员识别、选拔和发展 landscape(格局)。
生物通微信公众号
知名企业招聘