AI 研究助力体育分析

文 / Karl Tuyls, Shayegan Omidshafiei, Daniel Hennes, Jerome Connor, Zhe Wang, Adria Recasens Continente

创建测试环境以帮助 AI 研究走出实验室、落地现实世界是一项相当具有挑战性的任务。鉴于我们在游戏领域中长久应用 AI,如果要在体育运动中应用 AI 也不足为奇,这可为研究人员提供一个测试平台。存在针对数十个动态互动个体的多智能体环境,AI 系统可以帮助人类做出复杂实时决策。

所收集体育数据的快速增长意味着体育分析进入了一个非常重要的时代。体育数据的可用性在数量和粒度上都在不断增长,使汇总高级统计信息和棒球记录统计分析过渡到更加精细的数据,例如事件流信息(如带注解的传球或击球)、高保真运动员位置信息和 体感传感器

然而直到最近,体育分析领域才开始利用机器学习和 AI 来理解体育运动中的人类决策,并为其提供建议。在我们近期与利物浦足球俱乐部 (LFC) 在 JAIR 上合作发表的 论文 中,我们结合统计学习、视频理解和博弈论,对体育分析的前景进行了展望。我们特别将足球拿来举例,因为这个缩影对钻研 AI 研究来说非常有用,可通过自动化视频助理教练 (AVAC) 系统(如图 1(A) 所示)的形式使决策者长期受益。

图 1:(A) 描绘自动化视频助理教练界面的示例图,系统会检测、识别(根据球员名称)、追踪进攻和防守球员,并随后将其传入轨迹预测模型,以分析其潜在意图或既定轨迹。(B) 事件检测的程式化示例,包括特定目标事件(例如踢球)以及在整个比赛过程中不断精进的深度学习模型输出(“信号”)

足球对 AI 而言是一个有趣的契机

与其他一些运动相比,足球在系统收集大量数据方面起步较晚。收集的数据主要用于科学分析,旨在提升球队的球技。出现这种情况有诸多原因,其中最突出的原因是相较于其他运动(大型户外球类运动、动态游戏等),足球的可控性要低得多。而且人们普遍认为,足球主要依靠的是在职业足球方面有可靠成绩和经验的专家。阿里戈·萨基是一位成功的意大利足球教练兼经理,他从未参加过任何职业足球比赛。在 1987 年担任米兰教练时,他就用以下这句名言回应了批评他缺乏经验的人们:“我从来都不觉得在成为骑师之前,你必须得先成为一匹马。”

我们可以通过融合了计算机视觉、统计学习和博弈论 3 个领域的 AI 技术来解决足球分析中的诸多挑战(如图 2 所示)。虽说这些领域单独而言对足球分析很有用,但如果将几个领域相结合,它们的优势就会更加明显:球员需要在其他球员(包括己方球员和对方球员)在场的情况下连续做出决策,因此博弈论(一种互动决策理论)就变得非常重要。此外,我们可以根据比赛球员和特定球员的表现来学习比赛中特定情境的战术解决方案,因此统计学习也成为了一个非常重要的领域。最后我们可以对球员进行追踪,从大量可用的图像和视频输入中自动识别比赛场景。

图 2:在推进足球分析现状方面起重要作用的三个关键领域(博弈论、统计学习和计算机视觉)的说明性概述(针对每个相关领域列出了文献中的案例,并指出了相关的重叠领域)

我们假设 AVAC 系统位于这三个研究领域交叉形成的缩影中(图 2)。在研究这一激动人心的领域时,我们不仅为未来几年内可以解决的科学和工程问题制定了线路图,而且还为博弈论分析、统计学习和计算机视觉的融合领域带来了创新结果,以此来说明这一值得期待的领域将为足球带来什么。

AI 如何帮助足球领域

博弈论在体育研究中发挥着重要作用,并为运动员的行为策略提供了理论基础。以足球为例,很多足球场景都可以建模成零和博弈,这是自博弈论诞生以来人们广泛研究的一个概念。例如,我们将罚点球的情况建模成一个双方非对称博弈,罚球者的击球策略可分为从左侧、中央或右侧射门。

为研究这一问题,我们用 球员向量 来强化点球场景的博弈论分析,从而总结出足球运动员个人的踢球风格。通过每个球员的表现,我们可以将具有相似踢球风格的球员分组,然后在小组层面进行博弈论分析(图 3)。

结果显示,不同小组的踢球策略在统计学上有明显区别。例如,我们发现一组球员更喜欢从球门的左侧角落射门,而另一组球员倾向于更均匀地从左右角落射门。这些数据分析可以帮助守门员在面对不同类型的球员时,采用多样的防守策略。基于这种博弈论的观点,我们可以通过分析加时赛来思考足球的延续性,并用这种延续性来为每个球员提供战术方面的建议,甚至进而优化整个团队的战略。

图 3:(A) 和 (B) 展示了示例数据库中罚球次数超过 12000 次的球员的球员向量集群。借助这种球员行为特征,我们可以在不同集群中可视化相关的球员目标热图,如图 (C) 所示

在统计学习方面,表征学习尚未在体育分析中得到充分利用,而这能够对单个球员和球队的行为进行信息总结。

此外,我们相信博弈论和统计学习间的交互将进一步推进体育分析的发展。例如,在上述罚球场景中,利用特定球员的统计数据(球员向量)来进一步分析,可以让我们深入了解不同类型的球员在点球时的行为或决策。

另一个例子是,我们可以研究 “重影”。这是一种特殊的数据驱动分析,可在体育分析领域分析球员应该如何在事后采取行动(与在线学习和博弈论中的后悔概念有关)。“重影”模型为给定的比赛提供了可选的球员轨迹,如根据联盟的平均水平或所选球队生成的轨迹。我们通常将预测的轨迹可视化为原始比赛上的一个半透明层,因此也产生了术语“重影”(参见图 4 中的可视图例)。生成式轨迹预测模型可以让我们通过分析比赛中的关键情境和可能出现的不同结局来获取数据分析。这些模型还可以预测战术变化、主力球员受伤或换人对整个球队表现的影响,以及对手对于这种变化的应对措施。

图 4:利用足球追踪数据进行预测建模的示例。在此我们除了可通过顺序预测轨迹模型对守门员做出预测,还可以将显示足球、进攻球员和守门员的地面实况数据可视化

最后,我们认为计算机视觉是推进体育分析研究发展的最有效途径之一。仅通过从视频中检测事件,其潜在应用范围巨大,这是计算机视觉社区深入研究的主题(您可以参阅以下 调查结果 和我们的论文获取其他参考资料)。通过将事件与特定帧联系起来,视频将变得可搜索,且越来越有用(例如,可以实现自动高亮显示生成)。反过来看,足球视频也是计算机视觉中很有意思的一个应用领域。大量的足球视频为现代 AI 技术的发展提供了先决条件。尽管每个足球视频各不相同,但它们的设置却变化不大,因而这项任务非常适合强化 AI 算法。此外,还有第三方供应商提供手动标记的事件数据。这些数据生成时会耗费大量时间,但在训练视频模型方面却相当有用,因此监督和无监督算法都可用于足球事件检测。通过将采用监督方法训练的深度学习模型程式化(如图 1(B)),从而仅识别视频中的目标事件(例如踢球)。

先进 AI 技术在足球领域的应用可能会在球员、决策者、粉丝和广播员等多个方面对足球比赛产生革命性的影响。这些进步有可能会让这项运动更加大众化,因而同样也很重要(例如,与其依靠现场观察员/专家的主观判断,不如利用计算机视觉等技术来量化代表人数不足的区域或低级联赛中球员的技能组合)。我们认为,日益先进的 AI 技术可以为足球领域这一带来长足发展,而这些发展可用于更广泛的领域。为此,我们将于近期(与几位外部组织者)共同举办 IJCAI 2021 体育分析 AI 研讨会,欢迎感兴趣的研究人员积极参与。对于对此话题感兴趣的研究人员,StatsBomb(数据集)等数据分析公司和更广泛的研究社区(数据集)都提供了公开可用的数据集。此外,本文还对该领域的研究进行了全面概述。

论文和相关链接:

致谢

感谢以下贡献者的倾力合作:Karl Tuyls、Shayegan Omidshafiei、Paul Muller、Zhe Wang、Jerome Connor、Daniel Hennes、Ian Graham、William Spearman、Tim Waskett、Dafydd Steele、Pauline Luc、Adria Recasens、Alexandre Galashov、Gregory Thornton、Romuald Elie、Pablo Sprechmann、Pol Moreno、Kris Cao、Marta Garnelo、Praneet Dutta、Michal Valko、Nicolas Heess、Alex Bridgland、Julien Perolat、Bart De Vylder、Ali Eslami、Mark Rowland、Andrew Jaegle、Yi Yang、Remi Munos、Trevor Back、Razia Ahamed、Simon Bouton、Nathalie Beauguerlange、Jackson Broshear、Thore Graepel 和 Demis Hassabis。

原文:Game theory as an engine for large-scale data analysis
中文:TensorFlow 公众号