By NBASTAT.com(NBAPrediction,河马体育)
Beat the dealer
data-driven bet
NBA比赛的预测、或其他预测,最主要的核心就是数据驱动。目前很火的大数据、机器学习、其核心概念我们认为就是数据驱动,在未来几个单元,会通过介绍目前我们的预测NBA比赛的几个重要点,介绍这种数据驱动的方法。 希望篮彩爱好者或者其他读者在对数据驱动的这一思维方式略窥一斑。 我们同时也会适当介绍一下在这一过程中使用的工具。
系列三: 球队实力的衡量与分析
引言
一个球队在一个赛季中一共要打82常规赛,而每场比赛球队的得分、失分以及各项数据各不相同,时高时低,那么我们该如何来衡量一个球队的实力呢?这就是我们今天要面对的主题。
在上一次的主题中,我们计算出了每个球员的能力值,这为我们提供了一个计算思路:球队的实力应当是这些球员能力的综合体现,既然我们计算出了每个球员的能力值,那么通过一定方法来结合每个球员的能力,那么就可以来衡量球队的实力。我们可以按照这个分析思路,来计算一个球队的实力。
衡量一个球队实力
球员能力
球员的能力可以说对于计算一个球队实力至关重要,我们已经在上一次主题中详细介绍了如何计算一个球员的能力,因此不在此赘述了。
球员上场时间
球员的能力有了,可是简单的相加会产生一个很大的问题:在正常情况下,一个能力较高的球员上场的时间会比一个能力较低的球员上场时间高出很多,因此我们需要根据上场时间这个因素,在计算球队能力时,对每个球员能力计算权重。一场比赛,不计加时赛时,我们球队一共有240分钟•人的时间需要安排给球员,那么如何根据上场时间来估计球员的权重呢?
球员上场的时间受许多因素所影响,例如球员的状态,教练的战术意图安排,球员的伤病情况等等,因此这个分析需要从多种角度考虑。
在第一次的主题中,我们讲到了如何去预估出场名单,这是一个非常重要的分析,当一个球员无法上场时,对于球队实力的影响是非常大,同样,关于这个主题在此也不再赘述。 当然,在大多数情况下,一个球员的上场时间应当是比较“稳定”的,因此,首先我们需要先预估一个球员的出场时间。
我们以热火队为例,下面是热火在2014赛季,常规赛中出场时间前15的球员上场时间统计:
可以看到勒布朗詹姆斯这个赛季共打了77场比赛,总共上场时间达到了2902分钟,场均38分钟。而勒布朗在我们上次计算的球员能力中,排名第一,因此,他上场时间如此之高,也正符合了我们先前的分析:能力高的球员上场时间也相应多出很多。
那有了这些时间,我们便能按照平均上场时间来计算每个球员在场上的时间占比。
例如对于勒布朗,他的能力值是8.77,那么对于热火队而已,他给球队带来的实力应当是8.77 * (38 / 240) = 1.39。
球队实力
有了球员的能力值,球员上场的时间,那么我们可以按照先前的思路,采用如下的公式来对球队的能力来进行计算了:
TeamStrength = Σ(PlayerStrength * avgTime / 240)
下面是2014赛季,常规赛我们计算出的球队实力榜:
图中的红色线表示联盟的平均实力
我们看以从上图中看出,热火的实力在全联盟中排行第一,快船和雷霆紧随其后,灰熊、太阳等则在联盟中游,而雄鹿与凯尔特人则是垫底的位置。
球队在赛季中的实力变化
与球员能力值变化一样,一个球队通过球员更迭等方式,在整个赛季中的实力也是不断的发生着变化。下面是热火球队每场比赛所体现出来实力变化。
图中红色曲线表示拟合出来的球队实力
我们可以看到热火在2014赛季中每场比赛实力体现变化有一定的起伏。特别是常规赛快结束时,其所体现出来的实力有明显的下降,这也和球队为季后赛做准备而开始隐藏实力。因此我们可以通过回归分析等技术,来不断的拟合热火队的实力,从而能够更准确的来计算其球队的比赛。