email: [email protected]
by 河马体育 NBASTAT
近日stat.nba.com公开了最新的数据展示,包括了去年已有的playertrackingdata,但是现在细化到了每场比赛。然而最大的改进就是公开了SportVU moments数据、动态图,其对未来的体育数据分析可能产生重要影响。
在上赛季我们获取过一部分SportVU数据回合动态数据,以及所有的playertrackingdata running的数据 , 进行过一定研究、分析。
在nba官网公开SportVU部分数据的当下,本文谈一下我们对SportVU数据的理界,以便大家更深入理解体育数据,参与、观看比赛时获取更多的乐趣。
SportVU简介
由STATS开发运营,由安装于球场的多角度的多摄像头动态追踪,相对旧有的视频计算机分析系统(最土的就是分析录像带,需要大量人工介入),采用角度多摄像头避免了视频追踪物体互相遮蔽后丢失等问题,采用的摄像机型号不明,但是本人觉得可能gopro4 balck也能基本达到要求(如果谁有兴趣和动手能力一起diy一套穷人版,可以联系我啊)。
每秒每个物体产生25组数据,同时追踪10名球员以及篮球,公开的包括X,Y,Z坐标,shotclock,gameclock,时间等。目前NBA官网公布的数据每场比赛未压缩大约有110MB,我所接触到未公开的的数据大约有200MB(提高了些许进度和一些计算后的数据),其他更加高级和最新数据1场多大未知。
NBA官网数据insight from SAP,单页应用,后台数据库基于SAP HANA,相当的高大上。目前并未提供SportVu比赛时的实时数据,但已经有部分比赛现场会在大屏幕上显示部分实时数据。
部分SportVU moments数据截图:
随着科技发展,战术的演化,以及对比赛乐趣要求的进一步提升。过去基于pbp,BoxScore的数据,虽然已经能反映出一场比赛的基本面,但是还有欠缺。也有基于录像带的分析技术,但是需要大量人工介入。
NBA的相关人士如Oliver Dean在自己的著作《Basketball on Paper》中介绍过他的pbp记录方式,其对我们目前看到的官网pbp较大的改进就是对赛场划分了区域。过去我个人也赞同其所提的划分区域来做标记比更高精度的的数据更加通用、方便的对这些数据统计、分析处理。然而此书后的10多年因为随着数据的迅速膨胀,处理手段的快速发展,也让我们有了进一步的需求,
我认为sportVU有一下几个优势:
- 相对过去录像带分析(包括计算机和人工),精度提高,减少大量人工,几乎已经可以做到实时。
- 相对任何形式的pbp,可追述性等远远提高,目前如前文提到的SportUV 每场比赛公开100MB未压缩数据,可获取的数据大约200MB,这些数据都是基于目前对比赛的理解、需求,计算机分析视频后、辅以pbp得到的。 然而SportVU采集的高清视频远远超过这些数据为度,在未来如产生了新的理解、需求,通过这些高清视频还是能进一步分析得到,而过去的pbp很难挖掘新的数据、特征(如果你整理过所有官网的pbp数据,会发觉其中有槽点和错误)。据我了解,不同NBA球队对SportUV的数据使用已经产生了差异化,有些球队有自己独特的需求。
- 未来几年对SportVU使用和数据的理解更加深入,以及其实时能力的提升,NBA比赛时的现场数据展示,教练球员对实时数据的应用也会进一步提高。相对于NFL来说目前NBA对实时数据的应用较差一个档次(这里也有部分原因是NFL暂停时间较多等),未来可能缩小这个差距。
- 说一个小例子:如公牛队这种比赛领先,每回合shotclock走前总会拖会儿让比赛时间走会儿,并有诺阿比赛末段大秀24秒控球技术的,这种能难从过去的pbp 数据,pace等看出,虽然公牛队pace可能还是比较高,但是它的24s,前面会走掉个3,4s比赛时间(如果多看几场公牛,在看几场den差别太明显了),对整体比赛得分等就影响很大。现在SportVU
- 数据积累的时间还不够。数据如需要实际应用、挖掘,数据的量非常重要,过去pbp等有较完善的数据近30年,目前SportVU数据积累不够是一个问题,但是其数据的膨胀速度,应该可以在几年后改善良多,目前和pbp等旧有数据相辅
- 如何使用?用在哪里?
1. PACE
- 个人pace,pie,球队pace,据我们观察我们自己的pace计算结果和basketball-reference.com有少许差别(基于我们不同的pbp分析方法),但是我们以及basketball-reference.com的pace数据和NBA官网提供的pace 部分比赛较大。 如http://www.basketball-reference.com/boxscores/201412230CLE.html MIN@CLE 我们的计算的pace 和bbr的均接近98.4 ,而NBA官网提供的为102.70,还提供了个人pace,其他total pace和个人pace如果计算出这个结果,还比较模糊,如哪位知道望告知
- 并且提供了分时段的数据查看包括pace等,对分析球员不同时间段,比赛风格也有一定帮助,过去计算分时间段pace需要从pbp结合boxerscore,比较麻烦。
- 上赛季我们获取过球员TrackingData的running数据,从中观察,从球员的运动能力变化,基本和赛事密集度、旅途长度、赛季时间段有关,部分球员能够自我调节(GDP!!!),并在赛季后端,季后赛爆发。未来积累大量数据后,可能对球员身体状态等可以做出一定的判断。
- 上赛季用statwing对全部球员防守做过简单分析,其中比较有意思的一点就是雄鹿有3名内线球员正面防守能力相对我印象中不错(印象中一直被爆)。
首先感受下NBA官网的,使用d3js
- 如球员移动轨迹
- 目前球队的覆盖区域
最后我会上传这个moments的处理后的tableau数据到tableau public,如有谁有兴趣看进一步了解,可以尝试下。 在线查看地址,(需翻墙)
SportVU目前的个人几个关注点
- 对非NBA联盟球队,数据如何开放,开放范围。何时会公开实时的数据。
- 是否会产生革新性质的数据。
- 数据如何进一步提升球迷观赛乐趣。