在每场篮球赛事之后,都有专门数据网站统计每位球员当场比赛的表现,而随着时代发展,大数据时代的来临,仅仅依靠得分、助攻、篮板等等基础数据已经很难真实反应出球员当场比赛的状态好坏;为了顺应时代需求,各项高阶数据开始出现,我们最常讨论到的几项,例如PER、USG%、TS%、RPM等等,这些表面上看起来乱七八糟的符号,背后所代表的含义是什么,而我们又是如何通过这些符号来判断球员表现,如何解读符号数据,随着篮球现代化发展的科学化,对于这些高阶数据,理解它的含义,我们才能够真正看懂比赛。
上述是我们在比赛赛后的统计内容上最常见的几项数据,而很多高阶数据也都是在此基础上发展而来。想要彻底了解比赛每个细节,以及球员的真实表现,往往需要不断的重播每一个攻防回合进行拆解统计,但是篮球运动毕竟属于动态团队项目,仅仅只是一次攻防,过程中就包含这多位球员的直接数据贡献,例如得分、篮板、助攻等等,其次还有很多类似传导球、无球掩护、空切跑位等等间接数据,一直到最后的出手命中或者不中,一个回合才算全部完成。
在这个快速运动的过程中,统计数据需要观察的细节内容非常多,难度也是很大,想要完全精准的解析每场比赛的所有细节,这是一个相对复杂的过程;所以,本片介绍的高阶数据,大多数是直接借助传统基础数据来推导计算,和比赛场上实际发生的内容还是存在误差。但是参考这些高阶数据已经能够得到和实际情况非常相近的数据结果,这已经是现阶段既方便又比传统数据更具参考价值的方法。
讨论高阶数据的最直接目的就是参考比赛球员在场上的表现好坏,而想要衡量球员的场上表现,效率值就是第一个必须理解到的数据。参考目前最主流的效率值数据,类似EFF、GmSc、PER、ORtg、DRtg等等,相对而言PER、ORtg、Drtg几项数据的计算过程稍稍复杂,我们先特别介绍几项简单的基础数据。
公式看起来一长串,但实际上就是把五大数据:得分、篮板、助攻、抢断、盖帽全部相加,再剪掉投篮不进和罚球不进,最后减掉失误。五大传统数据是正项数值,而投篮不进、罚球不进和失误是负项数值,计算简单方便是这项数据的最大优点,所以EFF也是最常见的高阶数据。公式中也没有用到场均或者命中率数据,而是用一般的基础数据累积,并且EFF仅仅只是单纯的加减而并非比例算法,可以简单理解成一个累积式数据。
作为高阶数据,EFF数值的参考价值并不高,因为这些数据价值并非完全相等,也没有经过加权计算,这会导致EFF的衡量价值失去真实性。举例:如果一名球员两罚不进则EFF数值减2数据统计,即便后续抢到进攻篮板重新拿回球权还是会减1,但发生一次失误并且导致球权转换给对手方却只减1。又或者,当你防守对方进攻球员投篮不进,在没有盖帽的情况下EFF数值不会出现变动,但是同样是造成对手投篮不进,盖到对方盖帽的EFF数值就会加1。
另外一点,EFF数值完全可以依赖大量出手球权来作弊,例如投进一记两分球会加2,这就意味着后续需要投丢两记投篮才会归0,所以只要保证每三球进一球,也就是把投篮命中率稳定在33.3%之上,出手数越多,EFF数值就会越高,这对于一项累积式数据来说就是一个最直接的致命漏洞。所以,EFF数据只能是简单的应用于单场比赛统计,衡量在场球员单场比赛的产出效率占比。
对于EFF,GmSc同样也是参考五大传统数据,只是在投篮和罚球、失误之外还加入了犯规,然后针对各项数据进行加权计算。以下是计算公式:
GmSc计算篮板时细分成了进攻和防守篮板,进攻篮板因为较难抢到,并且抢到后能再次为球队赢得一次得分机会,避免了球权转换后对手的进攻,所以进攻篮板的加权分数较高于防守篮板高,和助攻、盖帽一样都是0.7分,但防守篮板就只有0.3分。而因为抢断等于一次球权转换,所以加权分数也是比直接盖帽要更高。
+0.4×FGM代表每投进一球会加0.4分,但-0.7×FGA代表每出手一次会扣0.7分。也就是说,即使你投进球,在FG的部分还是会使GmSc的分数少0.3分,这就是让得分加权比其他数据高的原因。事实上,投进一记两分球只能加1.7分,一记三分球能够加2.7分,只要投丢任何一球也会减0.7分。而投丢一球罚球的加权则是减0.4分,一次犯规减0.4分,失误一次导致球权转换,GmSc直接减1分。
对比EFF,GmSc数据多出了对各项数据的加权计算部分,勉强能改善EFF的第一个问题:各项数据并非等价,但是这些加权是否合理就见仁见智了。而即便能够解决第一个问题,但第二个问题依旧存在:GmSc也可以依靠大量出手来作弊,甚至作弊水分比EFF还严重。投进一记两分球加1.7分,投丢却只扣0.7分,所以要投丢2.43记出手才会抵消投进一记两分球的分数,换算之后,两分球命中率只要能够在29.1%,两分球投得越多,GmSc数值就可以越高。而三分球更夸张,一记三分加2.7分,要投丢3.86记三分球才会被抵消,换算后三分球的命中率只要超过20.6%就能不断的正向累积GmSc数值。
所以对比EFF,虽然其他传统数据方面的衡量或许比较有参考价值,但对于同样属于累积式数据而言,在得分方面的缺失却更加的严重,公式背后看,GmSc更看重得分的产出,所以更别说用GmSc来衡量球员的效率了,毕竟效率已经可以靠大量出手来作弊。
除此之外,GmSc和EFF一样只适合应用于单场赛事,但是结合一系列的权数比重,在计算上甚至还不如EFF便捷有效,反而比EFF更少被使用。
接下来我们来理解高阶的命中率指标数据,由于两分球和三分球的价值不同,简单以FG%来衡量球员的投篮效率似乎有失合理。此外,有少部分球员的打法本就比较极端前卫,导致罚球变成了他重要的得分手段之一,那就需要能连同罚球命中率一起考量的高阶数据指标了。
eFG%的逻辑很简单,因为一记三分球能比一记两分球多出1.5倍分数,所以将FG%的三分球命中数×1.5,也就是提高1.5倍的比分权重。这个数据有个最直接的应用效果,将eFG%×出手数再×2【公式:eFG%×FGA×2=得分】这就是球员借由投篮出手的得分,一次投篮命中等于两分,而命中三分球的部分,在eFG%里就已经先乘以1.5倍了。
eFG%其实并没有多少缺点,它已经能够很真实的呈现出球员在投篮方面的价值。如果一定要找到问题的话,有部分球员本身就很少出手投篮,大多数得分都来自于补篮或者扣篮,依靠投篮出手为主的球员即便eFG%已经把三分球的加乘考虑进去,还是难以和此类球员相提并论。所以,eFG%对于投篮还是存在参考对象,对于那些较少出手投篮的球员就不是和合适了。
TS%对比eFG%,相对把罚球考虑了进去,用来衡量球员每次进攻机会能够得到多少分数。因为有些进攻机会,本来是能够以投篮出手,但因为被对手犯规而变成罚球出手,这依旧属于是一次进攻机会,但是在eFG%数值上却不会被计算进去。而真实命中率就是希望可以考虑到所有进攻机会,所以比eFG%多参考到了罚球部分,让球员命中率看起来能够更加的趋于真实。
上述提到,eFG%×FGA×2=得分,所以,我们用这个公式和TS%对比,差距只在TS%的分母数据多出了罚球出手,而乘数是2倍的0.44。这个2×0.44是根据以往赛季的历史纪录,来计算所有罚球出手数中,有多少比例是在被犯规而失去进攻机会得来的,目的是要把球员失去的投篮出手机会补回来。在计算历史纪录之后发现,每个赛季大约88%的罚球出手次数来自于被对手犯规后失去的进攻机会,而一次被犯规的进攻机会能够创造出两次罚球出手,所以88%的罚球出手要除以2,乘数就是0.44。
假如一名球员本场比赛一共罚球10次,根据数据资料显示,这10次罚球出手中包括约4.4次被犯规而失去进攻机会的回合,所以该球员当场比赛得到的进攻机会就是4.4+投篮出手次数。
所以整个分母就代表进攻机会的意思,TS%把投篮出手次数加上被犯规导致的罚球出手,也就是所有的进攻机会。而每次机会如果都能够把握住,按照得两分得基础标准,罚球两罚全中,所以×2。如果投进三分球,或者得到三次罚球且全数命中,得分就会比较多,所以TS%也就会比较高。而如果两罚一中,TS%就会比两罚全进更低。
这对于那些依靠大量补篮或者扣篮作为得分手段,但通常罚球命中率都不高的内线球员,TS%数值上会有所修正,而对于少部分大量站上罚球线上的球员来说,对比于eFG%,TS%反而能加真实的呈现出他的得分效率。
因为有些进攻机会能够创造三次罚球,而且是按照全联盟的数据统计,因此0.44只是一个比较概括的数字,无法精确作为衡量每位球员的指标,这也是TS%最可惜的地方。除此之外,既然是以进攻机会为单位来衡量,那就应该要把失误也考虑进去,失误从另一层面来讲直接属于一个进攻机会的丧失。但是考虑到TS%名为真实命中率,所以仅仅参考最终实际的出手进攻机会其实也算合理。除了上述的部分缺陷,TS%已经算是目前最常被应用来衡量球员价值的数据。