怎么看nba球员平均职业生涯职业生

大家都在搜:
扫描二维码安装房天下APP
手机浏览器访问房天下
> > 问题详情
NBA球员一般都是什么年龄开始自己的职业生涯
浏览次数:0
06年以前有很多高中生球员进入nba如:kobe、kg、t-mac、james、d。howard。。。。。。06年规定至少在ncaa混一两年才能进入nba!
不知道下面这条知识能否帮助到您
你是否知道购房有年龄限制吗?你是否具备买房的能力?很多购房者并不知道要评价购房能力,等到看到了满意的房子后才去评价购房能力,此时才发现要么是自己准备的首付款不够,要么是月供超过了自己能承受的范围。那么应该如何评价自己的购房能力呢?
购房年龄限制和购房能力评价
最小是18岁.科比 摩西马龙 夸梅布朗 凯文加内特 杰梅奥尼尔 魔兽 特雷西麦格雷迪 拉沙德刘易斯 都是高中生 艾尔哈灵顿.(后两位更是高中生状元.夸梅.布朗更始第一位高中生状元+高中生水货状元......魔兽可能是最后一个.......现在高中生不能参加NBA了.好像是和他们的素质修养=有关系.).KB当年没满18岁就参加了!
一般都在20岁左右吧,最小不能小于18周岁。
NBA现在有新规定高中生不能参加选秀,所以现在很多球员都是大一的时候才参加选秀,年龄是19岁以上。
NBA最近好像有规定18岁以下不能进入联盟吧!
那得看看他们是不是选择修大学学业了,高中生直接进入NBA就年轻点,不到20,18,19岁吧,比如T-MAC,LJ,KG...选择修完大学学业的年龄就大点...加几岁吧...
一般20岁吧、
手机动态登录
请输入用户名/邮箱/手机号码!
请输入密码!
没有房天下通行证,
ask:3,asku:2,askr:19,askz:22,askd:54,RedisW:44askR:24,askD:147 mz:nohit,askU:0,askT:0askA:172
Copyright &
北京拓世宏业科技发展有限公司
Beijing Tuo Shi Hong Ye Science&Technology Development Co.,Ltd 版权所有
违法信息举报邮箱:《好看》依托百度技术,精准推荐优质短视频内容,懂你所好,量身打造最适合你的短视频客户端![翻译团]538是怎样进行NBA预测的
我们是怎样预测NBA球员的职业生涯的by Nate Silver恭喜!当您看到这篇文章的时候。已经和其他32亿网民一样,成为了CARMEL算法的拥有者之一,我们可以用它来预测NBA球员未来的表现。
CARMELO的基本前提非常简单。对每一位现役NBA球员而言,CARMELO会从近现代NBA历史中[1]指认出与其最为相似的球员,然后用这些相似球员的职业生涯来预测现役球员的未来表现。
让我们先拿华盛顿队的控球后卫来举个例子,根据CARMELO的预测,截止目前,他的职业生涯数据与前NBA球星以赛亚-托马斯,杰森-基德,史蒂夫-弗朗西斯和肯尼-安德森最为相似。基德直到接近30岁的时候仍然在取得持续的进步,而托马斯则拥有较长的巅峰期,并且率领底特律队取得了两次总冠军。所以他们可以被认为是在较为理想的发展状态下的模板,而弗朗西斯和安德森则是相对弱化的模板。所以,虽说沃尔有潜力成长为一名超级巨星,但真实的情况还真是尚未可知呢。
CARMELO算法最早来自于我在2014年为纽约队的卡梅罗-所撰写的预测文章。因此最终我和同事尼尔-(我们的高级体育撰稿人)按照首字母缩写的原则,硬生生的把这个算法的命名为CARMELO(Career-Arc Regression Model Estimator with Local Optimization——局部修正的职业生涯回归模型估算函数,同时也与卡梅罗-安东尼同名)。但是我们创建CARMELO的真正灵感则来自,这是我在2003年为棒球简介网站(Baseball Prospectus)编写的一套用来预测棒球运动员职业生涯的算法系统。十年以来,我一直都想要开发一套用于预测篮球运动员的PECOTA系统。多亏了来自尼尔,艾莉森-麦卡恩(我们的一位图片记者)以及538的其他同事们的帮助,我的这一想法终于得以付诸实现。
然而,CARMELO比PECOTA算法简单很多。它没有后者那么多的附加程序。它仅能预测每个球员的上场时间以及在进攻端和防守端的总体表现,而不涉及比赛中的具体统计数据[2]。这种简洁性一部分源于程序设计的需求。我们认为目前CARMELO的测算结果在基本面上大致正确,而且也能给大家提供一个有趣的了解NBA的全新视角。但是在继续丰富这个模型之前,我们还需要看看它的表现到底怎么样。
那么现在我们就用沃尔当作小白鼠,来看看CARMELO是怎样对球员的职业生涯进行测算的。友情提示:以下内容均是CARMELO对在联盟中服役至少一年以上的老球员所做出的预测;对新秀的测算在基本原理上也是类似的,但还是有所不同,我们会在后面进行解释。第一步:定义球员的技能
在CARMELO指认模板球员之前,我们需要定义每个球员的技能,并且给他们标以相应的数值。& & & & & & & & & & & & & & & & & & & &约翰-沃尔的基本资料我们从每个球员的基本履历信息开始。所有的属性中最为重要的,尤其能决定球员未来发展轨迹的数据,就是他的年龄。NBA球员,就像MLB球员一样,会在27岁之前不断提升自己的能力,并在那之后逐渐走向衰退。目前标注在CARMELO信息卡上的年龄都是截止到2016年2月1日的年龄,也是新赛季大致进行到中段时所达到的年龄[译注1]。译注1:原文发表于2015年10月9日,也就是在2015-16赛季开打之前。接下来,这里列出了球员的基本资料:身高,体重以及选秀顺位。单从这组数据看来,在其他情况保持相同的情况下,似乎身材越高、体型越巨大的球员表现得越好。在较高顺位被选中的球员可能具有更高的上限,然而这也仅限于我们限定其他参数的时候[3]。在球员的基本资料以后,我们将在下面看到许多统计数据。值得注意的是,这些可不是测算出的数据;相反,这些数据反映了该球员在过去的三个赛季中的综合表现,是一份加权平均的结果,越接近当前的赛季其加权因子越高[4]。我们先从几个与得分和投射能力相关的数据开始看起。(想要就此定义获得更多的细节,可以参见)。使用率或称使用百分比,记录球员在场进攻时,终结进攻比率(包括投篮、失误以及获得罚球)。因为一支球队同时在场的球员总共有5人,所以平均的使用率为20%。真实投篮命中率是一个“进阶版”的投篮命中率数据,它除了能反映两分球的命中情况还将三分以及罚球的命中情况加权计算在内。例如和,他们都被认为是联盟中最强的得分手之一,在使用率和真实命中率上也都表现不俗,这就意味着他们不仅高产而且高效。我们还列出了球员的罚球命中率。尽管这相对于他的总体数据而言并没有那么重要,但是这却比真实命中率更能衡量一个球员的真实投篮能力。因为后者除了能反映球员的投篮能力也看重球员的出手选择,相对而言是更为全面的衡量参数。事实上,最好是前后关联着的来看这个表格中的数据。例如队的,尽管他是一个非常糟糕的罚球手,但他仍然是联盟中真实命中率最高的球员之一,因为他绝大部分的投篮都是通过命中率极高的灌篮或者靠近篮底的上篮完成的。
接下来的两个项目则是三分率和罚球率,反映的则是球员选择三分出手或者罚球的频率而不是他们的命中情况。(三分率是指三分球出手次数在所有投篮出手次数中所占的比例;罚球率是指罚球出手次数与投篮出手次数的比值。)通常情况下,球员们想要在这两项数据中都得到尽可能高的数值。罚球——除非你是德安德鲁-这样的糟糕罚球手——通常被认为是联盟中最高效的得分手段,并且也是对于那些能够有效冲击内线完成进攻的球员的一种回报。同时,平均而论,三分球也比两分球更加高效。此外,如果能在其中一项数据或者(尤其是)在两项数据中名列前茅,则反映出该球员具有很强的撕扯对方防守,拉开球场空间的能力,这一点可以帮助其队友更加高效的完成进攻。
接下来的两项则是与球员的控球能力相关的数据:球员的助攻率(当该球员在场时,来自于他的助攻进球数与总进球数的比值)和失误率(该球员造成的失误次数与总持球次数的比值)。对于CARMELO的算法而言,高失误率被认为是不好的,这跟真实世界中的看法类似。因此,在沃尔的例子中,高失误率也被认为是他的主要缺点之一。
最后一组数据则是与球员的篮板和防守相关。球员的篮板率是指该球员在场上时他所抓到的篮板球数与总篮板数的比值(平均数为10%)。盖帽率则是盖帽数与对手两分球出手次数的比率,球员的抢断率是指抢断次数与对手持球进攻次数的比值。最后是球员的防守正负值。CARMELO中定义的正负值反映的是球场正负值(BPM)和真实正负值(RPM)各占50%的加权平均值。关于正负值在后面的细则部分还有更多的介绍;此外还需强调的是,正负值如果是0,则说明防守者达到了平均水准而不是防守不合格。
第二步:寻找模板球员
这些统计数据有时可以完全合理的描述一个球员的赛场表现。在沃尔的例子中,我们将其描述为一个占用大量球权,中等效率的得分手,但他分配球的能力又非常出色。尤其是作为一名控球后卫而言,他在防守端也表现出众。同时我们也发现了他的一些问题,比如沃尔犯下了许多失误。又比如他既不能命中许多的三分球也无法频繁走上罚球线,因此他有时会在进攻端表现平平。
这几项数据以及其他几个跟耐久性相关的数据以及上场时间构成了挑选CARMELO球员模板的基础。基本的概念是这样的:因为本赛季沃尔是25周岁,CARMELO会在过去的球员中[5]找到他们25岁时的数据[6],然后找到跟沃尔最接近的那些球员。如果二者的数据完全相同,我们则定义其相似度为100,每出现一个不同之处就相应的扣除一些分数。还是拿沃尔来举例说明,因为他具有很高的助攻率,因此低助攻率的球员就在该项上被扣除了很多分数,也就无法成为沃尔最相似的模板。CARMELO会比较所有的19项统计数据,这其中有些项目的权重会相对的高过其他项目[7]。
这个筛选过程看上去十分复杂,但是得到的结果有时还是非常令人满意的。作为一个看着坏孩子军团长大的活塞球迷,我能看出沃尔和他在历史上的头号模板,以赛亚-托马斯之间的相似之处。如果我们在BBR上比较二人的数据,就不难发现CARMELO到底是怎么找到他的:二者在某些数据上具有离奇的相似度。尽管如此,这种比较仍然并非完美。托马斯在篮下遭到了更多的侵犯,也因而获得了更多的罚球机会。但是这也许是因为他处于劣势的身材造成的,然而沃尔却不存在这样的问题。
正如没有两片完全相同的雪花一样,没有哪两个NBA球员是完全一样的。虽然理论上在完全相似的情况下得分是100分,沃尔的头号模板托马斯的得分却仅有57分。但是以CARMELO的标准来看,这两者其实已经具备相当高的相似度了:许多NBA球员都无法找到相似度超过50分的模板。如果相似度超过60分则更为稀少。当然这可能也可归因于CARMELO定义相似度的评分办法。在CARMELO体系中,得分为0仅仅意味着相似处和不同处差不多刚好抵消,而并非完全不同。例如,多米尼克-威尔金斯与沃尔的相似度为0;他们并不十分相像,但也绝非完全不同。有些球员甚至会产生负值的相似度;例如马努特-波尔与沃尔的相似度就是-113.8。下面有一些关于相似度的简单解读:&相似度&描述&100& & & &&&完全相同&60-99&&&仅仅是生于不同时代&50-59&&极为相似&40-49& &&&高度相似&30-39&&多数相似&20-29&&部分相似&1-19&&&有点相似&0&&&有些相似也有些不相似,二者差不多&<0&&较不相似当然你也可以通过某种近邻算法找到更为精确的CARMELO近似值,具体说明可以参见文后的注释[9]。第三步:进行测算
每位球员最相似的十个模板球员都被列在了CARMELO信息卡上。每位模板球员旁边都有一副迷你图,显示在接下来的7个赛季中,该球员的职业生涯究竟是如何发展的[10],这里采用替代胜利贡献值(WAR,Win Above Replacement)进行比较:CARMELO为约翰-沃尔在2015-16赛季的表现找到10个最相似的模板
所以一个球员的CARMELO测算是由这10位相似的模板平均而来的吗?这个说法的思考方向是对的,但却并非完全正确。
首先,尽管只有相似性排在前10的模板球员被列了出来,但是系统会对历史上所有正相关的成绩去进行预测[11]。通常这意味着为了预测现役球员未来的走势,几十甚至上百位球员的历史数据会被计算在内;例如与沃尔产生正相关的球员总共有179名。每位球员在预测中所占的权重不同,这与他们所得到的相似度的成绩相关:比如一位相似度50分的球员在测算中所占的权重将是相似度为25分的球员的两倍。
第二个问题则更靠近技术层面一些。让我们拿的CARMELO信息卡来举例说明。
尽管库里的模板有点让人感到心花怒放——迈克尔-乔丹!——绝大多数人都没有他那么棒。但特勒尔-布兰登,-波特和克里斯-穆林也都被列于他的前十位最相似球员模板。他们都是不错的球员,或许在某些程度上还都被低估了,但他们中没有人达到过库里所达到的水准。换句话说,他们可以说是穷人版的库里——与库里的风格相似,但是在技术统计上都缩水了一些。CARMELO将这一问题也考虑在内了,并提供了一个被称之为基线测算的解决办法,这一点我在注释说明中进行了详细的解释[12]。
对于CARMELO的预测而言,一个更加重要的问题是,概率性。经过测算,在接下来的一个赛季中,沃尔的WAR值将会达到8.7。但是这种预测也存在一定的不确定性。每位球员的图表都会显示其80%可能出现的结果所在的区间。CARMELO基于WAR对约翰-沃尔所做出的预测这一范围往往是非常宽泛的。篮球可能已经是四大体育联盟中最容易预测的了,但依然存在许多的不确定性。沃尔的WAR值可能从4.7(与联盟平均水平的球员差不多)一直浮动到12.9(联盟最佳阵容级别的水准)。重申一下,这一范围覆盖了他80%可能会达到的区域。如果经过仔细校准,沃尔有10%的概率会突破他此前的巅峰值(如果是这样的话,他将达到MVP候选人的级别)也会有10%的概率达不到他此前最差的分值(若是如此,华盛顿的球迷们可就遭殃了)。有些球员的结果范围相比其他球员更加宽泛,尤其是年轻球员(比如)或者是重伤痊愈的球员(比如)。
目前为止,我们都在讨论对球员WAR的测算。但是WAR只是CARMELO预测的终点,而不是出发点。如果你把球员的CARMELO信息卡拖到最底端,会在那里看到叫做“细则”的一栏,这会提供一些更为深度的数据,告诉你这些WAR是怎么来的。CARMELO对约翰-沃尔所做出的测算细则,以正负值来表示
特别值得一提的是,WAR反映了球员上场时间和他在上场时间内产出能力的综合效果[13]。产出能力则由统计正负值来衡量,在此需要一些说明。
从数学范畴来讲,正负值并不难定义:它反映了一个球员相对于平均值在100次进攻回合里对球队得分的贡献值[14]。举例说明,去年沃尔在奇才队的正负值为+3.9。这就意味着当沃尔在场上时,与其他四位处在平均水准的球员一起,每100回合中奇才队能比他们的对手多得3.9分。正负值还可以具体细分为进攻正负值和防守正负值。沃尔上赛季的进攻正负值为+2.5,也就是在100回合中他帮助奇才队多得的分数。而他的防守正负值为+1.4,则意味着当他在场时,平均100回合能帮助球队少丢1.4分[15]。
然而,现在有很多版本的正负值,有的简单,有的复杂。我们用于CARMELO测算的正负值体系则采用了两种正负值加权平均的结果。他们分别是来自丹尼尔-梅耶尔的(BPM),这是一种可以直接从技术统计数据中得到的相对较为简单的统计结果,以及来自于杰里迈亚斯-恩格尔曼的(RPM),这是一种相对复杂的统计结果,它是由每一回合的数据计算得到的。这两组统计数据BPM和RPM的权重各占50%[16]。
尼尔-佩恩和我关于究竟该在CARMELO中采用哪种高阶统计数据展开了激烈的讨论(同样这也是篮球数据极客圈子里长期存在的争议话题),最终我们决定以这种加权平均的方式来解决问题。我们之所以会这样决定,也是因为在对大量不同的数据进行分析之后,我们发现这样做的实际效果要比单纯采用PER或者WAR等单一数据的效果更好。
然而,没有一种高阶数据是万能的,并且这也是造成NBA测算结果不确定性的来源。如果CARMELO看上去“爱”或者“恨”某位球员,那可能也源于BPM和RPM对于该球员计算结果的高低。举例说明,BPM和RPM数据对队的球员的评价都很低,而PER则反映该球员实力不俗[译注2]。所以,如果瓦兰丘纳斯的预测结果看上去有些悲观的话,那其实并非CARMELO故意将其未来的表现降低(实际上CARMELO预测他还会继续提升)。那是因为这种偏低的预测来源于BPM和RPM没能正确估量球员的价值,也就是我们的起始参数有所偏差。译注2:根据CARMELO所采用的正负值体系的结果,瓦兰丘纳斯在2015-16赛季中的表现只有+1.1的表现,仅仅达到轮换球员级别的水准,而根据ESPN的统计数据,瓦兰丘纳斯的PER值在2015-16赛季高达22.6,高居联盟第12位。
CARMELO还会预测球员在接下来的赛季中可能的上场时间。这些预测看上去可能会偏悲观一些。在上赛季至少上场2500分钟的29名队员中,CARMELO预测将有26名队员将会在新赛季中出场更少的时间。但这还是反映了NBA历史数据中的真实情况。甚至是那些职业生涯到此阶段仍然能保持健康的球员,例如的保罗-乔治,有时也会遭遇一些不期而遇的毁灭性伤病。又或者他们会受到一些生活环境的变化所带来的影响,诸如疾病和非计划性退役等等。平均而论,CARMELO对上场时间的估算其实还稍偏乐观一些[17]。
哪些球员可以用CARMELO进行测算?
在解决了关于WAR的纠纷之后,现在让我们来解决一些零碎问题。例如,如果你对某个球员感兴趣却找不到他的CARMELO信息卡怎么办?或者你想知道为什么你会看到退役球员或者伤病球员的CARMELO信息卡吗?
我们的调查范围涉及所有在2014-15赛季在联盟中出战超过100分钟,或者在2013-14赛季中出战超过250分钟的球员。这其中就包括肖恩-,我们知道他已经退役了;我想即使公开他们的数据也无伤大雅,万一他们决定在本赛季复出了呢?
我们还展示了一些特殊球员的赛季预测,他们遭受了非常严重的伤病,有时甚至有赛季报销的危险,比如来自队的。理由也非常简单,我们认为如果因为受伤的消息而把该球员从CARMELO的资料库中删除,这样做等同于舞弊行为。然而,我们也的确针对伤病优化了球队深度图表,这一过程我将在接下来的篇幅中再做介绍。
我们还对拥有大学比赛经验的80名新秀进行了测算,接下来我们看看对的测算结果,他的测算结果看上去不错(未来的全明星)。这些测算是基于ESPN数据信息提供的数据库测算得来的,这其中包括2001年以来被选中并至少打过一场NBA
从技术角度来讲,对这些新秀的测算事实上是采用了与CARMELO不同的算法,我们将其称为FABMELO(这是取自一位雪城大学球星的姓名法布-梅洛,虽然他的NBA之路并不成功[译注3])。然而对新秀和老球员们的算法原理是一致的,两者的区别可以归结为以下一些细节:译注3:法布-梅洛,巴西籍前NBA球员,在2012年首轮第22顺位被波士顿队选中。新秀赛季仅为母队出场6次。2013年8月被交易至队后很快被裁,后来被队签下,但又在赛季开始前被裁。目前他在巴西联赛中效力。
对新秀的测算删除了一些在ESPN数据信息库中不存在的数据[18]。他们采用有效投篮命中率(eFG%)替代真实投篮命中率。在指认模板球员的时候各项数据的权重略有不同,例如选秀顺位的加权因子会显得更加重要。对老球员们的预测会更重视年龄因素——例如一位31岁的球员只会与31岁的球员进行比较——而对于新秀的测算则不会那么在意年龄的影响。如果两个球员看上去非常的相似,那么一个21岁的新秀或许也会被拿来跟另一个20岁的新秀比较。然而对于老球员而言,CARMELO根据该球员在过去三个赛季的表现模拟了一条基于年龄,上场时间和正负值的测算基线。对于新秀则采用球员年龄,选秀顺位和身高进行相应的替代[19]。
一个更加完整的版本:新秀的测算将严重的依赖于新秀的年龄和选秀顺位。一个状元秀总是会得到一个前途似锦的测算结果,而一个位于第二轮末段的新秀则与之恰好相反。然而,有时系统还是会找到一些与之顺位相符(比如拉塞尔)或者相去甚多的结果(比如);让我们过几年再看看这些测算结果正确与否。
最终,还有一些特例。我们为一些在2014年被选中,但却怎么在NBA登场或者完全没有上场过的新秀,比如进行了测算。这其中还包括队的,他在新秀赛季中的首秀就受伤退场,并缺席了赛季剩下的所有比赛。然而CARMELO对这种在新秀赛季和他们未来的赛季中出现过“断档年”的新秀是非常严厉的。
那对于来自美国以外地区的新秀球员呢?对他们可没法进行CARMELO测算。(对不住啦,克里斯塔普斯-波尔津吉斯们。)不管怎样,我们还是基于他们的年龄,身高和选秀顺位进行了简单的基线测算。在接下来球队的深度图表中你可以看到一些关于他们的结果。
球队测算和阵容表
我们除了会对球员们进行测算,还会逐队进行胜负场次的测算[20]。在这里我们先用来举个例子。CARMELO对队在2015-16赛季的表现所做出的测算以及球队深度图表与对球员的测算不同,对球队的测算过程中我们会加入一些人为的因素。在咨询过一些ESPN的随队记者后,我们绘制了每个球队的阵容表,其中包括球队目前的伤病信息还有关于球队阵容的结构。然而我们还是没有太大的自由度。如果我们给每位球员“安排”的上场时间比CARMELO对球员测算的时间多很多的话,系统就会自动调低他的正负值;如果我们让这样的球员每场至少出场36分钟,那他也许就不会像我们看到的那样高效了。这种算法会让那些具有足够深度的球队受益(例如所在的圣安东尼奥队),也会惩罚那些在轮换阵容上捉襟见肘的球队。
所以,我可以用这些测算结果来赌一把吗?
嗯,啊,或许不能?虽然基于RPM的测算在去年表现得非常好,还险胜了拉斯维加斯以及其他一些测算系统,但538仍然是一个相对简单的模型。在理论上讲,基于我们的事后检验,CARMELO应该比基于RPM的测算的准确度提高了大约10%。但是事后检验与现实世界中基于一些真实而不可知的数据进行的测算并不完全一样。而且关于新秀的预测模型还是问题多多。我或许会让这个系统积攒一两年经验后再涉足博彩业。
那么卡梅罗-安东尼有没有受到CARMELO青睐呢?
不,我想还是差强人意。事实上,CARMELO算法可能;看上去测算结果都不甚如人意呢[译注4]。译注4:在CARMELO的测算下,安东尼仅达到合格先发球员的水准。看来CARMELO和卡梅罗都不是很开心呢。
附注:更具体的来讲,自从NBA-ABA在1976年合并之后。例如,它会测算沃尔的WAR而不是他的罚球命中率等细节数据。然而这个效应会在最初的几个赛季之后逐渐消失,所以也别指望安德烈-巴尼亚尼会奇迹般的爆发出来。具体来说,最临近的一个赛季,其默认的权重因子是60%,第二接近的赛季是30%,第三接近的赛季为10%。然而,这些原始的权重还要乘以球员在该赛季出场时间的平方根。所以如果球员在该赛季出场的时间较多,那么该赛季的权重因子也就相对越高。自从NBA-ABA在1976年合并之后。准确的讲,CARMELO会精确到小数点后一位数字,并找到比他年轻半岁和年长半岁之间所有的球员。截止2016年2月1日,沃尔将达到25.4岁,因此CARMELO所寻找的模板球员的年龄段也就在24.9岁到25.9岁之间。这些项目以及他们所占的权重如下所示:统计数据权重备注场上位置3.0如果是控球后卫则变为1.0,如果是中锋则变为5.0身高3.5&体重1.0&选秀顺位2.5取自然对数。如果未被选中则直接看作是该赛季最后一个被选中的新秀的顺位后第30顺位。例如假设该赛季被选中了60名新秀,则该赛季的落选秀则直接视作第90顺位的新秀。职业生涯上场时间1.5 & & & &&&每场比赛上场时间3.5&单赛季上场时间6.0对历史球员而言,因为劳资纠纷等问题而缩短的赛季将被换算成82场来计算。真实投篮命中率5.0 & & & &&使用率5.0 & & & &&&罚球命中率2.5 & & & &&&罚球率1.5 & & & &&&三分率2.5为了方便比较,会用该球员的三分率除以联盟平均的三分率。(当代球员更偏爱投三分球)助功率4.0&失误率1.5 & & & &&&篮板率4.0&盖帽率2.0&抢断率2.5 & & & &&防守正负值2.0由BPM和RPM取平均值得到。综合正负值5.0由BPM和RPM取平均值得到。这些权重是怎么得来的呢?说实在的,他们其实存在一些随机分配的成分,与比尔-[译注5]的相似度得分类似,都是靠“优秀的篮球直觉”而不是通过N阶近似优化之后得到的无比完美的数学模型。但是,大致来讲,以下五组主要的项目都被分配了约20%的权重。基本资料和身体数据;耐久性和上场时间;投篮和得分;其他进攻选择和分数;篮板和防守。译注5:比尔-詹姆斯,资深棒球体育评论作家,历史学家,数据分析专家,著有二十多部有关棒球历史和数据分析的专著。CARMELO所采用的相似度理论也从比尔-詹姆斯的理论中寻求过借鉴。虽然100是相似度的上限,然而从纯理论技术而言,该数值没有下限。一个球员在理论上可能存在相似度为负无穷的参照球员。但在实际操作中,得分超过-300分都属于不正常的范围。对于每一项数据统计,CARMELO都会计算现役球员与历史球员之间数值的标准差。然后以这个数值的平方乘以该项统计的加权因子并把求和之后的结果求平方根。得到的这个数据可以被称为球员之间的偏差。而球员之间的相似性公式则为100*((1.25 – 偏差)/1.25)。理论上可能最低的偏差是0(对于完全相同的球员而言);因此我们可以由此计算出最高的相似度为100。CARMELO每个赛季都会更新统计资料,因此一旦该球员取得了较大的进步(例如去年克莱-汤普森所做的那样)或者退步(就像是凯文-勒福),它就能找到与之具有类似经历的模板球员。然而,在实际操作中,得到的测算结果并不会有这么大的不同,考虑到其他的一些限定条件,CARMELO会尽力保持结果的平衡性。万一该球员的模板没有完成七个赛季呢?例如,2013-14赛季的拉塞尔-被列为了沃尔在2015-16赛季的模板。同样的,2014-15赛季的威斯布鲁克还被列为了沃尔在2016-17赛季的模板。那么问题就来了,当CARMELO进行计算的时候,威斯布鲁克还没有完成他的2015-16赛季,这下该怎么办?因为CARMELO的资料库中只有威斯布鲁克近两年的数据,于是我们就将其设定为,测算沃尔未来的两个赛季的表现时采用威斯布鲁克的数据,但当对他未来3-7年的数据进行测算时就忽略威斯布鲁克的影响。这里还存在一个特例,如果CARMELO找到的相似球员实在是太少了,比如对一位非常老的球员或者突然爆发的球员例如哈桑-怀特塞德进行测算的时候。在这种情况下,系统会放宽标准,把一些相似度为负值,但绝对值又不是特别大的球员纳入比较范围来预测球员的未来。基线测算其实是一种非常简单,像"猴子马塞尔"[译注6]一般的测算方法,它是基于过去三年球员的年龄,上场时间和正负值进行的计算。CARMELO会对每位球员进行计算,并评估该球员与基线的偏差。如果特里-波特超过了他自己的测算基线,那么这就预示着库里也有可能超越他的基线测算结果。简而言之:如果基线测算显示波特是一个WAR为10的球员而他事实上打出了12的水准,那么CARMELO就会认为库里也会在原有的测算结果上多得2分。因此,如果库里的基线测算得到的结果是15分,那么基于波特的基线测算结果就会让库里的分值上升到17分。译注6:猴子马塞尔,或者简称马塞尔,是一套非常先进的棒球胜负预测系统。更加具体的说——PM就是球员的正负值,而MIN则是他的上场时间,WAR是通过以下公式计算的:WAR = (PM*MIN*(2.18))/(48*82)考虑到每支NBA球队的进攻节奏差不多为100回合/场,因此该数据差不多也等同于每48分钟数据。为了防止混淆,这里再做特别说明, 防守正负值为正值说明该球员的防守能力更佳。让情况更加复杂的是,RPM也存在多个版本。在某些版本中,前一赛季的数据也被用来预测当季的RPM—因此在沃尔的例子中,他在2013-14赛季的表现就有可能会影响到他在2014-15赛季的RPM。CARMELO则仅采用了使用单一赛季数据的RPM体系。恩格尔曼先生慷慨的把从2000-01赛季至2014-15赛季的所有数据都提供给了538网站。在2000-01赛季之前,因为没有可查的RPM数据,因此我们将采用BPM来替代。这是因为CARMELO把在接下来的一个赛季中出场时间为0的球员剔除出去了数据库。这样做的效果对大龄球员而言效果尤为显著。例如,对德克-的预测只能基于37岁时还在联盟中征战的老将,那些在此前就已经退役了的将不再被考虑。例如罚球命中率和防守正负值。在基线测算的时候,球员的高矮不会产生本质上的影响。然而如果该球员的身高足够高,那么测算会在防守方面给予更多的青睐,反之,如果他的个头不高那么系统会在进攻端给予较高的分数。胜负测算是基于一个版本的毕达哥拉斯方程的计算结果[译注7]。他们采用了指数为11.5的毕达哥拉斯方程,采用这种方法可以得到的胜负结果相对保守。然而在事后测试中,当我们处理以RPM和BPM为基准的测算时,这一指数得到的结果最为准确。译注7:毕达哥拉斯方程最早是比尔詹姆斯开发出来预测职业棒球比赛胜负的一种计算方法,它通过& 赛季中的得分与失分数来预测棒球队是否“应该”获胜。计算公式为,获胜几率=〖得分数〗^2/(〖得分数〗^2+〖失分数〗^2 )。从1993年开始,达瑞尔-第一次尝试用这套理论开始预测篮球比赛的胜负。他发现当将上述公式中的指数换算为13.91时能得到相对符合预期的结果。其研究成果发表在STATS Basketball Scoreboard, 1993-94中。后来约翰-霍林格也采用过类似的预测方法,只是将指数调整为16.5。而本文中该指数为11.5。
[&此帖被hehe_dicp在 22:02修改&]
翻译作品链接:&招工链接:&&原文标题: We’re Predicting The Career Of Every NBA Player. Here’s How.&原文作者: Nate Silver&原文链接:&&译者:&hehe_dicp备注:&@&
[&此帖被hehe_dicp在 16:42修改&]
您需要登录后才可以回复,请或者
/人参加团购/元&/元

我要回帖

更多关于 街球和职业球员单挑 的文章

 

随机推荐