表1:数据概览
因为球员的场均上场时间关于场均数据有累计作用,故在之后的分析中对场均数据进行分钟化处理以消除累计影响。本文分析并没有包含球队与分区这两个变量;筛选掉那些登场场数少于10场的观测。
首先想到的是不同位置球员的上场时间会有不同,图2反映出上场时间由高到低依次排序为:后卫、前锋、中锋。
图2:球员位置
每分钟数据高低影响着球员场均上场时间。每分钟得分衡量球员得分能力的强弱,图3反映出每分钟得分与场均上场时间存在正相关关系,得分能力强的球员更容易获得上场时间。
图3:球员每分钟得分
每分钟助攻衡量球员串联球队的能力,图4反映出助攻能力的强弱于球员上场时间存在正相关关系,助攻能力强的球员更容易获得上场时间。
图4:球员每分钟助攻
每分钟犯规反映了一个球员在场上身体控制能力以及防守习惯的好坏,因为犯规会送给对手罚球机会,且个人6次犯规会被罚下。图5反映出每分钟犯规与球员上场时间存在负相关关系;而失误虽然也是不希望看到的数据指标,但图5反映出每分钟失误与球员上场时间存在正相关关系,这是因为失误多的球员大多是那些控球多、传球多的球员,他们承担着更多的责任,相应的产生了更多的失误。
图5:球员每分钟犯规与失误
由于篇幅限制,每分钟篮板、抢断与命中率等描述统计图不在推文中展示,详细请见PPT。
建立全样本回归模型:因变量为场均上场时间,自变量为每分钟得分、每分钟助攻、命中率等10个变量。使用逐步回归依据AIC准则选择模型,回归系数见表2,通过模型残差等模型检验。
表2:全样本回归模型
从表2中得出以下结论:
1. 每分钟抢断、盖帽、篮板、助攻、得分以及命中率与三分命中率均对球员上场时间有提升作用。
2. 每分钟失误是一个“不好”的数据,但其系数为正;因为球员处理球、组织进攻,失误数会随之上升。
3. 每分钟犯规是一个显著地减少上场时间的变量。
进一步研究不同球员位置上场时间的影响因素,在全样本模型中加入球员位置与其他因素的交互项;对自变量进行标准化,统一量纲以便于之后影响因素的排名比较。
图6:后卫球员上场时间影响因素
后卫球员:
1. 盖帽能力对后卫球员上场时间有着巨大提升。
2. 助攻能力、得分能力以及高命中率对后卫球员非常重要。
3. 篮板和抢断的能力以及三分命中率提升作用次之。
4. 每分钟失误与犯规显著的减少后卫球员的上场时间。
图7:中锋球员上场时间影响因素
中锋球员:
1. 助攻能力对中锋球员的上场时间提升巨大。
2. 篮板能力是中锋球员的核心要求。
3. 高命中率比高得分更加重要。
4. 盖帽能力比抢断能力对中锋的提升更明显。
5. 每分钟犯规显著的减少中锋球员上场时间。
由于篇幅原因,前锋球员的详细解读请见PPT。对球员的发展目标以及教练与经理的签约策略具有指导意义。不足是自变量覆盖面不全导致R方较小;没有考虑球队风格对球员上场时间的影响;没有考虑每分钟数据之间的交互。
任图南
北京大学
行百里路者半九十,
努力只是为了进步!返回搜狐,查看更多