本文来自微信公众号:杰晶维基(ID:JieJingWiKi),作者:Michael J. Mauboussin,时间:2004年8月5日,译者:Oliver,题图来自:视觉中国


  • 统计数据提供了一种直觉无法捕捉到的理解游戏或情境的方法。


  • 总的来说,直觉和传统在塑造体育测量、管理和发挥方面发挥了比统计更大的作用,商业和投资也是如此。


  • 团队在一系列绩效变量或维度上或强或弱。因为团队在各个维度上都有不同的优势,所以你不能说真的有一个最好的团队,这个问题看起来像是石头、剪刀、布的游戏。


  • 同样的心理陷阱也存在于体育、商业和投资领域。


  • 许多体育和商业组织太过短期,不恰当地关注结果而不是过程。


人们经常把体育描述为生活的缩影。体育运动捕捉了日常生活中的一些问题,比如纪律和无序、计划和即兴发挥、合作和竞争、技巧和运气。再加上职业体育领域的巨额资金,难怪报纸和广播里充斥着谁火或者不火的话题。


但是,当试图评估个人和团队的表现时,运动队经理和专家们面临一个根本的问题:哪个更可靠,定量统计还是定性直觉?虽然正确的答案介于这两个极端之间,但许多运动员很难达到最佳的平衡。


2004年6月,圣达菲研究所(Santa Fe Institute)举办了一次为期一天的会议,直接讨论上述问题。虽然讨论表面上是关于体育的,但许多框架和结论都与商业和投资直接相关。


你所看到的vs正在发生的


大多数球员、教练和球迷都是通过感知和过去的练习来评价比赛。总的来说,在体育测量、管理、战略和比赛中,直觉和传统比统计发挥了更大的作用。


然而,我们在观看比赛时看到的和正在进行的可能是不同的。为了说明这一点,经济学家科林·卡默勒(Colin Camerer)投影了一张在两个几乎完全相同的场景之间闪烁的图像,并要求参与者找出其中的差异。许多人不能在规定的时间内完成,尽管一旦Camerer指出来,差异就很明显了。

 

它传递的信息是:我们并不总是感知到场景中发生的一切。统计数据可以帮助我们理解我们的直觉或感知无法捕捉到的游戏或情境。

 

迈克尔·刘易斯(Michael Lewis)的畅销书《点球成金》(Moneyball)就阐述了这一点,并在体育界和商界引起了轰动。书中展示了预算较低的奥克兰运动家队(Oakland Athletics)是如何比对手更有效地利用统计数据,组成了一支极具竞争力的球队。运动家队依靠的不仅仅是传统上被棒球珍视的“工具”(打击能力、力量打击能力、投掷能力、跑动能力和外场能力),而且还依靠技术——完成工作的能力。结果便是,那些看起来很有吸引力但却不符合理想玩家模式的玩家的价格相对较低。像优秀的价值型投资者一样,A队吸纳了一批被低估的球员,并以较低的成本赢得了与许多大型市场球队一样多的比赛。

 

BC和CB(Bowl Championship and Colonel Blotto)

 

大会的第一次会议是关于球队排名的。老板、球迷、教练和球员都有兴趣决定哪支球队是“最好的”。排名和比赛是回答这个问题的两种方式。然而,两位发言者都得出结论,团队排名是极其困难的,而且可能非常具有误导性。其中许多经验教训适用于商业世界,特别是商品和服务市场。

 

数学家Ken Massey首先讨论了与排名团队相关的挑战。Massey应该知道;他的Massey排名是碗锦标赛系列(BCS)排名的一部分,该排名决定了哪些大学足球队将参加关键的碗赛。(参见http://www.masseyratings.com/)

 

评级系统试图客观地衡量每个团队相对于它所面临的进度的表现。它们不同于民意调查、排名或积分系统。Massey指出了创建评级系统的一些障碍,包括:

 

  • 缺乏传递性。仅仅因为A队打败了B队,B队打败了C队,并不意味着A队会打败C队(见图1)


图1 传递性在大学橄榄球比赛中不成立(2003年结果)<br>
图1 传递性在大学橄榄球比赛中不成立(2003年结果)


  • 完全不同的时间表。排名必须比较比赛日程非常不同的球队,比较一支实力强大的输球球队和一支实力较弱的输球球队是很困难的。


  • 噪音。很多因素都会影响一个团队的表现和潜力,这些因素包括环境(场地、天气、人群)、身体(受伤情况、旅行、海拔)和运气。


Massey回顾了一些数学技术来为球队排名,包括最小二乘、最大似然和马尔可夫链。虽然Massey评级是为了衡量过去的表现而设计的,但它们也有预测价值。Massey指出,他的最佳-最大可能性模型正确预测了大约四分之三的职业棒球比赛和三分之二的NFL比赛结果。


密歇根大学社会科学家斯科特·佩奇(Scott Page)在演讲开始时对三个普遍认同的前提提出了挑战:存在最好的团队;你可以对团队进行排名;在球场上解决比看数据要好。


多维度的问题是决定最佳团队的主要问题。团队在一系列的绩效变量或维度上或强或弱。足球中表现变量的例子包括进攻、防守和特殊球队。由于能力相似的团队在绩效变量上有不同的优势,所以确定哪个团队更好的问题是困难的。Page认为这个问题就像石头剪刀布游戏。


Page向他们介绍了一个名为Colonel Blotto的双人竞争游戏模型。这里有一个简单的版本:


  • 两名玩家都得到100个棋子

  • 有三个位置可以放置棋子

  • 在一个位置放置棋子最多的玩家将赢得该位置

  • 赢得最多位置的玩家将赢得游戏


这里有一个例子:



Page建议,你可以把每个地点看作一个维度。根据这些规则,玩家可以选择一些非常糟糕的策略(100,0,0—类似于拥有一个没有进攻线的优秀四分卫),但如果两支队伍拥有相似的能力,那么大体上获胜是随机的(见图2)。即使团队的能力参差不齐,也需要更多的能力才能发挥作用。


图2 布洛托上校的风车:当能力相似时,胜利是随机的<br>
图2 布洛托上校的风车:当能力相似时,胜利是随机的


游戏的维度越多,它就越难以预测。比起网球和摔跤等低维度游戏,我们应该期待(并看到)在足球等高维游戏中出现更多令人沮丧的情况。毫无疑问,投注线反映了投注者的经验和直觉,通常与计算机的排名不匹配。与排名模型或民意调查相比,投注者可能能够更好地汇总维度。

 

Page随后讨论了他所谓的“总经理的背包”问题。总经理必须在有限的预算(洋基队除外)内组建一支由不同规模的球员组成的球队。这个问题非常难以解决,特别是当解决方案在某种程度上依赖于其他团队正在做的事情时。

 

矛盾的是,Page指出,如果你增加复杂性——例如,让一个维度的强度取决于另一个维度——问题就会变得简单。举例来说,在篮球比赛中,跑快攻的能力在防守篮板好的情况下更有价值,熟练的总经理会选择团队来利用这些突发事件。这种思路或许有助于解释为什么底特律活塞队在2004年的NBA总冠军比赛中“击败”了大受欢迎的洛杉矶湖人队。

 

就去做吧

 

接下来的两位演讲者,加州大学伯克利分校的经济学家大卫·罗默(David Romer)和南加州大学(USC)的足球进攻协调员Norm Chow,讨论了足球比赛的一般号召力和踢球策略。这对搭档在统计驱动的理论和直觉和习惯驱动的实践之间提供了最清晰的二分法。


罗默的论文《第四次下降,Bellman方程说了什么?》,分析职业橄榄球比赛的选择。他的数据来自1998-2000赛季的所有NFL比赛,提供了球场上不同位置和下位情况下的预期得分。罗默的分析表明,美国国家橄榄球联盟的教练认为比赛太过保守:他们没有足够频繁地进行第一次进攻,当他们应该尝试触地得分时,他们经常满足于射门得分。图3总结了Romer的发现和建议。


图3 踢还是不踢<br>
图3 踢还是不踢


例如,Romer的分析表明,在进攻半场的532次第四次进攻中,球队只进攻了8次。在183次第4次进攻中,在距离分析显示球队应该去的地方5码或更多码的地方,他们只做了13次。罗默指出,这种次优呼叫可能会让NFL球队每年损失一场比赛。


球员、教练和球迷经常对Romer的工作感到不满,他们指出了一些因素,如势头、第三对第四的低位进攻和选择偏见(这些数据只适用于一般球队)。Romer正面解决了这些问题,提出了一个理由,即反对意见要么是无力的,要么是无效的。


以动量问题为例。按照惯例,如果一支球队阻止了对手的第四次进攻,它就会获得能量和情感优势。Romer对此的怀疑源于两个方面。首先,虽然分析没有考虑到第四次下跌失败带来的下行压力,但也没有考虑到第四次下跌成功带来的上行压力。第二,其他关于动量的研究发现数据中动量效应的证据不足。换句话说,统计数据反映了人们的情绪。


与Romer形成鲜明对比的是,Chow强调了情感的作用。尽管罗默的分析和大量证据都表明,体育比赛的结果通常与概率一致,但他显然相信势头和连胜。


Chow还强调了体育运动中固有的风险规避。教练们通常会避开新策略,因为他们不想输——至少不想以一种非常规的方式输。约翰·梅纳德·凯恩斯(John Maynard Keynes)关于投资的观点也适用于体育运动:“世俗智慧告诉我们,传统的失败比非传统的成功更有声望。”


Chow对统计分析的理解,使Camerer关于感知的观点成为焦点。大多数教练使用的方法,让人想起费舍尔·布莱克(Fisher Black)1986年发表的著名论文《噪音》(Noise)

 

“因为世界上有太多的噪音,人们采用经验法则。他们互相分享自己的经验法则,很少有人有足够的经验来解释嘈杂的证据,认为这些法则太简单了。”

 

像许多从业者一样,Chow严重依赖经验法则和传统方法。尽管如此,Chow和他的团队已经非常成功,所以他的直觉和模式识别能力可能得到了很好的磨练。

 

棒球的艺术与科学

 

洛杉矶道奇队(Los Angeles Dodgers)总经理保罗·德波德斯塔(Paul De Podesta)主张在棒球队建设和管理中使用统计技术,他讨论了统计的局限性和常见的决策缺陷。他强调了日常生活中的大量噪音,这些噪音是基于个人问题、媒体关注和粉丝反应等因素,以及统计数据。

 

De Podesta看到了什么偏见?首先,有情感偏见,比如过分强调最近的结果,过分简化复杂的情况,以及坚持传统智慧。这些偏见往往会促使人们做出糟糕的决定。

 

第二,他指出许多组织的短期取向。例如,美国职业棒球大联盟的30名总经理中,有一半的任期不足3年,8人的任期不足2年,只有1人的任期超过10年。同样,在2003-2004赛季,也有很多新教练加入了NBA。因此,即使在一个组织中,不同的人也可能有不同以及相冲突的时间范围。例如,一名签了一年合同的球队经理和一名签了五年合同的总经理可能会选择非常不同的球队。

 

最后,De Podesta强调了决策过程与结果的重要性。他承认要避免这一陷阱非常困难,但他强调了在做出正确决定时区别的重要性。

 

篮球与大脑

 

《纸上篮球》(Basketballon Paper)一书的作者迪恩·奥利弗(Dean Oliver)对如何在篮球中分解统计数据提供了一些见解。篮球在复杂性或维度的数量上介于棒球(大量的一对一互动)和足球(11对11)之间。正如Oliver所描述的,篮球可以归结为拥有的数量以及每支球队利用他们拥有的东西的效率。更进一步,Oliver认为四个因素决定了篮球的关键方面:

 

1. 投篮命中率

2. 进攻篮板

3. 犯的失误

4. 跑到罚球线(然后投篮命中)

 

这种方法允许Oliver对团队和球员进行评级。例如,他开发了一个软件程序Roboscout来帮助预测比赛结果。(参见http://www.82games.com/)

 

《篮球在纸上》包括一些应用于篮球和体育之外的分析。首先是对连胜数据的另一种解读。斯蒂芬·杰伊·古尔德(Stephen Jay Gould)说过,连胜是“运气加在技巧上”。Oliver用图4中的数据展示了这一点。连胜属于统计范畴:概率表明,最长的连胜是由表现最好的球队获得的(在Oliver的例子中,球队胜率更高)


图4 82场比赛的赛季中至少有一次连胜的机会<br>
图4 82场比赛的赛季中至少有一次连胜的机会


另一种分析形式是回归均值。根据NBA的数据,Oliver显示,输球和赢球的球队都倾向于在一段时间内回到平均胜率(50%)。这些分析显然是商业和投资的平行方面。


图5 五年后:大多数球队接近0.500<br>
图5 五年后:大多数球队接近0.500


加州理工学院(Cal Tech)经济学家科林·卡默勒(Colin Camerer)发表了当天最折衷的讲话。正如前面提到的,Camerer首先强调了为什么统计数据可以帮助我们“看到”体育领域正在发生的事情。他接着记录了一个体育市场效率低下的案例,接着又记录了一个体育市场效率低下的案例。

 

Camerer所描述的低效率是基于“处置效应”(disposition effect)——即一旦我们做出财务决定,我们通常会拒绝扭转这个决定,直到它奏效。在股市术语中,处置效应指的是人们在遭受损失时不会抛售股票,而是等到得到补偿或获利后再处置股票。投资者行为的实证研究支持了这一理论。

 

Camerer和他的同事们研究了性格效应是否在NBA选秀中起作用。具体来说,他们根据新秀的贡献来决定高选秀权是否比他们应该发挥的更多。这项研究证实,在前三年的选秀中,高选秀权确实比正常的上场时间要多。职业篮球经理人也不例外。

 

为了说明市场效率,Camerer分享了一个赛马投注的案例。非常偶然的是,有一天他发现赌博可以取消。这让他产生了一个想法:如果他在其中一匹马身上下了大赌注,然后在最后一刻取消,那么这两匹相似的马的赔率会发生什么?技术交易员会把资金流入和赔率变化解读为可能的信息不对称吗?还是基本面投资者会利用这个机会改变他们的押注策略?

 

Camerer选择了两匹相似、获胜概率相对较低的马。他在其中一项赌注下了很大的赌注(通过抛硬币决定的),后来在赌博结束前几分钟取消了。实验表明,尽管一些赌徒确实遵循金钱的轨迹,但这匹马获胜的几率大大提高了。但在取消下注后,他显示赔率回到了操纵前的水平。足够多的人把赌注押在另一匹马上(相对便宜),以抵消那些试图利用所谓的精明投资趋势的人。他的工作证明了平价互助市场的巨大效率。

 

Camerer的另一个话题是人们倾向于朝前看多少步。一般均衡理论假设个人对自己未来的偏好有一个完全的理解——一个明显不现实的假设。但人们能向外看多远呢?Camerer的研究表明,人们往往只注意到一两个步骤,很少会更多。

 

经验教训

 

与上一代人相比,统计技术显然在当今的商业和投资领域发挥了更重要的作用。也许体育分析只是在追赶其他市场。但值得注意的是,在体育、商业和投资中明智地使用统计数据存在一些重大挑战。这些包括:

 

1、预测有助于决定结果。在资本市场,研究人员和从业人员已经发现了许多异常现象和交易策略,它们根据过去的结果带来了超额回报。但这里存在着一个悖论——利用市场的无效率,从业者使市场更有效率。

 

同样地,如果你在场上的策略(基于过去的统计数据)变得可以预测——你从不短打,或者你在某些第四次击球的情况下进行短打——你的对手知道这一点,他们会改变他们的策略来抵消你的移动。在某种意义上,过去的低效消失了,“市场”变得更有效率。

 

在一些领域,比如天气预报,预测和结果是相互独立的。在市场和体育领域,至少存在显著相互依赖的可能性:预测有助于决定结果。

 

2、统计信息依赖于上下文。为了从统计比较中获得意义,数据需要显示出足够的平稳性——也就是说,样本必须从统计上相似的总体中提取。但在现实世界中,数据往往是不稳定的,因此比较是危险的,甚至是无意义的。

 

在投资世界中,我们很容易发现非稳定性。以普遍存在的市盈率为例。专家们经常将今天的市盈率与过去的市盈率进行比较。但通货膨胀、税收和资产构成等重要项目使这些比较变得模糊不清。

 

在体育世界中,由于规则的变化(例如,篮球的球道和击球时间的扩展)或位置的变化,很难对不同时间的球员进行比较,有些球场对击球手或投手更友好。当然,我们可以调整这种上下文依赖关系,但这又增加了另一个挑战。

 

3、概率的作用。大多数对热手的分析——例如,篮球运动员在投进一个球后更有可能投进他或她的下一次投篮——发现结果与球员的能力或成功的概率一致。换句话说,考虑到一个球员的投篮命中率,我们应该期待他能连续出手。然而,在现实中,绝大多数的体育迷和运动员仍然认为热手是存在的。这表明我们人类没有明确的概率意识。

 

如果你有一个大的样本,计算概率是非常棒的。但如果样本容量有限呢?

 

经济学表明,你仍然需要从概率的角度思考问题,尽管我们现在有大量证据表明人类并不是这样做决定的。事实上,人类是危险的。这可以解释为什么,例如,NFL教练会做出保守的决定。

 

由于这一人类心理特征(以及其他特征),我们倾向于错误地指定概率和结果,从而导致下一个挑战和机会。

 

4、心理学的作用。体育、商业和投资都是我们与他人一起进行的活动。尽管我们对心理影响的理解在最近几十年里有了显著的增长——丹尼尔·卡尼曼(Daniel Khaneman)和阿莫斯·特沃斯基(Daniel Khaneman)的前景理论在这一努力中发挥了重要作用——但我们的运作方式在很大程度上仍不是最理想的。所以最后的挑战和机会是理解心理因素并试着利用它们。

 

评估期就是一个很好的例子。研究表明,投资者存在短视的损失厌恶情绪——频繁的投资组合评估会引发厌恶情绪。因此,长线投资者比短线投资者更愿意为风险资产支付更高的价格。

 

你可以从两个层面来考虑这些心理陷阱:第一,我们每个人作为个体都会犯的错误——过度自信、框架问题等等;第二,与集体行为有关的陷阱——影响和模仿的角色。理解这两个层次是非常重要的。

 

5、环境思维与属性思维。在一篇非常相关的文章中,克莱顿·克里斯滕森(Clayton Christensen)和他的同事讨论了建立理论的三个步骤。首先,你用数字来描述你想要理解的东西,然后你根据相似性将现象分类,最后你建立一个理论来解释现象的行为。

 

一旦理论就位,研究人员往往会发现一些反常现象,迫使他们重新思考和重申对这些现象的描述和分类。也许这篇论文最重要的信息是,好的理论需要适当的分类,而随着理论的改进,分类通常会从基于属性演变为基于环境。建立在基于环境的类别上的理论告诉从业者在不同的情况下应该做什么。与此相反,基于属性的类别规定基于现象特征的行为。

 

大多数商业理论(管理时尚)、投资理论(风格盒)和运动理论(踢球vs争取)都是基于属性的理论。在任何情况下,都有向更好的、基于环境的框架发展的空间。

 

因此,这五个问题与每个人都息息相关——体育界人士、学术界人士、商界人士和投资者。 

 

参考资料:

[1] Michael Mandelbaum, The Meaning of Sports (New York: PublicAffairs,2004), 5.


版权声明:本文版权归杰晶维基或原作者所有,虎嗅经授权发布


本文来自微信公众号:杰晶维基(ID:JieJingWiKi),作者:Michael J. Mauboussin,译者:Oliver,文章来源:Legg Mason Capital Management, The Life of Game