噪声:人类判断的缺陷
推荐理由
在《噪声》一书中,三位作者巧妙地将他们对人类判断缺陷的独特新颖见解,运用到人类在各个领域的判断问题。《噪声》是心理学领域的一项了不起的成就,也是一座里程碑。在这本书中,作者深入分析了噪声的影响:所谓“噪声”。即是造成我们决策失误的因素。人类并非完全理性,只要开始判断,噪声便会随之而来。由于时间的单向性,每一个判断和决策均会导向不同结果,由此,如何降低噪声带来的决策风险,从而做出最优选择至关重要。作者在书中提出的策略是利用科技的力量,通过发掘埋没在大数据中的信息来减少决策中的噪声,这可以说是大数据渗透到行为经济学领域的新趋势。
作者介绍
丹尼尔·卡尼曼(Daniel Kahneman),诺贝尔经济学奖得主,美国总统自由勋章获得者,全球畅销书《思考,快与慢》作者,普林斯顿大学尤金·希金斯心理学荣誉退休教授,公共和国际事务学院教授,曾荣获多项奖章。卡尼曼在心理学上的成就是挑战判断与决策的理性模式,被公认为“继弗洛伊德之后,当代最伟大的心理学家”。他的跨领域研究对经济学、医学、政治学、社会学、社会心理学、认知科学等领域都产生了深远的影响,被誉为“行为经济学之父”。
奥利维耶·西博尼(Olivier Sibony),巴黎高等商学院(HEC Paris)教授,牛津大学赛德商学院外籍教授,曾在全球最大的战略咨询公司——麦肯锡咨询公司担任资深合伙人长达25年时间。西博尼的研究领域为策略、决策、问题解决,力图提升决策的品质。主要代表著作有《You Are About to Make a Terrible Mistake》《Before You Make That Big Decision》等。
卡斯·R.桑斯坦(Cass R. Sunstein),哈佛大学法学院教授,主要研究领域为政策制定方面。著有多本《纽约时报》畅销书,包括与理查德·泰勒合著的《助推》(Nudge)、基于电影《星球大战》(Star Wars)的法学著作《星球大战的世界》(The World According to Star Wars),以及《助推2.0》(How Change Happens)等其他多本著作。
内容简介
《噪声》通过两个公式揭开了“判断出错”的本质,并且通过对三种噪声的系统性分析探索人类决断过程中所受的干扰。从六大部分阐述了“噪声”:“从寻获噪声到探究人类判断的本质,从预测噪声到阐释噪声的主要原因,从探讨如何改进判断和防止错误的的实际问题,一直延伸到什么才是合适的噪声水平”。为了减少噪声,降低危害,重塑决策框架,卡尼曼在书中提出了6大原则,致力于帮助读者成为一个聪明的决策者。
在第一部分,作者告诉我们什么是噪声,它指的是造成我们决策失误的因素。丹尼尔·卡尼曼认为,凡有判断必有噪声;影响我们决策质量的因素有两个,一个叫偏差,另外一个叫噪声。其中,偏差属于系统性因素,是大脑固有的思维模式,而噪声主要指的是不可预测的偶然性因素。
在第二部分和第三部分,作者把噪声分为了三种不同的类型。第一种叫水平噪声,指的是我们做某个决策的时候,个人影响因素与行业平均水平的差异。第二种叫模式噪声,指的是某一次决策水平与本人一贯的决策水平之间的不同。第三种叫情景噪声,它属于模式噪声的分支,指的是你的决策水平在不同的情景、不同的心情下,最终的结果也会不同,而影响我们决策的这些因素,都属于情景噪声。
在第四部分,作者认为,个体间的差异总是存在的,每个人也总有特殊的偏好,人的状态也会随着情境起起伏伏,所以噪声几乎是无处不在的。但更雪上加霜的是,有一些因素还会增大噪声的幅度。
常见的放大噪声的情况有三种。第一种叫“客观无知”。即就是做判断的人在认知上的有限性。第二种叫“匹配问题”。一方面因为每个人的标准不同,对同一个事情的评价也会不同,即人与人之间的分歧。另一方面,因为在不同的场合里,人们对量表的理解也会发生变化。比如在公司绩效考核中,有的领导给80分是优秀,有的领导给90分才是优秀。第三种是群体的不良影响。一个群体共同做判断和决策时,要想提高决策质量,其实是有苛刻的条件的。如果不满足该条件,那群体其实反而会增大决策噪声。
在第五部分“决策卫生,提升五大人类判断力”中,作者主要探讨了如何减少噪声,提出了四种常见的手段。第一种是把决策过程交给一个每一个个体都能独立做判断的群体。也就是个体独立做判断,然后汇总独立判断的结果。第二是用排序取代匹配。即先对决策中的不同因素进行分档排序,再依次根据排序来打分。比如很多公司招聘时,会先把面试者分成不同的档次,然后在每一档里逐个打分。第三种是把决策过程交给一个模型。模型本质上其实都是固定的数学公式。只要每次的输入是一样的,它就保证输出是一模一样的。第四种则是把决策过程交给“决策达人”。即在决策过程中寻找那些能够排除噪声影响、直中把心的决策达人,让他们来做出判断和抉择。
在第六部分,作者讨论了减少噪声过程中可能会遇到的障碍,并将其分为三种。第一个障碍是,人们不信任算法。作者认为人们普遍不信任算法,通常会去抵制通过算法来减小噪声的那些措施。第二个障碍是,人们担心模型会扼杀积极性和创造力。人类的决策虽然飘忽不定,但其中也会诞生出很多创意,如果决策过程都交给了死板的模型,极有可能会扼杀人类的创意。最后一个障碍是成本。在一些领域中,减小噪声的成本过高,很多人不愿意为此花费太多。
本书目录
第一部分 寻找噪声 第1章 犯罪和充满噪声的判罚/77 第2章 系统噪声,给人达成一致的错觉/102 第3章 单一决策,仅发生一次的重复决策/130 第二部分 你的大脑是一种测量工具 第4章 什么是判断/149 第5章 测量误差,噪声与偏差的代价一样大/179 第6章 噪声分析:所有判断都存在 3 类噪声/211 第7章 情境噪声,无时无刻不在影响着我们的判断/235 第8章 群体是如何放大噪声的/275 第三部分 预测性判断中的噪声 第9章 判断与模型,简单的模型普遍优于人类判断/316 第10章 无噪声的规则/347 第11章 哪里有预测,哪里就有客观无知/381 第12章 常态谷:事情虽无法预测,但可以被理解/408 第四部分 噪声是如何产生的 第13章 启发式、偏差与噪声/439 第14章 匹配,找到与你的预测最精准匹配的共识/478 第15章 选取精确的量表,并多用相对判断/507 第16章 模式噪声的构成/538 第17章 噪声源,偏差是引人注目的图形,而噪声是不受我们关注的背景/562 第五部分 决策卫生,提升五大人类判断力 第18章 卓越的判断者,卓越的判断力/596 第19章 消除偏差与决策卫生/626 第20章 司法科学,信息排序是最大的噪声/648 第21章 甄选与汇总,超级预测的两大策略/686 第22章 医疗决策,用科学的诊断指南减少噪声/723 第23章 绩效评估,用基于外部视角的共识框架做出量化判断/761 第24章 人员招聘,以结构化指标衡量人才/794 第25章 中介评估法,做出明智决策的核心方法/826 第六部分 最佳的噪声水平 第26章 减少噪声的成本/867 第27章 尊严,人之为人的重要价值观/892 第28章 规则还是标准/920
阅读感悟
1.噪声——人类决策的阻碍
噪声的概念非常广泛,它不仅存在于物理测量的过程中,而且同样大量出现在人类思维的决策过程中,涉及司法审判、保险理赔、医学诊断、人事决策、产品预测、专利权授予政策,以及日常生活中的各种情境,跨越了不同的领域。
传播学中也存在“噪音”概念,它是指除信源有意传播之外的一切东西。“噪音”的提出,表明传播并不是在真空中进行的,过程内外的各种障碍因素会形成对讯息的干扰,造成信息的失真。与此同时,噪声的存在会对我们的判断和决策造成干扰,并且,人类在面对各种问题时,我们的看法和判断不可能完全达成一致。因此,噪声会成为人类决策的阻碍。
在新冠肺炎疫情爆发后,欧洲国家在优先事项、主要目标、卫生系统、治理模式等各方面都非常相似,但最终选择的疫情应对政策却有着巨大的差异。面对同样的问题,他们想出了不同的解决方案。有些国家的疫情日增病例数字时不时冲上热搜,有些国家却能成为他国借鉴经验的典范。而形成这样巨大差异的原因,就在于他们在面对相同的问题时,在噪声干扰下决策的差异性。正是由于决策偏差及其差异性影响的存在,这就意味着我们在做决策以及效果评估时,应该反思我们可能出现或已经产生了何种误差,从而启发我们该如何去完善和改进,以更好地屏蔽噪声带来的干扰。
2.算法——辅助决策的手段
在算法时代,算法问题逐渐成为学界和业界关注的焦点,乐观之余更应该对算法保持谨慎,它所带来的伦理问题比技术本身更为严峻。现阶段的算法还不具有自我意识,智能程度在于对现有数据的分析计算上。但在公众无法清楚计算机运行逻辑的情况下,自然也不会知道算法对数据的分析是否真的客观公正。但是丹尼尔持有不同的观点。
丹尼尔认为,“信息茧房”“过滤气泡”并非揭示了算法的失败,相反,它们恰好证明了算法的成功。算法推荐被设计出来,就是为了达成满足人们个性化需求的目的,在这一点上,算法的初衷是人性化的。他提到,算法只是经过编程产生的,它本身没有观念倾向,只是人们在满足自身利益的过程中容易导致错误偏差的出现,尤其体现在社交媒体公司对于资本的剥削上。
不可否认的是,丹尼尔关于算法的观点有一定的合理性,这与传播学中的社会决定论有一定的相似之处。即技术起源于社会生活,产生于人的社会需求。人是技术的主人而不是奴隶,且技术不仅仅是工具和手段,也是伦理、政治、文化价值的体现。
我们需要意识到,算法将在人类生活中扮演越来越重要的角色。我们积累的数据越多,使用的算法越多,我们就越有可能做出更好的判断,提升决策的质量。本书强调让人类决策在保留原来的所有优点的同时,拥有更好的纪律性,最后在决策结果上接近于算法的准确度。我们称之为“决策卫生”(decision hygiene),让人类的判断更有纪律,从而在实践中减少噪声,而不是在任何领域都用人工智能算法取而代之。
当今社会,我们越来越需要一些比较稳定的、精准的社会制度和技术模式来做出一些高效平稳的判断。比如谷歌公司招聘员工时两个环节的招聘制即体现了这一点。其中,第一个环节是经由算法让求职者参与一系列标准化的考核和面试,每项考核都独立打分、独立评估,面试问题也根据考核项的差异有严格的规定,最终将多项考核结果汇总,生成一份求职者档案。由此可见,这份档案其实诞生于一个死板的面试模型。在第二个环节里,这份档案会被交往招聘委员会,由委员会的成员结合文档内容给出最后的雇佣意见。
因此,谷歌的这套招聘流程并没有完全否认人类主观的直觉和判断,只是尽可能地把人类的介入延后,先让算法模型来判断,最后才交给人类,这在一定程度上提升了决策的科学性。
而随着人类文明不断向前发展,人类在社会体系中做判断的职责越来越重要。对于一个社会系统来说,各方面的因素都会影响到一个人或一群人的判断,从而影响最终的决策,带来不同的结果。作者提醒我们,算法模型作为辅助决策的手段,有其科学性。面对人类判断的各种噪声,我们可以借用统计学的思维去观察,遵循一套科学的流程,使我们在决策的过程中尽可能地少受不必要噪声的干扰。
内容摘录
世界充满复杂性与不确定性,因此判断是一件困难的事。这种复杂性在司法领域显而易见,在其他大多数需要专业判断的情形中也是如此。从广义上讲,这些情形包括由医生、护士、律师、工程师、教师、建筑师、招聘委员会成员、图书出版商、各类企业高管以及球队经理人等所做的判断。凡是判断,就不可避免地存在分歧。
——第1章 第96页
噪声就像地下室漏水,它之所以能被容忍,不是因为人们认为它是可接受的,而是因为它一直未被发现。
——第2章 第116页
分歧需要有一定的限度。事实上,“判断”这个词主要用于人们能够达成一致意见的场合。判断问题不同于品位或意见,在后两种情况下,彼此之间的差异是完全能被接受的。对于那些对噪声审查感到震惊的保险公司高管来说,理赔员在“披头士乐队和滚石乐队哪个更好”,或是“鲑鱼和金枪鱼哪个更好”之类问题上存在的分歧,并不会让人觉得不妥。包括专业判断在内的判断介于两者之间:一端是事实或计算问题,另一端是品位或意见问题。因此,不同主体的判断必然存在一定程度的分歧。
——第4章 第145页
有一种思维模式会自发地出现在我们的脑海里,它就是因果思维(casual thinking)。因果思维会创造出故事,故事中特定的人、事、物之间会相互影响。要想体验因果思维,你可以将自己想象成一名社工,你追踪调查了很多贫困家庭。你刚刚听说其中一个家庭的人目前无家可归,比如琼斯一家。你对这一消息的反应取决于你对琼斯一家的了解有多少。事情可能是这样的:这个家庭的经济支柱洁西卡·琼斯(Jessica Jones)几个月前失业了,而且找不到工作,从那时起,她就只能付一部分房租,她多次向大楼管理员求情,甚至请你帮忙求情(虽然你出面了,但大楼管理员无动于衷)。在这种情况下,琼斯一家的遭遇虽然很可怜,但我们并不会感到意外。事实上,这就好像是一连串事件的必然结果一样,一场“难以避免”的悲剧终会发生。
——第12章 第401页
人们的判断有所不同,可能并不是因为他们的判断有实质性的差异,而是因为他们使用量表的方式不同。假设你对员工绩效进行评级,在0~6分的量表上,你评了4分,在你看来这是很不错的分数。但是,对于相同的量表,有人可能觉得3分就已经是不错的分数了。“量表”的描述模糊不清是一个普遍的问题。已有很多研究分析了“高度怀疑”“清晰而有说服力的证据”“出色的表现”“不太可能发生”等模糊表达所引起的沟通障碍。
——第15章 第482页
在一个理想化的世界里,评估绩效并不是一个判断工作,因为评估人借助客观事实就足以裁定员工工作表现的好坏。但问题在于,大多数现代组织与经济学鼻祖亚当·斯密(Adam Smith)提到的扣针厂没有什么共同之处。在亚当·斯密提到的扣针厂中,每个工人的产出都可以量化。但对一家公司的首席财务官或研发部主管来说,他们的产出是什么呢?当代知识工作者需要平衡多种工作目标,有时这些目标甚至是互相矛盾的。只关注其中一个目标,在做评估时就可能犯错,导致评估结果不准确,并带来负面的激励效果。
——第23章 第714页