人类很喜欢讲故事,我们使用类比的故事来解释概念;自发地给模式增添意义与目的;同时也会觉得趣闻轶事特别动人。在推理时,我们常常使用经验法则——启发式,它能创造和讲述精彩的故事,其代价是敏感性和准确性。例如,我们会加倍指责自己讨厌的人、高度赞扬自己喜欢的人,在好人和坏人之间创造了明显的分界线;我们感觉逻辑规律代表着真实;我们将模糊信息视为支持预期的有利线索;我们不以逻辑结构和证据基础为标准,而是基于可信度来评价论点,就好像他们是故事一般。克服这些倾向是智慧进步的关键一步,因为现实一次又一次地表明,它没有必要遵从我们所讲述的故事。
在概率推理时,讲故事的倾向尤为容易产生误导。不过,科学家们也会讲“故事”,如果我们能够发现自己讲故事的倾向,并且尝试像科学家那样讲“故事”,那么,我们可能会让概率推理变得相对轻松一些。一些讲故事的倾向会误导人,但如果用假设思维来解读命题,考虑事件内在的可能性及其意义,可能有助于我们克服这些倾向。
理解我们的假设:合取谬误
假设思维的第一步是提出包含事件及其可能性的假设,并以此作为命题,而不是将命题视为故事。这能帮助我们不再犯合取谬误。合取谬误指认为两则事件同时发生比至少一则事件发生更可信、更有可能。一项著名研究发现了合取谬误,参与者们需要回答的问题如下:
琳达(Linda)31岁,单身,为人坦率,非常聪明。她主修哲学。作为一名学生,她非常关注与歧视、社会公正有关的话题,也参与过反核游行。
下列哪句话更有可能成立?
1.琳达是一名银行职员。
2.琳达是一名银行职员,积极参与女权运动。
相较于选项1,选项2多了一项额外事件(积极参与女权运动)。也就是说,它成立的可能性不会高于选项1。然而,大多数参与者还是选择了选项2。选项2更符合人物介绍,因此对很多人来说会更加可信。参与者似乎将“琳达是一名银行职员”视为了已知条件,然后再推测琳达更有可能是一名积极的女权主义者。明确地将两个选项定义为假设能让人们清楚地知道,“琳达是一名银行职员”也是假设的一部分,而非已知的一部分;她积极参与女权运动是其中一项假设的补充,不与另一假设互斥。如果按照假设来做判断,我们应该很容易注意到,即使一个额外的细节让整个故事听起来更可信了,但第二则假设成立的可能性也不会因此增加。
当一项古怪的言论增加了一些不那么古怪的部分,创造了一个更棒但也更不可能真实的故事时,合取谬误可能会更加鲜活地展现在我们面前。约瑟夫·史密斯(Joseph Smith),摩门教的创立者,宣称在纽约曼彻斯特的一座山里发现了刻有古埃及铭文的金盘,他精心描述了这次经历,说有一位天使出现在他身边,引导他找到了金盘。在19世纪20年代的纽约,当时正在经历第二次大觉醒(the Second Great Awakening)的宗教狂热,宣称有超自然现象并不稀奇,所以,加上天使的引导可能让史密斯的故事更加可信了。尤其是对于没那么古怪的言论,尽管缺少独立的证明,但因为我们往往用真实或虚假来记忆信息,而不会把信息记忆为不确定的,这意味着没那么古怪的言论可能会被视为理所当然。然而,如果我们把史密斯的故事看作一项假设,我们应该很容易发现,和只是发现了金盘相比,收到了天使的引领并发现了金盘是更不可能的事情。如果史密斯的话语都不足以让我们相信他发现了金盘,那么,他被天使引领并发现金盘就更不足以让人信服了。
考虑证据的特性:乌鸦悖论
在清楚定义了假设后,我们需要考虑假设的含义。也就是说,假设给出了怎样的预测。如果仔细考虑,这个过程的结果可能会与我们对证据的错误直觉相悖。以乌鸦悖论为例。这个悖论始于这样一个命题:所有乌鸦都是黑的。它说明,如果我们看到一只乌鸦,那么它应该是黑色的。因此,如果我们看到一只黑乌鸦,那么,乌鸦的黑色特征就为命题提供了支持证据。不仅如此,如果所有乌鸦是黑色的,那么,我们遇到的任何非黑色物体都不应该是乌鸦。这就引发了一个看似矛盾的结论:你周围每一个非黑色、非乌鸦的事物都为所有乌鸦都是黑的提供了证据。如果你的沙发不是黑色,那也为所有乌鸦都是黑色提供了证据。你能感受到讲故事的倾向了吗?*
*译者注:理解乌鸦悖论需要用到简单的逻辑学。原命题是:所有乌鸦都是黑的,即若为乌鸦则为黑色。原命题与逆否命题等价,即原命题成立则逆否命题也成立。逆否命题是:若为非黑色则为非乌鸦。看到黑乌鸦能支持原命题,看到非黑非乌鸦能支持逆否命题,而逆否命题和原命题等价,所以看到非黑非乌鸦也支持原命题。(乌鸦悖论的研究有很多,本文给的参考文献是一本书的一个章节[Fitelson, Branden, and James Hawthorne. “How Bayesian confirmation theory handles the paradox of the ravens.” The place of probability in science. Springer, Dordrecht, 2010. 247-275.],上述只能说是对悖论原始形式的理解了。)
非黑色的沙发支持命题“所有乌鸦都是黑的”,虽然这个想法非常反直觉,用假设思维思考这个问题能帮助我们解决乌鸦悖论。首先,让我们把“所有乌鸦都是黑的”和它的否定式看作两个相互对抗的假设:H1,所有乌鸦都是黑的;H2,并非所有乌鸦都是黑的。接下来,我们比较一下基于各假设给出的预测:(1)相较于H2,在H1成立时一只乌鸦更有可能是黑色的;(2)相较于H2,在H1成立时一个非黑色物体更有可能不是乌鸦。同样,黑乌鸦和非黑非乌鸦的物体能都支持“所有乌鸦都是黑的”这一命题,因为相较于否定式,该命题能更好地预测上述两种情况。
我怀疑,乌鸦悖论看似自相矛盾,是因为在判断命题时,我们常常以“命题能否作为一则好的故事来描述观察所得”作为判断标准,而没有把命题视为假设,并根据假设的预测力来做判断。这一点从我们偏好不可证伪的解释上可见一斑。卡尔·波普尔(Karl Popper)关于不可证伪的解释的一个主要例子是阿尔弗雷德·阿德勒(Alfred Adler)*的自卑感概念,阿德勒可以用自卑感对几乎任何行为给出令人信服的解释。例如,如果一名男子不顾生命危险去救一个溺水儿童,阿德勒可以解释为,男子的自卑感让他需要通过英勇行为展示优越感,因而会奋不顾身救人。自卑感的概念可以在事后被用来构建一些非常有说服力的解释,但它毫无预测力。自卑感和承认我们对男子的忧虑一无所知是等价的。这意味着,男子的行为和是否存在自卑感毫无关联,因此,他的行为无法支持自卑感的概念,自卑感也无法解释他的行为。
*译者注:阿尔弗雷德·阿德勒,奥地利精神病学家,“个体心理学”创始人,人本主义心理学先驱,《自卑与超越》是其代表作。“自卑感”起因于一个人感觉生活中任何方面都不完善、有缺陷。自卑感使人努力克服缺陷。阿德勒把这种努力叫做补偿。
学会使用证据吧:蒙提霍尔问题
没有哪一个统计谜题能像蒙提霍尔问题一样愚弄几乎所有人……甚至诺贝尔物理学奖得主也会系统性地回答错误,并且……他们很坚持自己的答案,还时刻准备着斥责提出正确答案的人。
——Massimo Piattelli-Palmarini, The Power of Logical Thinking
现在,我们已经见识了如何制定假设并从中得出预测,那么,让我们来考虑如何使用证据检验蒙提霍尔问题。该问题最早是由玛丽莲·沃斯·莎凡特(Marilyn vos Savant)1990年在她的旅游专栏中提出的。她收到了数以千计的来信,其中许多写信人都是博士,强烈反对沃斯·莎凡特的正确解答。后来,研究者对蒙提霍尔问题进行了探究,几乎绝大多数的参与者都正确回答了问题。在2010年的一项研究中,实验者重复模拟该问题,发现鸽子比本科生更快地学会了正确解答。蒙提霍尔问题的描述如下:
假设你正在参与一个游戏节目,你需要在三扇门中进行选择:其中一扇门后是一辆车,其他两扇门后都是山羊。你选择了一扇门,比如1号门,主持人知道门背后都是什么,他打开了另一扇门,比如3号门,结果是一只山羊。然后,他对你说:“你想选择2号门吗?”改变选择对你来说有好处吗?
如果你在考虑答案时依赖于主持人对于门后情况的了解,那么这个问题就变成了悖论。尽管蒙提霍尔问题欺骗了非常多的人,但如果根据假设、预测以及相应证据来思考,我们没有任何理由被骗。让我们从标准版本开始,你选择了1号门,主持人知道哪扇门后藏着车,打开了3号门。假设你选择了正确的门(1号门),基于这一假设,你预测主持人会打开哪扇门呢?要么是2号门,要么是3号门,概率是50:50。
然而,假设你选择了错误的门,车藏在2号门后,此时,你百分百会预测主持人打开3号门,因为他不能提前暴露了车。主持人打开了3号门,结果是山羊,该证据支持了车在2号门后的假设,2号门后的确也更有可能藏着车。然而,如果主持人不知道车藏在哪,那么,上述任何一则假设都不具有预测力,因为主持人总是随机打开了2扇门中的一扇。所以,证据不会更支持任何一项假设。的确,如果主持人不知道车在哪,那么2号门和3号门藏有车的可能性是相同的。通过将2个选项视为假设,并根据预测力来考虑证据,我们能够轻松解决蒙提霍尔问题。
不寻常的理论需要不寻常的证据
了解了假设思维的重要性之后,现在我们能用它来解释卡尔·萨根(Carl Sagan)常被人误解的格言:“不寻常的理论需要不寻常的证据”。虽然这句话包含了真理的一个重要内核,但我怀疑很多人解释不清什么让一个理论不寻常,也说不清什么让证据不寻常。不过,使用假设思维理解这两点非常容易。
从假设思维的角度,不寻常意味着基于已有知识某假设非常不可能成立,而对于不寻常的证据,(1)如果不寻常的假设不成立,那么该证据也不可能出现;(2)相较于不寻常假设的否定,假设本身能更好地预测证据。举个例子,声称“我是世界上最富有的人”显然极不可能为真,因为近80亿人中只有1个人是最富有的。为了支持我的说法,我可以掷20次骰子,指出其中极不可能出现的序列作为证据支持。然而,尽管我们承认,即使我的说法是假的(假设被否定),该证据(骰子的序列)极不可能出现,但即使我的说法是真的,也没法对骰子的序列给出更好的预测,因此,骰子对我的说法提供不了任何证据。
接下来,我可以从钱包里掏出一张100美元,以此作为我很有钱的证据。现在我们有切实的证据了,因为,相较于否定,“我是世界上最富有的人”的假设能更好地预测我轻而易举掏出100美元的举动。不过,如果我不是世界上最富有的人,这个证据也有一定可能性发生,因此也不足以支持我是世界上最富有的人。我们还可以查看福布斯亿万富翁年度排行榜,看看我的排名。如果我是世界上最富有的人,榜单应该能说明这一点。如果我不是世界上最富有的人,这个榜单就更不可能支持我的假设了。所以,福布斯榜单上我的表现可以作为不寻常的证据,如果我的主张为真,那该证据很有可能发生,相反的,如果我的主张为假,那该证据极不可能发生。
假设思维是理性的开始,也可能成为终结
作为爱讲故事的物种,虽然假设思维能帮助我们避免很多陷阱,但还有一些重要因素不利于我们的推理能力,只靠假设思维没法解决。例如,我们倾向于贬低自己不赞成的假设,被贬低的版本很容易被否定。我们对各种可能假设设置了毫无根据的限制,这常常导致错误的二分假设*。我们使用相同的证据调整和证明自己的假设,这使得证据变得自说自话,变为我们更偏爱的假设的表面装饰。我们还倾向于寻找、高估能支持自己更偏爱的假设的证据,却忽视、低估反对证据。使用假设思维能改善我们的推理,但我们仍然需要诚实地对待相互竞争的假设。假设思维不能消除这一需要,也不能改变证据范围本身的宽度。这些技能可能我们永远没法完全掌握。但,如果我们希望生活在一个更理性的世界,我们就要尽自己最大努力去理性思考,并鼓励其他人也这么做。
*译者注:我们一般看到的假设总被描述为H0和H1,即零假设(null hypothesis)和备择假设(alternative hypothesis),是对全集的一种二分。但二分的规则并非总是很有说服力。
作者:Benny Markovitch | 译者:Xhaiden
封面:Sudheesh Chandran | 校对:曹安洁
编辑:山鸡
原文:https://areomagazine.com/2020/08/21/thinking-with-hypotheses-better-reasoning-for-a-storytelling-species/
Leave a comment