每次克里斯蒂纳`勒加雷(Cristine Legare)在心理学研究者中发表演讲时,她都会让大家投一次票。“有多少人认为自己是‘西方的人种心理学家’?”她会这样问道。这个问题并不受欢迎。“他们的反应是:‘什么?’”来自德克萨斯大学奥斯汀分校的发展心理学家勒加雷说,“这个问题完全没有引起共鸣。”
心理学家们的这种疑惑正是勒加雷想要讨论的问题。几十年来,绝大多数心理学研究的对象是生活在美国及其他富裕的西方国家的人。勒加雷在内的批评者认为,因为研究的目标人群过于有限,心理学研究者无意间描述了一个有偏向性的人类心智图景。
“并不是说研究美国中产阶级人口没有意思或没有用处。但问题是他们不愿意声称他们只是在研究这一特定人群。”勒加雷说。“他们想要宣称人类足够相似,因此研究哪个人群都一样。”通常,心理学论文甚至不会提及研究对象的国籍,社会经济地位或其他基本的人口统计数据。
不过另外的一些研究表明,很多情况下参与研究的人群对研究结果有微妙而深刻的影响,而勒加雷并不是第一个提出担忧的研究者。关于心理学研究对象多元化的讨论在2010年左右达到了顶峰。当时一篇广为流传的论文指出,心理学这门学科过度依赖所谓的WEIRD(西方[western]、受过教育[educated]、工业化[industrialized]、富裕[rich]和民主[democratic])社会中进行的研究。这种依赖的后果给行为科学带来了危机。在那时看来,心理学领域的重大改革似乎近在眼前。
然而,十年过去后,许多心理学家发现并没有什么变化发生。关于研究者应该如何在研究中考虑国籍、阶级、性别、性取向、种族和其他身份特征,这些心理学家们提出了许多问题,并且表达了对缺少实质性改革的不满。
“我们都喜欢谈论这个话题,但是没有人想要实际上做出改变。”肯塔基大学的心理学家威尔·杰尔维(Will Gervais)说道。
在心理学最初的几十年间,心理学研究者大多在在自己身上做实验。但早在二十世纪初,他们已经开始寻求更多的研究样本。大多数时候,他们选择身边最容易取得的样本:当地的学龄儿童,还有自己就职的大学里的学生。考虑到招募人员参与实验既困难又昂贵,这种就近招募的方法一直沿用到了今天。而现在这种方法更是得到了Mechanical Turk等一类平台的支持。作为亚马逊旗下的的一个平台,Mechanical Turk(又称MTurk)专门为自由从业者寻找低收入的杂活。
无论来源,或者说至少在大学校园中,这些样本都倾向于富裕的白人群体。同时这些样本大多来自工业化的西方社会。即使如此,在发表研究时,研究者们对被试的社会身份经常一笔带过。这是体现他们研究结果的普遍性的一种手段。“他们已经习惯于以忽视人类数据样本的个人及社会身份为代价,来强调他们在实验中作为被试的身份。”历史学家库尔特·丹齐格(Kurt Danziger)在他的《建构被试者》一书中写道。
不过研究者也有充分的理由不去强调种族和国籍之类的身份特征。曾经有很长一段时间,科学家们一直试图在没有任何实际数据的情况下断定群体之间根深蒂固的差异,以此来支持种族主义以及仇外情绪的论点。因此,尤其在第二次世界大战之后,学界掀起一股相反的潮流,强调人类体验的共通性。
大多数时间,其他的身份特征也并不重要。伊利诺伊大学心理学家丹尼尔·西蒙斯(Daniel Simons)说:“我们所做的很多事情在人与人之间是一致的。”西蒙斯曾发表过关于心理学研究的普遍性问题的文章。
西蒙斯指出,早期心理学研究通常关注人类的基本行为。这些行为不太可能受到文化或环境的影响。随着时间的推移,心理学开始研究更复杂的社会行为,并且,用西蒙斯的话来说,“假设相同的一系列普遍原则仍然适用。”今天,很多心理学研究的确深入调查文化或个人经历如何影响研究结果——实际上,文化和环境可能正是问题的核心。在很多问题上,西蒙斯说:“我们就是不知道。”
考虑到我们知识的不足,一些心理学家多年来一直在发出警告。上世纪90年代末,心理学家斯坦利·苏(Stanley Sue)曾表示这个学科太少关注非白人族群的经历。2008年的一项研究发现,六份主流心理学期刊上的研究很少调查西方人以外的人群。因此该研究讽刺地建议,一家顶级期刊应该把自己改名为“美国本科心理学导论学生的人格与社会心理学期刊”。
这个问题在2010年得到了广泛关注,当时英属哥伦比亚大学的约瑟夫•亨里奇(Joseph Henrich)和他的两名同事收集了数十项研究的证据,证明在所谓的“WEIRD”社会中长大的人,其行为往往与世界其他地方的人非常不同。举例来说,一些在工业化国家的人身上百试不爽的视错觉,根本欺骗不了在农村或非工业化社会中长大的人。在与陌生人分享金钱的游戏中,美国的本科学生和玻利维亚亚马逊地区的提斯曼人会表现得截然不同。
“如果一个行为科学的数据库中被试者全部是提斯曼人,研究人员可能会非常担心它的普遍性。”亨利克和他的同事们写道。他们不禁发问:如果一个数据库全部由美国人或欧洲人组成,为什么研究者们就没有那么担心呢?
这篇论文引发了无数的回应、会议和提倡改革的呼声。它被媒体广泛报道,在学术文献中被引用了几千次。但现在是哈佛大学教授的亨里奇说,到目前为止,对于心理学研究这一门学科来说,这篇论文实际上影响甚微。“在某种程度上,我觉得人们对样本多样性有了更高的热情。”亨里奇说,“但如果你真正去观察数据,你会发现过去几年的新数据并没有体现出样本多样性的任何变化。”
一些研究支持他的看法。最近发表在著名期刊《心理科学》(Psychological Science)上的一篇论文分析发现,在那些甚至注明了参与者国籍的研究中,94%的研究只使用了来自“WEIRD”社会的样本。而超过90%的研究没有提供任何有关参与者社会经济地位数据。
在过去的10年中,心理学发生了翻天覆地的变化——只不过不完全是亨里奇和其他人预想的那样。研究者们开始意识到,在重新进行该领域中许多重大研究时,他们无法重复之前的结果。拙劣的实验实践和糟糕的统计习惯让数据中的随机波动看起来像是显著而有意义的结果,很大程度上是这次可重复性危机的祸因。但一些心理学家认为,另一个很少被提及的原因是初始的研究样本缺乏多样性:一个研究可能在特定人群中得到验证,但在其他人群中根本不适用。
“我一直认为它们是同时发生的”,康奈尔大学的心理学家小尼尔·刘易斯(Neil Lewis, Jr.)这样描述样本多样性不足和可重复性危机。
然而,批评人士说,当心理学家们投入大量精力来重复旧的研究并改革他们的实验标准时,他们更少关注样本多样性的缺失。“我们缺乏足够的激励举措来让研究人员弄清楚:他们的发现是否真的适用于所有地方和所有人群。”刘易斯说道。
相反,一些具有改革思想的心理学家提出,这个领域似乎继续倾向于快速、华丽的研究,而非对研究设计的认真改进。在许多机构中,“如果想在它的奖励机制中获得成功,我会发表二十篇蹩脚的MTurk研究论文,而不是一篇大型跨文化研究。”肯塔基大学的心理学家杰尔维说。“我不认为我们能学到二十倍的东西,但我的简历会更好看。”
一些研究人员说,这个领域中还存在一种无形的压力,促使他们从研究中得出普遍结论。北卡罗莱纳大学格林斯伯勒分校的心理学家贾丝明·德赫苏斯(Jasmine DeJesus)说:“我们是被鼓励去提出大胆而冒失的主张的,去发表这些看起来具有开创性的论文。”
雪上加霜的是,自可重复性危机开始以来,心理学领域更加期望研究人员在研究中使用更大的样本。新标准因提高了社会科学的严谨性而受到广泛赞扬,但它们可能会给研究少数人群的研究人员带来额外负担,因为通常招募这些人更困难,成本也更高。
这些挑战合在一起会非常难以克服。杜克大学心理学家萨拉·盖瑟(Sarah Gaither)研究身份认同,包括人们认识种族类别的方式。她的大部分研究都关注混血儿童。他们通常被归入一个种族类别,或者干脆被完全排除在研究之外。但是盖瑟的研究表明,混血儿童的经历推翻了一些关于人们如何形成差异概念的假设。
她指出,大部分关于种族分类的心理学研究中,白人占了被试样本的大多数。“当你观察非白人时,你会发现他们看待这些多种族面孔的方式与白人非常不同。”盖瑟说,“如果没有一个多样化的样本,你永远不会知道这种不同,因为我们的大多数论文甚至没有正确报告被试的种族和民族信息。”
盖瑟说她进入心理学领域是因为她想研究被忽略的少数群体。然而,由于没有终身教职,她觉得有必要经常发表论文,这迫使她花更多时间在以网上招募的白人为主要样本的研究上。
而就算她对被忽略的少数群体进行了研究,这些研究吸引到的注意力也更少,盖瑟补充道,“如果你研究少数群体,很自然地,你得到的引用数量不可能像研究更主流问题的人那么多。”她的经验表明,这是因为研究人员能够基于白人为主的样本快速得出结论,但当样本更加多样化时,他们就不太可能这么做。这样的研究最终发表在一份专注于少数群体的专业期刊上,得到的引用可能更少。“如果你不研究黑人,你就没有理由引用一篇研究黑人被试者的论文。”盖瑟说。
一些改革已经被提上日程。心理科学加速器(Psychological Science Accelerator)是一项新的全球行动。这个行动的目标是选择特定的实验,并把这些实验的结论放在世界各地的几十种文化背景下进行测试。根据达尔米特·辛格·查乌拉(Dalmeet Singh Chawla)去年11月在《Undark》杂志上的报道,该行动最近发布了它的第一项研究。该研究使用了来自41个国家的1.1万多名被试,复制了2008年关于人类如何判断陌生人面孔的一项重要实验。
其他一些较为温和的解决方案重点关注发表科学研究的学术期刊的改革。伊利诺伊大学的西蒙斯建议,心理学论文应该添加一个全新的普遍性约束(Constraints on Generality, COG)声明,要求研究人员准确定义他们的研究适用于哪些人群。其他心理学家敦促学术期刊制定明确的政策,支持采用少数群体和非“WIERD”样本的研究,甚至可能是通过设定配额来确保研究能描绘更广泛的人类群体。
该领域最具影响力机构的一些领导人已经听到了这些批评。“我们必须接受样本更多样化的需要,”埃默里大学心理学家帕特里夏·鲍尔(Patricia Bauer)说。他从2020年一月起开始担任《心理科学》(Psychological Science)的主编,任期四年。
不过鲍尔也强调,改变需要时间。她指出,最近有人呼吁2020年该期刊中50%的论文都要涉及非“WIERD”被试群体。“我不认为我能达到那个目标。”她告诉《Undark》杂志。“我觉得50%太高了,但考虑到这一观点,我会采取一些行动。”
在接受Undark采访时,还未就职的鲍尔分享了关于这些行动的想法。这其中包括任命一个更加多样化的编辑委员会,以及像她在首次编者按里提及的一样强调在非“WIERD”人群中进行研究的重要性,还有可能要求论文作者更有力地证明为什么他们要选择这些样本。然而,关于强制性的普遍性约束声明或其他固定的政策,她有些犹豫:“我不喜欢强制性要求。”她说。
鲍尔强调,研究人员必须平衡不同的需求。她引用了自己最近对美国南部一个社区教育成果的研究,该社区黑人、拉美裔和白人的数量相对平均。将所有人集中在一起,鲍尔拥有足够大的样本来进行各种分析,从而能够从统计噪声中识别出有意义的结果。但是,如果她试图按种族或社会经济地位来划分人口,那么每个群体的数量都达不到统计分析的要求。
“我有时会告诉我的学生,如果一些信息可能会让评审者要求你按更细的分组分析你的数据,那就不要把它写进论文中,因为我们的研究(在统计学上)不是那样进行的。”鲍尔说。
对于那些要求更多关注样本多样性的人来说,这些建议不太可能赢得他们的支持。他们希望更多的信息披露,或者更大的样本规模,而不是简单地忽略信息。“这很令人沮丧。”当我把鲍尔对学生的建议告诉亨里奇时,他说道。
对于一些渴望改革的心理学家来说,这一领域的领导者的反应还不够快。德克萨斯大学的勒加雷说,学界还有一个默认的假设,即最合理的研究——或者说最能指向普遍真理的研究——是那些使用说英语的受试者的研究。
“在这个问题上,确实存在一些令人不安而羞愧的民族中心主义。”勒加雷说,“我们每个人都应该对此感到更多的羞愧。”
翻译:乔恩
校对:曹安洁