自闭症是因为大脑预期出了问题？

预测性编码理论认为，当感官输入推翻大脑期望的时候，患有自闭症的人便会出现标志性的症状。

作者George Musser2018年4月2日1.2k

预测性编码理论认为，当感官输入推翻大脑期望的时候，患有自闭症的人便会出现标志性的症状。

绫屋纱月（Satsuki Ayaya）还记得她小时候和其他孩子们玩起来有多难，就好像有一道屏幕把她和别人隔开。有时她觉得迟钝，有时变得太敏感；有时声音消失了，有时又太尖锐。作为一个绝望地想努力理解自己的青春期少女，她开始记录自己的生活。“我开始把我的想法写进笔记本里，例如：我身上发生了什么？或者：我哪里出了错？或者：我是谁？我写啊，写啊，写满了40本笔记本。”她说。

如今43岁的绫屋对自己有了更好的理解：她在30岁出头时被诊断为自闭症。作为东京大学（University of Tokyo）科学史与科学哲学专业的博士生，她正在用自己的日记研究自闭症，从她始于青少年时期的陈述里产生假说，并启发实验。这种自我分析的研究方法被称为当事者研究（Tojisha-Kenkyu，英文：self-support research），始于20年前日本的残疾人权利运动。

How the brain’s expectations may fail people with autism

S atsuki Ayaya remembers finding it hard to play with other children when she was young, as if a screen separated her from them. Sometimes she felt numb, sometimes too sensitive; sometimes sounds were muted, sometimes too sharp. As a teenager, desperate to understand herself, she began keeping a journal.

在绫屋的叙述中，她的自闭症中存在着一大堆感知上的“失联”。举个例子，她能感觉到细枝末节，却不能将它们拼凑在一起，而常人则会把这些细节组合为“饿”。“对我来说总结出‘我饿’十分困难，”她说，“我感觉烦恼、我感觉悲伤、我感觉不对。这些信息是分离的，没有联系在一起。”她需要过好久才意识到自己是饿了，通常那时她已经感觉头晕了，直到别人提醒她吃东西，她这才去吃。

她还将自己言语上的困难归咎于她期望发出的声音和实际声音的不匹配。“她说话之后，自己的声音传回耳朵。她倾向于过分注意两者的区别，”她的合作者熊谷晋一郎（Shin-ichiro Kumagaya）说。熊谷是东京大学的儿科神经学家，他正在用 Tojisha-Kenkyu 研究自闭症。那种效应很像打电话时，听筒偶尔传回奇怪的回声，让你没法讲话。只不过对于绫屋来说，这样的情况几乎在每次说话时都会发生。

绫屋对她自身经历的详细记录帮助建立了一个全新的案例，它为自闭症的一个新兴理论提供了支撑。该理论将自闭症和感知研究中最具挑战的问题联系起来：大脑是如何分配注意力的？新奇的东西会吸引注意力，但是要有“新奇”，大脑需要先有一个的期望，并且违反这个期望。大脑还必须为这个期望分配一个确定度，因为在嘈杂的世界中，并不是所有违反期望的事件都有等同的新奇性：有时候这个事件的发生是有理由的，有时候它只是发生了而已。

大脑是如何做到那些的？科学家现在觉得最有可能是通过一个叫做元学习（学习的学习）的过程来实现的——学着去发现要学什么和不学什么。根据这个理论，元学习过程中的偏差解释了自闭症中的主要症状。这个理论本质上将自闭症重新描述成了一个感知病症，而不是一个社会病症；它将自闭症的标志性症状——与社会互动的困难——重新理解为对例行惯例的执着，而这种执着来源于自闭症大脑对感觉输入处理方式的与众不同。

我们面对新处境和新课题时，每个细节——图像上的每个亮点、人声中的每个音调变化——看上去都有意义。随着我们经验的积累，我们开始总结出规律，知道该期待什么。细节变得不那么显著；大脑将注意力转移到了更大的图景上。通过这种方式，大脑解决上一个挑战转而迎接下一个，让自己在无趣和挫败之间，保持最佳的表现。自闭症大脑可能代表了一条不同的学习曲线——它们更喜欢细节，却牺牲了更广的特征。

不像其它“大一统”理论试图解释自闭症所有的症状，这个理论是建立在对大脑功能更通用的描述上的，这种描述被称为预测性编码（predictive coding）。它假设所有的感知活动都是一种模型构建（model-building）和模型测试（testing）的实践——做出预测并看看是否实现。用预测性编码理论的话说，一个自闭症患者的大脑过分看重预期和实际感觉的差距。当路边的汽车鸣笛开过，普通的大脑可能只是将它作为城市听觉背景中的偶然波动；而对自闭症大脑来说，每一次鸣笛声都会让它有意识地注意。“这为自闭症的主要特征提供了非常简洁的解释。”伦敦大学学院（University College London）的神经科学家卡尔·弗里斯顿（Karl Friston）说。他曾经帮助建立了预测性编码理论应用于大脑的数学基础。

目前，这个模型还在一些重要的细节上模糊不清。“还有很多没拧紧的螺丝。”耶鲁大学的自闭症研究者卡塔日娜·哈瓦尔斯卡（Katarzyna Chawarska）说。一个简单的模型能否解释自闭症那么多不同的症状？有人质疑。但支持者认为正是这种多样性才支持一个统一的理论。理解一个基本的病因或许可以开发出同样通用的疗法。“如果预测真的是潜藏（在自闭症中）的核心障碍，那针对这个方向的干预有可能会在其它不同方面也产生积极影响。”麻省理工学院的计算神经科学家帕万·辛哈（Pawan Sinha）说。

“所有的体验都是受控的幻觉。你体验到的，从某种程度上说，是你期望体验的世界。”

····

预测性编码入门：

预测性编码的基本假设早在19世纪中期就由德国物理学家、心理学家赫尔曼·冯·亥姆霍兹（Hermann von Helmholtz），以及哲学家伊曼努尔·康德（Immanuel Kant）提出。他们两人都坚持认为我们的主观体验并不是外部现实的直接反映，而是一种建构。“所有的体验都是受控的幻觉，”爱丁堡大学（University of Edinburgh）的认知科学家安迪·克拉克（Andy Clark）说，“你体验到的，从某种程度上说，是你期望体验的世界。”

我们如此依赖期望，其中一个原因是我们的感知落后于现实。我们的大脑有意识地探测到输入需要80毫秒甚至更长；我们做的很多事情，包括在吉他上演奏十六分音符和在晃动的地铁上调整站姿，都发生在意识到之前，更加不会等输入被处理好之后再据此行动。因此大脑必须时刻预测下一刻会发生什么。它生成了一个描述世界的模型，在此基础上做出决定，然后根据感觉反馈更新模型。用概率论的话说，大脑是一个贝叶斯推断机，将先验预期与当前情景结合，来估计未来事件的概率。

预测和更新不需要——通常也没有——意识的参与，大脑在多个潜意识层次建立模型。将近20年前，研究者揭示了视觉皮层使用的多层次、预测性的工作方式（Rao & Ballard, 1999, Nat. Neurosci. ）。初级视觉皮层产生了对图像的小尺度特征的预测，比如边缘信息，然后试图通过完善预测来匹配视网膜的信号，但如果这局域化的微调不够，那它就把任务再甩给次级视觉皮层，后者再改进对更大尺度的几何特征的预期。随着层级向上，更广泛的变化被唤起，直到最高的层级：意识为止。（“预测性编码”一词是神经科学家从通讯工程中继承的，该术语在1950年代被建立，用来描述为减少所需要荷载的信息量，通讯网络只传递偏差而不是原始数据的想法。）

当大脑感知到偏差时，它要么更新模型，要么将偏差视为偶然的偏离。在第二种情况下，这个偏差不再会浮起到意识层面。“你希望少听些假新闻，”弗里斯顿说。或者，还有第三种选项：面对模型和世界的偏差，大脑也有可能去更新世界——譬如说，通过移动一条胳膊或者握紧一只手来使预测成真。“预测误差不仅仅可以通过更新模型实现，也可以通过实施动作来实现。” 英国苏塞克斯大学（University of Sussex）的神经科学家阿尼尔·塞斯（Anil Seth）说。通过这种方式，预测性编码不仅仅可以是感知系统的工作方式，也可以是运动控制系统的一部分。

不过大脑如何在三个选项中抉择呢？在预测性编码模型中，大脑通过分配给预测的精确度（precision）来决定。精确度就是大脑对输入信号的可变性的统计学预期（statistical variability），也就是大脑版本的误差限（error bar），或者说大脑对模型有多确定。高精确度（低可变性）的预测被违反时，大脑会重视：“这很重要，注意！”预测的低精确度（高可变性）让偏差不那么重要：“只是随机现象罢了，别理它。”

假设大脑总是把精确度设得比实际需要得高，那就像谷歌地图把一个人的位置不确定性表示得太低（把那个围绕定位点的蓝色圆圈画得太小），信号的随机变化就会让估计位置的跳动显得像真正的运动似的。这时你一定会看着地图思考：到底什么会让那个用户像这样跳来跳去？别人看到的是噪音，你却当成了信号。

自闭症患者中也发生了同样的错误计算。“可能自闭症谱系障碍（autism spectrum disorder）包含了一种无法将贝叶斯估计平衡好的障碍，或者说，至少没能用神经系统典型的方式来平衡。”克拉克说。

“人们相信精确度是由大脑中的神经调质编码的，那些可以改变大脑皮层响应增益的化学分子。”

····

高估的精确度

尽管预测性编码的理论可以追溯到至少150年前，但直到上世纪90年代它才成为神经科学理论的一部分，就像机器学习也是不久前才转化到计算机科学中那样。这并不是巧合，两个领域是相辅相成的。

弗里斯顿说，很多机器学习系统中，都有一个参数“学习速率”（learning rate），发挥着与预测精确度等同的作用。人工智能通过试错（trail and error）来学习；如果它误将小狗认成小猫，他就会修改内部的连接来使自己下一次做得更好。学习速率就决定了每次修改的程度，预测的精确度越高，所需修改的程度就越大。机器学习系统会调整自己的学习速率，使得它们在学习优化的同时避免过度拟合数据（只能认出遇到过的所有小猫小狗，却不能推广出分辨小猫和小狗的特征）。学习速率通常在起始时很高，随后随着时间下降。在预测性编码模型中，普通的大脑也会在开始时为预测分配较高的精确度，随后逐渐调低。调低的方式可能是通过化学信号分子，例如去甲肾上腺素（Yu & Dayan, 2005, Neuron）和乙酰胆碱（Moran et al. 2013, J Neurosci. ）。“人们相信精确度是由大脑中的神经调质编码的，那些可以改变大脑皮层响应增益（gain）的化学分子。”剑桥大学的丽贝卡·劳森（Rebecca Lawson）说。当需要开始新一轮学习时，大脑又会调高精确度。

在患有自闭症的人脑中，精确度却有跃向高水平或者卡在高水平的倾向——不论出于什么原因，他们的大脑倾向于过拟合。这个大致想法首先于2010年由哥伦比亚大学的神经科学家钱宁（Ning Qian）和理查德·利普金（Richard Lipkin）提出。受机器学习的启发，他们提出：自闭症大脑偏向于死记硬背，而不是找出规律和模式。“我们可以把自闭症患者面临的困境想成是任务和学习风格的不匹配。”钱宁说。

过了一年，另一个研究组提出了首个自闭症的贝叶斯模型（Pellicano & Burr, 2012, Trends Cogn Sci.），认为自闭症大脑不太信任自己的预测，从而相对过于依赖感觉输入。作为回应，另外两个研究组（其中一组包括了弗里斯顿和劳森）提出预测性编码可以作为这种预测-感觉不平衡的机制（Lawson, Rees & Friston, 2014, Front Human Neurosci.）。辛哈和同事则在2014年提出自闭症大脑并不是看轻预测，而是无法准确预测（Sinha et al, 2014, PNAS）。举个例子，当一个事件发生在另一个事件之后的频率比偶然偏高一点点时，自闭症患者可能是注意不到两个事件之间的联系的：对普通人来说至少在某种程度上可以预测的世界，却可以弄懵自闭症患者，使其觉得反复无常，或者按辛哈的话说，“魔幻”。

尽管这些研究组关注的是预测过程中的不同环节，他们描述的大致是同一原理：对一个自闭症患者，世界从来都让人惊奇。“这是在自闭症患者中很常见的描述，”熊谷说。“相对于拥有普通神经系统的人，他们有被频繁惊奇的倾向。”某种程度上，这种世界观辅助了某些学习。举个例子，研究显示自闭症人群在需要持续注意细节的任务中做得更好，比如大家来找茬（Joseph et al. 2009）和辨音（Bonnel et al. 2006）。同时，他们也更不容易看出视觉错觉（Mitchell et al. 2010）和多感觉错觉（Stevenson et al. 2014），这些错觉都源于感知系统的强烈预期。

然而持续处于觉知状态很累人，“你永远被自己的感觉系统奴役。”弗里斯顿这样描述。自闭症患者给日常事物分配太多注意力，这可以解释他们为何常常报告感官过载。一些患者说他们一直能意识到台灯的嗡嗡声和空调的隆隆声。研究还显示他们对重复刺激适应得更慢（Jamal & Sinha, 2017 SfN会议) 。

还有一个支持预测性编码模型的证据：自闭症患者对于本身考验预测的任务，例如接球，很不擅长。应付世界上最不可预测的东西——人类时，问题更被放大了。要预测一个人在特定情境下会做什么，你需要根据这个人或者类似这样的人在不同情况做过什么来作推测。这对任何人都很困难，但对自闭症患者尤其困难。“举个常见的例子，（自闭症患者）难以将情境A学习到的社会互动用到情境B。”利普金说。缺乏预测能力会导致严重的焦虑，这在自闭症谱系患者也是常见问题。自闭症的一些症状，例如对惯例的偏好，可以被理解为是一种应对焦虑的表现（Van de Cruys, 2014, Psych Rev. ）。“当你看到他们重复做一些动作时，大多数时候他们是在积极地逃避，远离自然世界的复杂性。”比利时鲁汶大学的Sander van de Cruys说。

除了为自闭症的一系列特征作出解释，预测性编码可能还能帮助我们理解自闭症和精神分裂症之间令人困惑的联系。这个理论，在某种程度上将精神分裂症看成自闭症的镜像。自闭症中，感觉信号推翻了脑中的模型；精神分裂症中，模型胜过了感官。

让我们看看精神分裂症独特的症状：听觉言语幻觉（幻听出说话声）。去年，耶鲁大学的菲利普·科利特（Philip Corlett）和同事通过诱导这种幻觉的弱化版本，研究了它的起源（Powers, Mathys & Corlett, 2017, Science）。他们招募了30位有幻听症状（汇报每天听到说话声，其中一半被诊断患精神病）和29位没有幻听症状的人，并且借鉴了俄罗斯生理学家伊万·巴甫洛夫的方法：在给被试展示棋盘图像的同时播放一个纯音，让他们预期两者会同时发生。随后研究者不再播放纯音。不幻听的被试很快发现了变化，但是倾向于幻听的被试则有更可能仍旧认为自己听见了纯音。研究组从预测性编码的角度理解了结果。“有听觉言语幻觉的人对实验中的两种刺激之间的关系有非常，非常严格的期望，以至于凭空构造了感觉，” 科利特说，“这让他们听到了实际上没有放给你听的声音。”

自闭症在某些方面和精神分裂症很像，科利特说。尽管听见说话声不算常见，自闭症谱系人士中产生妄想的比例却不低（妄想指的是被所有证据驳斥仍坚持的错误信念，例如自己被外星人或超自然力量操纵）。科利特认为这些妄想的产生，是因为感觉信息被赋予了太多信任，继而在脑中植入了一套新的信念，并固定了下来。

····

展望

预测性编码还没有解释自闭症中的一切。例如，是什么导致了自闭症大脑在获得经验后不及时调低预测精确度？是哪一环出了错：是预测、感觉输入、两者的比较还是利用两者差距更新模型的那一步？研究者们还在调查。还有，有哪些预测受到自闭症的影响，是所有预测，还是特定种类的预测？大脑的预测发生在不同层次和时间尺度上，自闭症患者在其中许多尺度上都做得不错。

一些研究者依然对疾病根源持怀疑态度，认为自闭症不一定是预测的问题。同样在耶鲁的心理学家詹姆斯·麦克帕特兰（James McPartland）表示，他依然偏爱更关注社交病征的解释。如果只用一个特征来描绘自闭症，那只能是社交困难，他说，研究者应该把关注点放在与他人互动的精神机制上，比如说面部识别。“我们对大脑处理面部信息的脑区是清楚的，”他说。他还质疑预测性编码模型弄错了因果：不是预测本身的问题导致了社交困难，而有可能反过来——大脑的许多预测能力可能来自社会接触。“社交信息会不会是预测性编码正常发育所需的关键信息？”他说。

预测性编码的研究者自己也承认，他们才刚刚开始在自闭症中测试自己的理论。“那些最早的论文，只是讲了些‘不过是那样’的故事，是事后分析——解释已经收集到的数据，”劳森说。但她和其他人也已经开展实验，试图更确切地探测预测机制。许多实验涉及了联想学习（associative-learning）任务，其中参与者需要总结出一系列图像和其它刺激之间的规律。时不时地，实验者会改变这个规律，改变的效果在一开始不容易察觉，随后实验者观察参与者多快能意识到规律的改变。

譬如说去年，劳森和她的同事就招募了20个自闭症患者和25个普通人。他们给参与者播放一个高音或一个低音，并展示一张脸或者一个房子的图片。然后要求参与者按下对应“房子”或“脸”的按钮。一开始，高音预示了之后有84%的可能性是房子，随后规律变成了低音对应84%的房子，最后，高低音分别对应两种图片50%的可能性。对照组（普通人）在期望被违反到一定程度，让他们认定规则已经改变时，会放慢速度；而患有自闭症的参与者则以更加均衡的速率按键，而且总体上按键比对照组慢。（Lawson, Mathys & Rees, 2017, Nat Neurosci. ）研究者总结认为对自闭症患者来说，每次偏离期望——比如说在高音之后脸更多的情况下，出现了高音-房子——都是规律改变的表现，而普通人则倾向于将头几次偏离视为偶然而不在意。

对大约一半的参与者，研究者还测量了瞳孔大小，因为瞳孔会因去甲肾上腺素（norepinephrine）而扩张。而去甲肾上腺素被认为是编码预测准确度（precision）的化学分子之一。对结果的理解不很直接，因为每个人都遵循略微不同的学习曲线，形成不同的期望。为了判断一个事件是否会违反期望，研究者只能给每个人的反应模式单独建模。最后的要点是自闭症患者的瞳孔似乎一直处于一触即发的状态。“不像我们会适应性地去为应该惊讶的东西而惊讶，自闭症患者似乎对所有东西都有轻微的惊讶。——所以说，这像是，嗯，这有点惊人，啊，那也有点惊人，这个也惊人，那个也惊人。”劳森说。

将预测性编码理论放在计算机模型，甚至机器人中实验也是一个有吸引力的方案。人工神经网络可以被当作数字小白鼠，来测试我们有关大脑功能的理论。研究者可以改变模型中的参数，看神经网络是否能重现自闭症、精神分裂症等各种精神疾病的症状。2012年，计算科学家谷淳（Jun Tani）和一个同事给机器人编程，来模拟精神分裂症（Yamashita & Tani, 2012, PLOS One）。通过在机器人控制器的计算中加入噪音，他们让它错误地计算期望和感觉输入之间的差距。这个伪造的误差——你可以说是机器人幻觉，如果愿意的话——沿着机器人的认知层级向上传播，并破坏了它操作的稳定性。“这个机器人表现出了紊乱的行为。”谷说，他现在是日本冲绳科学技术大学院大学（Okinawa Institute of Science and Technology）的教授。他和另一些人一起，正开始用这个方法将预测性编码推广到自闭症研究中。

如果预测性编码确实是解释自闭症的模型，它也可以为新的治疗方案给出方向。“不同的自闭症儿童可能会在预测链的不同部分表现出异常，”哈瓦尔斯卡说。这些不同可能对应一系列临床治疗。当她与自闭症孩子的家长会面时，她用“预测”的概念来帮助他们理解孩子对世界的体验，告诉他们：“你们的孩子只是非常难理解下一秒会发生什么罢了。这是他们必须经历的，特别是在他们特别特别小的时候。他们联系各个事件时的苦恼和困难只是他们不知道这些事件该被整合到哪里。”

即使不能提供别的治疗，预测性编码的想法也可以为一些年轻人提供他们渴求的启示——就像绫屋在她十几岁时渴求的那样。“我注意到了我和其他孩子的不同，然后我想，为什么会这样？”她回忆道。现在成年了，她说自己的焦虑已经减轻了，不仅仅因为她对自己的认识加深了，也因为她的同伴和朋友表现出的意识。通常，和她待在一起的人都知道她的情况。她说：“他们了解我。（因此）我可以更轻松地问出‘我觉得刚刚那个让我感到惊讶，不过对你来说那并不是，是吗？’”

翻译：顾金涛

编辑：EON

关于作者

George Musser -

自由撰稿人，科学作家和编辑，《科学美国人》和《Nautilus》的特约编辑。著有《The Complete Idiot’s Guide to String Theory》和《Spooky Action at a Distance》，为《科学》、《自然》、《Aeon》、《Nautilus》和《纽约时报》等媒体撰稿。