我的办公室在哈佛边上,里面有几扇落地窗。去年秋天的一个凉夜,虚无弥漫在落地窗之外,而披紫霞的红日缓缓坠落。我坐着,烦闷地审视着自己的一堆鼠脑数据,忽然想到波士顿市中心几间冰冷的无窗房间——那是哈佛的高性能计算中心,里面存放着我48TB的数据。我在博士阶段研究了大鼠的视觉系统对周围运动的反应;而这数据里的13万亿个数字,都是我许多实验中的一部分。
如果把这些数据双倍行距地打印出来,它们能填满1160亿张纸;而我刚写完这些数据组成的故事,这故事用20来页纸就能讲完。事实证明,做实验是最简单的一步。去年,我用了整整一年的时间去看我的实验数据,想方设法地回答我的问题。一大块的实验数据与回答这些问题无关;这些无关的实验数据,就好像一张地图上未标明的那些细枝末节一样无关紧要。
虽然48TB的数据似乎很庞大,但这些数据只代表了很小的一块大脑。相比于神经科学的终极问题(大脑是如何工作的?),这些数据要回答的问题(当动物什么也看不见的时候,视觉皮层里的神经元会做什么吗?切断从其他脑区进入视觉皮层的信号会导致什么后果?)也同样十分渺小。
现代科学的本质让科学家们必须提出渺小而尖锐的问题。科学家们就好像餐厅里的食客:大家想试遍菜单上所有的菜,但最终总得选定那么一两道。所以科学家们不断收窄自己研究的领域,翻阅这个领域里发表过的成百上千篇研究,设计并进行自己的实验,再盼望自己的成果能推动这个领域的进步。问题在于,如果我们必须提出渺小的问题,我们如何才能看清浩瀚的大局呢?神经科学家们在对大脑构造与功能的理解上,已经取得了傲人的成绩:我们知道哪些脑区会对环境产生反应,哪些激活我们的感官,哪些让我们做出动作,体验情感。但我们仍不知道各个脑区之间如何沟通协作;我们不知道它们的互动如何影响我们的行为、感受与记忆。科技进步让我们轻而易举就能记录下繁多的数据——与此相比,我们在理解大脑的道路上似乎仍然举步维艰。
但现在,一些研究在狠下功夫地尝试给整个大脑“画地图”。其中一支叫“连接组研究”(connectomics)的队伍试图画出大脑中神经元连接的全貌。原则上来讲,一个完整的连接组中包含的信息,足够成为全面理解大脑的基石。我们将能看清每个脑区的样貌,明白它们如何支持整个大脑的运作,也能知道它们与各自、与环境应该是如何互动的。我们将能清楚地了解自己的大脑在各种假设情景下会如何反应[1]。
译者注:[1] 这样的想法也许还是过于乐观了。大脑中大部分的细胞都是胶质细胞,而近年来我们手中越来越多的实验证据表明,这些胶质细胞在大脑的各类功能中都扮演着极其重要的角色。在这个前提下,想要通过一个完整的神经元连接组来明白大脑的功能,就如同盲人摸象般不切实际。更不用提连接组所画出的神经元连接只是神经元众多沟通方式中的一种,有时候大面积的“非突触”连接也很重要,而连接组不能揭示这一部分的连接。
“我们如何能完全理解生成我们意识的这个器官?”这个问题在我脑中久不能散去。像大部分神经科学家一样,我既想要理解大脑,也明白这也许是个不可能的任务——这两个想法互相冲突。我很好奇其他人对此的看法,于是便找到了连接组研究的先驱之一,哈佛大学分子与细胞生物学教授,杰夫 · 李奇曼(Jeff Lichtman)。
李奇曼的实验室刚好和我的在同一条走廊上,所以不久前的一个午后,我就蹓跶到了他的办公室,向他打听最近连接组研究领域的新进展,顺便问他“我们能不能完全了解大脑”这个问题。他开口就说“不”——这个回答是不太妙,但我们接下来的对话使我大受启发,也解答了困扰我已久的那些问题:我该如何理解量级庞大的数据?科学于何而终,“个人见解”从何而始?人类有能力用如今得到的繁多数据编织出一套完整的理解吗?前路灰暗,我对人类理解的限度产生了怀疑,担心着未来会充满“大数据”和“小见解”。
李奇曼喜欢先做,后问。这位68岁的神经科学家给自己配备了一把武器——一部61束电子显微镜。用这部显微镜,李奇曼的团队能看见大脑组织里最细微的细节。大脑里神经元摩肩擦踵,让罐头里的沙丁鱼看起来都像是在“社交隔离”。要想明白显微镜拍到的图片和大脑的运作,图片中神经元的每一部分都需要在立体空间内做上标记——这样的结果就是一张连接图(wiring diagram);而连接组,即为一张整个大脑的连接图。
该怎么描述李奇曼用来画连接图的机器呢.……它就像一部高端的熟食切片器。这机器将脑组织切成30纳米厚的切片,然后将这些切片贴到传送带上。传送带通过硅片上方,进入李奇曼的电子显微镜中,让上百亿个电子轰击这些切片。这一系列程序的成果就是达到纳米精度的神经元图片,图中包含了它们的轴突、树突,和它们之间沟通所用到的突触。这些五彩斑斓的图片很容易引人入胜:藏在这神经连接的迷宫当中的,就是大脑产生记忆、思想、感官、情绪,以至于意识本身的机制。
完整的人脑连接组将会是一个技术里程碑。光是储存完整的小鼠大脑连接图就需要2EB的容量,那可是200万GB。相比之下,100TB的空间就能储存从古至今所有的书——这是小鼠大脑的0.005%。但李奇曼不怕,不论要多大的储存空间,他就是要把大脑的所有连接记录下来。
李奇曼宽敞的办公室装有落地窗,窗外是绿荫遮蔽的人行道和一幢老旧的圆形建筑。在神经科学尚未成为一个正式领域之前,这幢圆形建筑里存放着一个回旋加速器(cyclotron)。李奇曼一身深黑毛衣,映着他的满头银丝和橄榄色皮肤。当我问到一个完整的连接组是否会让我们完全理解大脑时,他不假思索地给出了自己的答案。我感觉在这个问题上,他自己大概已经思考了不久。
我们在桌边坐下后,李奇曼说:“我认为,我们需要重新审思‘理解’这个词。当你说‘我明白某某’的时候,你知道你是什么意思:某某有道理,你能将某某想得很清楚,你能用语言来解释某某的意思。但假如我问你:‘你理解纽约吗?’你大概会问我:‘啥意思?’它就有这么些复杂之处。如果你不理解纽约,这并不是因为你没有数据,而只是因为每时每刻都同时发生着太多事情——跟人脑一样。大脑中数不清的事情齐头并进,有不同类型的细胞、神经调质、遗传学成分,还有外界刺激。‘我现在理解大脑了’就跟‘我现在理解纽约了’一样毫无意义。”
“但我们理解大脑的特定方面,”我说,“难道不能就把它们拼凑起来,形成一套更完整的理解吗?”
“说到这个,我可能得转移到另一个问题上去:‘我们能描述大脑吗?’”李奇曼说,“关于大脑的物理性质还有很多的未解之谜。但我们能学着去慢慢描述这些性质。很多人觉得在科学界,‘描述’是一个贬义词,但哈勃望远镜干的就是‘描述’,基因组学干的就是‘描述’。它们忠实地描述如其所是;然后我们才能从中抽离出科学假说。”
“为什么神经科学家们那么不喜欢‘描述’呢?”
“生物学家们常常被自己欣赏的想法牵着鼻子走”,李奇曼说——他们想将世界“变成”他们喜欢的样子,而非尝试理解世界。“其实,我们应该先描述真实的世界,然后让自己的想法向它靠拢——这样做会更好,也更简单。”相比于验证设想,也许描述世界和产生设想更适合我们。若不这样,我们难免固步自封。“当下时代的海量信息,是‘理解’这个简单概念的大敌。”
“为什么这样说?”我问道。
“这么说吧,”李奇曼说,“语言,在本质上是一个线性过程,想法都是一个接着一个的。但如果我们要去尝试理解上亿个同时发生的事情,语言就不是我们所需的工具。这就像理解股票市场一样。想要赚钱,你并不需要理解经济学的基本原理。你要明白如何理解数据,通过数据来判断买什么和什么时候买。在股票市场里赚钱也许跟经济学没有任何关系,而跟数据与数据的利用息息相关。”
“可能人类大脑注定不能理解自己吧。”我补充道。
“机器不能输出比它自己更复杂的东西——这句话里边可能隐含着一种基本法则。” 李奇曼说,“一台车能做的最复杂的事比起造车的工程不值一提,而人脑所能做的比起它自身的工程渺小得多。这是非常不幸的事实。我们相信人类凭借无限的智能,可以理解世间万物。但要是我问你的狗能懂得多少事,你可能会说‘我的狗脑子很小,它知道啥。’可是人脑也不过是稍微大一点罢了。”他轻轻笑了,继续道,“既然如此,那为什么人有能力理解世间万物?”
既然如此,李奇曼会对连接组计划的宏图感到力不从心吗?他会把自己的工作看作西西弗式的徒劳吗?
“恰恰相反,”他回答说,“我认为这一刻我们已经离目标不远了。现在,我们正在研究的是人脑的一块皮质切片,从神经元的每个突触,到神经细胞之间的每个连接都可以被识别。不可思议。要是我说完全理解这块切片,我就是在瞎扯。但它是多么神奇的数据,特别美。从技术的角度说,你能看到细胞与细胞是怎么彼此连接的。这我以前可不敢想象。”
李奇曼强调自己工作不仅仅是获得大脑的全貌。“如果你想知道神经元和行为如何相互作用,你得有一个神经系统的连接图。”他说,“病理学也是如此。像是精神分裂症,很多无法治愈的疾病没有和大脑相关的生物标志物。它们可能和神经线路出错有关,但我们不知道问题出在哪。没有对这些疾病的医学模型,就没有病理学。所以,除了那些根本的大哉问(大脑是怎么运作的、意识是什么),我们可以寻找答案的是这些问题——精神失常是怎么产生的?这些精神病患者是哪里出了问题?为什么他们的大脑运作方式如此不同?可能这些问题是对人类最重要的。
花了一整天琢磨我的数据后,一天夜里我偶然翻到一则豪尔赫 · 路易斯 · 博尔赫斯写的短篇小说,它似乎抓住了绘制大脑地图的根本。这篇《论科学的精确性》(On Exactitude in Science)的主人公苏亚雷斯·米兰达(Suarez Miranda)[1] 记述了一个古老的帝国,该国凭借科学手段,绘图的技艺臻于完美。早期的地图是真实版图的粗糙微型,而随着每个版本不断地填充细节,新的地图一圈大过一圈。到最后,博尔赫斯写道,“绘图的技艺臻于完美,以至单单一个省的地图就占据了整整一个城市,而帝国的地图则是整整一个省。”即便如此,那里的人欲求更多细节。“随着时间流逝,这种不成比例的地图不再令人满足,于是各制图院打造了一幅帝国全图,它拥有帝国的尺寸并与之严格对应。” [2]
译者注:[1] 博尔赫斯的笔名,与阿根廷作家、记者、翻译家卡萨雷斯(Adolfo Bioy Casares)合著作品时使用。
[2] 本段引用为陈东飚所译原文。“在那个帝国里,绘图的技艺臻于完美,以至单单一个省的地图就占据了整整一个城市,而帝国的地图则是整整一个省。随着时间流逝,这种不成比例的地图不再令人满足,于是各制图院打造了一幅帝国全图,它拥有帝国的尺寸并与之严格对应。除了制图之学的痴迷者以外,后来的世代都认为那种大而无当的地图毫无用处,便不无亵渎地将它弃给了烈日与严冬的摧残。在西方的沙漠里还留存着地图破碎的断片,为走兽与乞丐所栖居;整个国土中再无那些地理科目的其他残余。”
博尔赫斯这则故事让我想起李奇曼的观点,他认为人的大脑太复杂,我们无法通俗地理解它。描述它可能是个更好的目标。但这种观点还是让我不大舒服。描述大脑就像讲故事,即便是讲大脑中的信息处理,也必须排除一些细节。描述者得知道哪些细节重要,哪些无关紧要,以此传达有用的信息。而要判断无关紧要的细节,首先要足够理解你所描述的对象。我这精密的大脑,它有可能理解一颗老鼠的大脑中的2EB 吗?
奋斗路上,人类有一把关键武器。机器学习已是绘制大脑地图的福音,使用它的自我强化系统(self-reinforcing),我们有希望翻盘。我们曾以为一些认知任务是机器不能学会的——物体识别,还有文字转写和翻译、玩围棋、下象棋。而深度学习算法(也被称为深度神经网络,DNN)则在过去十年让机器得以完成这些任务。DNN 是一类数学模型,将一系列简单公式串联,模拟神经元的真实状态。这些算法的诞生灵感来自哺乳动物大脑皮层的生理学和解剖学。但限于上世纪60年代收集的数据,它们是对真实大脑的粗略模拟。这也已经超出人们对机器能耐的想象了。
李奇曼在绘制大脑地图上的进步,得归功于机器智能。李奇曼的团队与谷歌合作,用深度神经网络为百万余图像标注。这些图像是通过点子显微镜在大脑切片上收集而来,每张只是一组像素。人眼能轻松辨识图像中像素团与团之间的界限(一个神经元的体细胞、轴突、树突,以及大脑中其他物质),努力些还能指出哪部分是在两张图像中都出现的。有了这种标记和重构的能力,连接组研究中庞杂的数据才变得可理解。此前,数据块的标记要由许多本科生和公民科学家手动完成。经图像识别训练的深度神经网络现在能自动完成这种苦差事,将通常耗费几个月甚至几年的工作缩短到数小时或数天内。最近,谷歌就将一些人脑皮层切片中的每个神经元、轴突、树突(还有每个突触连接点)都辨识出来了。李奇曼表示,“太神奇了。”
科学家尚未明白的是这些微小的解剖学特征是如何对应神经元的动态活动的(它们生成的电活动规律)——连接组数据不能揭示这一点。很多人由此批评连接组计划。就拿线虫的例子来说,几十年前,神经科学家就已知道秀丽隐杆线虫(C. elegans)的完整神经线路图,但实际上我们现在还没完全搞明白这个仅有300个神经元的生物。学界至今仍在研究它的大脑连接和行为之间的对应关系。
在生物学领域,结构和功能不可分割,那么神经科学家或许有天也将明白脑活动所对应的特定神经元形态是什么。或许人为铺设线路的大脑能通过某处的巨型服务器运行,模拟类似人类的心智也不是妄想。下一步设想就是一个乌托邦,要么是我们通过数字化保存我们的心智来达到永生,要么机器凭借人的大脑线路拥有超级智能进而排绝人类。李奇曼没有怀揣科幻小说里那种狂想,但他承认,一个能按人脑连接图依葫芦画瓢的网络听起来挺吓人。“那就像深度学习,我们将对它如何运作一无所知。”他接着说,“然后,这机器突然不再需要人类了。”
但即便是再强大的深度神经网络也不能保证对人脑的全面理解。这个想法跃进我的脑海时,是去年我正在葡萄牙里斯本,参加一个计算与系统神经会议(Computational and Systems Neuroscience conference)。会议里都是写神经科学有名有姓的人。会议设置在酒店舞厅,我听了阿拉什 · 阿夫纳兹(Arash Afraz)的演讲,他40岁上下,是马里兰贝塞斯达国家心理健康研究所的一名神经科学家。他解释道,深度神经网络中的神经元模型以及其连接方式之于真的神经元,就像火柴人之于真人一样粗糙。
阿夫纳兹是个矮个子,脸上一圈黑黑的马蹄状胡子,秃脑袋上只有一条孤零零的细马尾辫挂着,让人想起马修·麦康纳(Matthew McConaughey)在电影《真实侦探》中扮演的角色。大西洋的海浪结实地撞上下面的码头,阿夫纳兹向观众问到我们是否记得雷内·马格里特(René Magritte)那副烟斗,底部题名《这不是一个烟斗》(Ceci n’est pas une pipe)。他指出,深度神经网络中的模型神经元不是真实的神经元,它们之间的联系也不是真实的。他展示了一副经典的示意图,图中展现了基于猴子相关实验的、大脑区域与区域之间的连接——上边是一堆杂乱无章的盒子,标注的名字分别是V1、V2、LIP、MT、HC,各自有不同的颜色,还有连接盒子的黑线。这些黑线似乎毫无规律地连接盒子与盒子,连接方式地组合格外多。比起真实大脑中令人眼花缭乱的一堆堆连接,深度神经网络总是简单地以链的方式连接不同脑区,连接一“层”到下一“层”。试试看这要怎么解释给严格的解剖学家吧,阿夫纳兹一边说着这话一边切出一张表情包,一只震惊脸的小猩猩兼解剖学家。“我试过了,可别问我结果怎样。”他说。
为什么深度神经网络比起真实的大脑如此简单,我也有这个疑问。难道我们就不能忠实地复刻真实大脑的结构,来优化模型的性能吗?我给牛津大学的计算神经学家安德鲁 · 萨克森(Andrew Saxe)打了个电话,想搞清楚这个问题。萨克森同意,如果让模型更像真实世界的神经结构,信息会很充分。“这一直是个脑科学领域难题:我们压根不知道到,细节重要到哪个层级。”他在Skype那头说。
那我们是怎么做这些选择的?“通常是直觉引领着我们的选择,但我们的直觉千差万别。”萨克森说,“不少神经科学家有个强烈的直觉,他们认为单个神经元的细节多到了繁复的地步:反向传播的动作电位,一个个彼此独立的树突,还有各种各样的神经通路。所以一个神经元就是一个网络。深度神经网络里简化后的数学模型,“用这样修正后的线性单位来概括一切,显然要流失掉很多信息。”
2020年刚开始时,我一直在想自己从李奇曼、阿夫纳兹和萨克森那学到了什么,也一直在思考神经科学的使命——理解大脑。我发现自己总回顾我的本科生时代,那时我觉得科学就是了解事物的唯一客观手段。(我以前还觉得科学家都极度理性、工作,把真理作为至高的追求——我是太天真了。)
现在我能看到,科学这一事业的关键是处理事实时怎么理解事实。实验开始前,我们就已经架着解释的镜头去看真相了。人类的怪癖和缺点千奇百怪,我们先选择要做什么样的实验、以及如何实验。数据收集后,科学家需要搞明白数据的意义、阐释它们。科学搜集事物的真相,这没错,但要人来描述它、把握它的含义。个人的视角在这些过程里起到筛选原生数据的作用,而个人又囿于语言与时代文化中。
看来李奇曼那2EB的大脑切片,还有我这48TB的小鼠大脑数据,都不适合人来处理。至少,人的智能尚未达到能把这些数据组织成一副全景图,以此解释人脑的运作。我在办公室里坐着,凝视着落日把没有一丁点云彩的天空沁成赤红色。一个多彩、可能机械化的未来在我脑中显现。我们(根据大脑皮层的解剖结构)造的机器没法捕捉人脑的本质,但要从庞杂数据中寻找规律不难。当这些机器倚赖更多皮层解剖结构、进一步加强,他们或许有一天能给我们解释这些规律,解决大脑连接的谜题,为我们展示一个人能理解的图景。落地窗外,麻雀仍在兴奋地啁啾——它们的一天尚未结束。
翻译:汉那、阿莫東森
原文:An Existential Crisis in Neuroscience