如果我们魔法般地缩小,然后放进到人的大脑中,当她在思考时,我们就会看到所有的“泵”、“活塞”、“齿轮”及“杠杆”工作,我们将能够完整地描述它们在机械方面的运作,从而完整描述大脑的思想进程。但是,这种描述并没有提及任何思想!它只不过是对泵、活塞、杠杆进行描述!
——莱布尼兹(1646—1716)
各种领域如何表达自己的原则呢?物理学家使用类似光子、电子、夸克、量子波函数、相关性、节约能源这样的术语;而天文学家使用恒星、星系、哈勃转移和黑洞等术语;热力学家使用熵、第一定律、第二定律、卡诺循环等;生物学家则使用发育、个体发育、DNA和酶。这些术语实际上是每一个专业的代号!一个领域的原则实际上是该领域结构和行为因素交织在一起的集合。
——皮特·丹宁,美国计算机协会前主席,
写于"Great Principles of Computing"
重要的是,我们要建立处于正确水平的大脑模型。这是当然的,真正科学的模型都是这样的。虽然理论上化学是基于物理学的,而且可以完全来自物理,但这在实践中却难以驾驭,行不通的。因此,化学应该使用它自己的规则和模式。理论上,同样可以从物理上推出热力学定律,但这个过程太曲折了。一旦我们拥有足够数量可以称为气体的粒子,而不是说这是一堆粒子,那么解每个粒子相互作用的方程就将变得不切实际,而热力学定律此时将变得非常有效。构成气体的单个分子相互作用是复杂和不可预测的,但由亿万分子组成的气体本身却有许多可预见的属性。
同样,根植于化学的生物学,也拥有自己的模型。尽管人们在理解一个高水平系统前必须理解水平较低的那个,但往往也没有必要用低级别的系统动力学的复杂性来表达更高水平的效果。例如,我们可以通过操控动物胎儿的DNA来改变动物的某些特性,而不必了解所有DNA的生化机制,更不用说在DNA分子内原子间的相互作用了。
通常情况下,水平较低反而会更复杂。例如一个胰岛细胞具有非常复杂的各种生化功能,(其中大部分适用于所有的人类细胞,而有一些适用于所有生物细胞)。然而,在胰岛素和消化酶的水平上用数百万细胞来效仿胰腺的运作过程,虽然并不简单,但其难度大大小于效仿单一胰岛细胞的运作过程。
同样的问题也适用于大脑的建模和认知,包括从突触反应的物理现象到神经簇的信息转换。在那些我们已经成功开发出详细模型的大脑区域中,我们发现了类似于胰腺中细胞的现象。该模型是复杂的,但仍比单个细胞,甚至是比单个突触的数学描述还简单。正如我们前面讨论的,这些特定区域建模所需的计算能力大大低于理论上研究所有细胞和突触的计算能力。
加州理工学院的吉尔斯·劳伦指出:“在大多数情况下,一个系统的集体行为是很难由其组成部分推断出来的……神经科学是一门系统科学,在这个系统中,需要一阶和局部说明图式,但这还不够。”随着我们对每一级的描述和建模的不断提炼,大脑逆向工程将实现自上而下和自底而上的反复改良。
受到传感和扫描工具技术未成熟的限制,直到最近,神经系统仍然由过于简单的模型来描述。这使很多观察人员怀疑我们的思维过程是否有能力理解自己。皮特·克雷默写道:“如果想法简单得足以让我们明白,那我们就把它想得太简单了。”50之前,我引用了道格拉斯·霍夫斯塔特将大脑与长颈鹿对比的说法,长颈鹿的大脑结构和人脑没有多大不同,但显然它没有理解自身工作原理的能力。但是,最近在各个层次上设计详细模型的成功——从像突触一样的神经组件到像小脑这样大的神经区域——都表明建立精确的大脑数学模型,然后用计算模拟这些模型将是一个挑战,然而一旦数学模型可用,这一任务就会变得可行。虽然神经系统科学建模历史悠久,但是直到最近,它才变得全面、详尽,从而能基于此进行模拟大脑的实验。
子神经型号:突触和棘
在美国心理学协会2002年的年会上,纽约大学的心理学家和神经学家约瑟夫·勒杜克斯发言说:
如果是记忆塑造了真实的我们,并且记忆是大脑的一项功能,那么突触(神经元通过它相互沟通,同时它也是记忆编码的物理结构)就是最基本的单位……突触在大脑组织过程中的地位非常低,但我认为它们非常重要……它们自身的总和是大脑子系统,其中每一个都有自己的记忆形式以及子系统之间复杂的相互作用。如果没有突触可塑性(突触连接强度可调节的特性),这些系统学习所必需的改变就将不可能发生。51
虽然早期的模型认为神经元是传输信息的主要单位,但是现在已经转向强调其亚细胞成分。例如,计算神经科学家安东尼·贝尔认为:
分子和生物物理过程控制引入峰电位的神经敏感性(包括突触的效率和突触后响应性),产生峰电位的神经元兴奋性,以及它产生的峰电位模式和新突触形成可能性(动态重新布线),使之只列出四种最明显的亚神经一级的干扰。此外,类似本地电场和一氧化氮跨膜扩散这样的跨神经元活动也有影响,还有相关的神经元放电和为细胞供给能量(血流量),而后者直接与神经活动有关。这个清单还可以继续。我相信,任何人认真研究神经调节、离子通道或突触机制,都不能将神经元的水平作为一个单独的计算水平,哪怕发现它是一个有用的描述水平。52
事实上,真实的大脑突触比迈克洛-匹兹所描绘的经典神经网络模型要复杂得多。突触的反应受到一系列因素的影响,包括多种离子势能(电压)和神经递质所控制的多通道活动和神经调节。虽然过去的20年已经有了巨大的发展,但是,在发展中,数学公式总是优先于神经元,树突和突触的行为以及脉冲系列的信息表现形式(脉冲被神经元激活)。最近,皮特·达扬和拉里·阿尔伯特编写现有的非线性微分方程的概要,其中描述了通过成千上万的实验所得到的知识。53关于神经元体和突触的生物物理学,以及神经元正反馈网络的行为,这些都存在着经得起论证的模型,就像在视网膜、视神经以及其他各种神经元中发现的那样。
对神经突触工作机制的关注起源于海勃的开创性工作。海勃提出了这个问题:短期(也称为“正活动的”)记忆是如何工作的?与短期记忆相关联的大脑区域是前额叶皮层,虽然我们已经意识到,短期信息保留的不同形式已经在大多数其他已被仔细研究过的神经回路中得到证实。
海勃的大部分工作集中在改变突触的状态(以此来加强或者抑制对于信号的接收)和更有争议的反射神经回路(其中包括在连续回路内的神经放电)上。54海勃提出的另一个理论是,神经元细胞自身进行状态改变,也就是说,记忆功能在细胞躯体(身体)内。实验证据支持了这些模型的可能性。经典海勃突触记忆和反射记忆在记录信息可用之前需要一段时间延迟。实验表明,至少在大脑的某些区域,神经反应太快以致不能使用标准的学习模式,只能通过诱发型学习来完成。55
海勃没有直接预想到的另一种可能性是神经元自身连接的实时变化。最近的扫描结果表明了树突峰电位和新突触可以迅速增长,因此必须重视这一机制。实验还表明,在突触水平上的大量丰富的学习超越了简单海勃模型。突触可以很快改变其状态,但由于受到不断刺激,或缺少刺激,又或是其他原因,它们又开始缓慢地衰减。56
虽然现代模式比海勃设计的简单模型要复杂得多,但他的直觉大部分已经被证明是正确的。除海勃的突触可塑性外,目前的模型还包括提供调节功能的全局进程。例如,通过突触缩放使突触势能避免变成零(否则就无法通过乘法的方法增加)或变得过高,从而能主导网络。在体外实验中,我们已经在上文所描述的神经网络、海马体及脊髓神经中发现了突触缩放,57其他机制对于整体峰电位周期和突触势能的分布是很敏感的。仿真证实了最近发现的机制具有提高学习和稳定网络的能力。
在认识突触过程中,最令人激动的新发展是,突触的拓扑和它们之间的连接在不断变化。通过一个新颖的扫描系统,我们第一次看到了突触连接的迅速变化。这个系统需要一个转基因动物,其神经元可以发出荧光绿。该系统可以刻画活的神经组织,并且具有足够高的分辨率以捕获树突(中间的连接)以及棘:萌发自树突的微小突起,它是突触的初级形式。
神经生物学家卡瑞尔·斯沃博达和他在长岛冷泉港实验室的同事将该扫描系统用于老鼠,从分析胡须信息来调查分析神经网络,这项研究描述了神经学习的迷人景象。树突在不断地长出新棘。其中大多数只持续了一两天,但有时棘也会保持稳定。“我们相信看到的高周转量会在神经可塑性上发挥重要作用,其中萌发的棘伸向临近的神经元以探查不同的突触前搭档,”斯沃博达如是说,“如果给定的连接是有利的,也就是能反映一种可取的大脑重新布线,那么这些突触将是稳定的并且会更加永久化。但这些突触大多不是朝着正确的方向,而且它们是可伸缩的。”58
另一个已经观察到的一致现象是,如果某一特定的刺激重复发生,神经反应会随时间而减少。这种适应性给予新的刺激模式最高的优先级。纽约大学医学院的神经生物学家甘文彪做了相似的工作,他对成年小鼠视觉皮层神经棘的研究表明,这种棘机制可以容纳长期记忆。“假设10岁的孩子使用1000条连接存储一条信息。当他80岁时,不管情况如何变化,这些连接的1/4将依然存在。这就是为什么你还记得你童年的经历。甘还解释说,”我们的想法是,当你学习或记忆时,你实际上并不需要许多新的突触,也不需要去除旧的那些。你只需要修改先前存在的突触的强度来进行短期的学习和记忆。但是,很可能是产生或消除一些突触,以实现长期记忆。59
之所以记忆可以保持完整(即使3/4的连接已经消失),是因为该编码方法的特性类似于全息图。在全息图中,存储的信息广泛地散布在整个区域内。如果你销毁了全息图的3/4,尽管只剩1/4,但是整个图像仍将保持不变。红木神经科学研究所的神经科学家彭蒂·卡内尔瓦的研究支持了这一观点:记忆动态地分布在神经元的整个区域。这就解释了为什么老年人的记忆可以延续下去,只是表现得越来越模糊,因为它们的分辨率已经削弱。
神经模式
研究人员还发现,特定的神经元执行专门的识别任务。鸡的脑干实验检测到声音到达而两耳时会有一段特殊的延迟。60不同神经元的时间延迟也会不同。尽管这些神经元工作时总有许多复杂的非常规行为,但它们实际完成的内容还是很容易描述的,并且也很容易复制。美国加州大学圣地亚哥神经学家斯科特·马克格如是说:“最近的神经生物学实验的结果显示了精确同步在学习和记忆中的重要作用。”61
电子神经元。加利福尼亚大学在圣地亚哥的研究所最近进行了一项关于非线性科学的实验,该实验揭示了模仿生物神经元所需的电子势能。神经元(生物或其他的)是混沌计算的最好例证。每个神经元的行为在本质上都是不可预知的。当整个神经元网络接收输入(来自外面的世界或是其他神经细胞网络)时,一上来信号似乎都很狂乱而且很随机。随着时间推移,通常是几分之一秒左右,神经元间混沌的相互作用慢慢消逝,神经放电开始呈现出稳定的格局。这一模式显示了神经网络的“决策”。如果神经网络正在执行模式识别任务(这些任务构成了人类大脑的活动),那么这一突发模式就代表了正确的识别结果。
因此,圣地亚哥的研究人员提出的问题是:电子神经元能否在生物神经元旁边与之携手共舞?他们把人工神经元和生物神经元放在一个网络中,这一生物和非生物混合的网络按同样的方式执行(混乱的相互作用之后进入一个稳定的突发模式),而其结果和全生物网络是一样的。从本质上说,生物神经元接受了它们的电子同行。这表明这些神经元的混沌数学模型相当准确。
大脑可塑性
1861年法国神经外科医生保罗·布洛卡将大脑的受伤或外科手术影响的大脑区域与某一失去的技能联系起来,如精细的动作技能或语言能力。一个多世纪以来,科学家认为这些区域是完成具体任务的硬件。虽然某些脑区域往往用于特定类型的技能,但我们现在明白,遇到如中风一样的伤害时,大脑分配的任务可以做出一些转变。在1965年的经典研究中,胡贝尔和维塞尔展示了在神经系统受到如中风一样的损坏时,大脑广泛而深远的识别功能仍然可以进行。62
此外,在某一给定区域,连接和突触的详细布置是该区域使用程度的直接产物。由于大脑扫描已达到足够高的分辨率,已经足以检测树突棘的增长和新突触的形成,我们可以看到大脑生长并一步步地看着想法的产生(见图4-3)。这使笛卡尔的名言“我思故我在”的意义又有了新的色彩。
图 4-3
在旧金山的加利福尼亚大学,迈克尔·莫山尼奇和他的同事进行了一项猴子的实验,他们将食物放置在一个猴子必须巧妙活动一个手指才能获得的位置。对这一活动之前和之后的脑部扫描显示,在大脑中负责控制该活动的区域中,连接和突触急剧增长。
阿拉巴马大学的爱德华·塔布研究了脑皮层区域对手指触觉输入的反应。比较不太懂音乐的人和老练的乐器演奏者,可以发现专门控制右手手指的大脑区域并没有什么差异,但控制左手手指的区域却有着很大的不同。
如果绘制出基于触摸分析的脑组织量的图像,我们会发现控制音乐家左手的脑组织量非常大。尽管与从小就练习弦乐器的音乐家相比,差异会更大,但“即使你是从40岁才开始练习小提琴,”塔布说,“你仍然可以获得脑重组。”63
类似的发现来自对一款软件程序的评价,该软件由罗格斯大学的保罗·塔莱和史蒂夫·米勒制作,称为Fast ForWord(快速朗读),旨在帮助有阅读障碍的学生。该程序为儿童朗读文章,并减缓断音的发声,如"b"和"P",这是由于很多诵读困难的学生在听到快速发音时,很难察觉这些声音。而通过这种形式的修改,这一软件很好地帮助了这些儿童对朗读的学习。斯坦福大学的约翰·加布里埃利发现,利用fMRI,与语言处理有关的大脑左侧前额叶区域确实有所增长,尤其是这些诵读困难的学生,在使用该软件时增长更多。塔莱说:“你通过获得的输入来创造你的大脑。”
甚至不需要通过物理活动表达一个人的思想就可以驱使大脑重新布线。哈佛大学的阿尔瓦罗·帕斯夸尔-利昂博士对进行简单钢琴练习前后的志愿者的大脑进行了扫描,志愿者大脑运动皮质的变化是他们练习的直接结果。然后他开始了另一组实验,在这一组中,他让志愿者仅仅想象一些钢琴的练习而没有任何实际的肌肉运动。而该组志愿者的运动皮层却产生了与第一组相同的显著变化。64
最近关于视觉空间关系的fMRI研究发现,神经元之间的连接在一个单一的学习会话期间会迅速变化。研究人员发现,这种变化发生在后顶叶皮层细胞(在所谓的“背”通路中,包含位置和视觉刺激的空间属性的信息)和后颞叶皮层(在“腹”通路中,其中包含了不同层次抽象的认知不变特征)。65很明显,那种变化率与学习速率成正比。66
加州大学圣地亚哥分校的研究人员给出了关于短期记忆和长期记忆形成差异的重要观点。利用高分辨率扫描手段,科学家可以清楚地看到海马体(与形式长期记忆有关的大脑区域)的神经突触细胞的化学变化。67他们发现,细胞第一次受到刺激时,肌动蛋白(一种影响神经系统的化学物质)会向与神经突触连接的细胞移动。这也刺激了相邻细胞的肌动蛋白远离被激活的细胞。这些变化仅仅会持续几分钟,然而,如果得到了充分的反复刺激,那就会有更显著和更持久的变化发生。
“短期变化仅仅是神经细胞之间相互联系的正常方式中的一种。”主要作者迈克尔·克里斯克说:
要使神经元产生长期变化,必须在这一小时内四次刺激神经元。神经突触会分裂并且会有新的神经突触形成,进而产生一个长期的变化,并可能持续一生。类比于人的记忆,当你看到或听到一件事,它可能会停留在脑海中几分钟。而如果它不重要,就会逐渐在我们脑海中消失,10分钟后我们就会忘记它。但如果我们再次听到或看到它,并且这件事在接下来的一个小时内一直持续发生,你可能就会记住它更久一些。而事情如果发生了很多次,你就会一生都记住。一旦你拿一个轴突形成两个新的连接,这些连接就将会非常稳定,没有理由相信它们会消失。这就是那种将会持续一生的改变。
“这就像一堂钢琴课”,作者之一的生物学教授夕纪子·高达说,“如果你将一首音乐弹了一遍又一遍,它将扎根于你的记忆中。”同样,神经科学家威尔和辛格发表在《科学》杂志的一篇文章说到,在视觉皮层中他们找到了新的神经元连接动态生成的证据,就像唐纳德·海勃描述的"What fires together wires together"。68
另外一个关于记忆形成的观点来自Cell(细胞学)上的一篇研究报告。研究人员发现,CPEB69蛋白质实际上是通过改变它们的突触形状来记录存储信息的。最让人吃惊的是,当CPEB处于朊粒态时才能执行存储功能。
“我们暂时粗略地了解了记忆的工作原理,但是对于这种存储设备,我们至今没有一个清新的概念。”合著者、怀特海德生物工程研究院的负责人苏珊·林德基斯特说,“这项研究揭示了这一存储设备可能的存在形式,但令人惊讶的是,我们发现这一过程还涉及朊粒的活动。这说明朊粒不仅具有奇异的特点,而且可能参与生物体基本的处理中。”就像我在第3章讲到的,人类工程师研究发现朊粒具有产生电子存储功能的强大能力。
脑扫描研究也揭示了抑制不需要的和不良的记忆的机制,这一发现使西格蒙德·弗洛伊德大为高兴。70利用fMRI,斯坦福大学的科学家要求被研究人员试图去忘记他们早期已经记忆的信息。在此活动期间,与抑制记忆相关的额叶皮层区域表现得相当活跃,而海马体这一通常与记忆相关的区域却相对不太活跃。这些研究结果“确定了一个积极遗忘进程的存在,并为引导动机性遗忘的研究建立了一个神经生物学模型,”斯坦福大学心理学教授约翰·加布里埃利和他的同事这样写道。加布里埃利还评论说:“最大的新闻是,我们已经证实了人类的大脑如何阻止不需要的记忆,存在这样一种机制,并且它具有生物学基础。它使你不再去考虑这样的可能性,即大脑里不存在任何事物可以抑制记忆——这其实一直是被曲解的谬论。”
除了使神经元之间产生新的连接,大脑也可以通过神经干细胞产生新的神经元,其中神经干细胞通过复制来保持自身的供应。在复制的过程中,一些神经干细胞变成了“神经前体”细胞,它们轮流发展成为两类被称作星形胶质细胞和少突胶质细胞的支持细胞。这些细胞进一步演变成为特定类型的神经元。
然而,这些分化不会发生,除非神经干细胞从它们在脑室中的原始位置离开。只有大约一半的神经细胞成功完成该过程,这类似于妊娠和早期幼儿阶段,大脑只有一部分生长中的神经元存活下来。科学家们希望能够通过直接向目标区域注射神经干细胞从而绕过神经迁移过程,或者创造药物以促进神经形成的进程(产生新神经细胞)来修复由于疾病或损伤而对大脑造成的伤害。71
一项由美国索尔科生物学研究所的遗传学研究人员弗雷德·戛格、坎贝尔曼和亨利埃特·范·普拉赫进行的实验表明,神经形成实际上是受我们的生活经历刺激的。将小鼠从无菌、乏味的笼子里移动到一个有刺激性的笼子里,它们海马区的分裂细胞大约会增加一倍。72
大脑区域建模
人类大脑最可能是由大量相对较小的分布式系统组成,这些系统按照胚胎学排列成复杂的集合,并由之后增加的串行符号系统进行部分(也只是部分)控制。但是那些做了底层大部分必需工作的子符号系统,由于其本身的性质,阻碍了大脑的所有其他部分理解它们的工作原理。这本身就可以帮助我们解释,为什么人们做了如此多的事情,却仍然只掌握了一些关于如何完成这些事的不完整想法。
——马文·明斯基和西摩·帕勃73
常识不是一件简单的事。相反,它是一个包含着来之不易的实践经验的庞大集合体——包括众多生活教训、异常事件、处理方式、个人倾向、还有平衡和检验。
——马文·明斯基
除了关于每个大脑区域组织可塑性的新见解,研究人员还在迅速创建大脑特定区域的详细模型。这些神经形态模型和模拟仿真只是稍稍滞后于它们所基于的信息可用性。由对神经扫描得到的神经元和神经元间的连接数据的研究到创建有效模型和可行的模拟仿真,这一转变的快速成功淹没了经常提及的关于理解我们自己大脑内在能力的怀疑论。
对基于非线性对非线性和突触对突触的人脑功能进行建模并不是必要的。在单个神经元和连接(例如,小脑)中,对存储记忆和技能的区域模拟确实要使用详细的细胞模型。然而,即使在这些区域,模拟所需的计算量也比所有神经元组件所暗含的要小得多。我们将在接下来描述的细胞模拟中看到这一真实性。
虽然在大脑的上亿个连接中,每个神经元的亚神经元部分都有着大量的详细的复杂性和非线性,以及混乱的半随机布线图,但在过去20年中,在数学建模方面还是取得了重大进展,例如自适应非线性系统。通常没有必要去保存树突的枝的确切形状和每个神经元连接的精确“波浪线”。我们可以通过对其进行适当水平上的动态分析来理解大脑广阔区域的运作原则。
我们在大脑区域的建模和模拟上已经取得了重大成功。对这些模拟进行测试,并将得到的数据与对真实人脑进行心理物理学实验所获得的数据进行比较,由此取得了令人瞩目的成果。考虑到我们当前相对粗糙的扫描检测技术和传感工具,在建模上取得的成功(如以下正在进行的工作),证实了从大量采集来的数据中提取正确观点的能力。接下来介绍的是大脑区域成功建模中的几个例子,所有工作都还在进展中。
神经形态模型:小脑
我在《The Age of Spiritual Machines》中发现了这样一个问题:一个10岁小孩怎样成功抓住一个高飞球?74一个孩子能看到的全部信息只是球的位置轨迹。要真正推断球在三维空间的路径,需要解复杂的微分方程组,还需要解附加的方程来预测球的未来方向,以及解更多的方程来将结果转化为球员自己的运动。一个这么小的外场手是如何在没有电脑帮助,也没有练习过解微分方程的情况下,在如此短的时间内完成所有这些呢?显然,他并没有意识地去解方程,但是他的大脑是如何解决这一问题的呢?
自从《The Age of Spiritual Machines》出版以来,我们对这一技能形成的基本过程的理解有了很大的发展。正如我所假设的,这个问题并不是通过建立三维运动的心理模型来解决。相反,问题可以这样解决,直接将观察到的球的移动翻译成运动者的适当移动,并改变其胳膊和腿的位置。罗切斯特大学的亚历山大·博基特和华盛顿大学的劳伦斯·斯奈德描述了数学的“基础功能”能代表这种直接转化,即直接将视野中感知到的运动转化为所需的肌肉运动。75此外,对于最近取得进展的小脑功能模型的分析,证明了我们小脑的神经回路确实具有学习能力,然后通过运用基础功能实现这些感觉运动的转换。当我们采用逐步逼近的学习过程去执行一个感觉运动的任务时,如抓住高飞球,我们就是在训练小脑的突触学习适当的基础功能。小脑通过这些基础功能可以执行两种类型的转换:判断一个理想的结果是否可行(为“逆向内部模型”)和从可能的动作集中预测一个结果(“前进内部模式”)。托马斯·波吉奥指出,基本功能的概念描述了大脑的学习过程,这一点超越了电机控制。76
大脑区域有一块区域,其颜色由灰色和白色组成,有棒球大小,豆型,这一区域被命名为小脑,位于脑干之上,它包括超过大脑一半以上的神经元。小脑提供了很多方面的关键功能,包括感觉运动协调、平衡,控制运动的功能,并有能力预测行动的结果(我们自己以及其他动物和人)。77尽管其功能多种多样,但是它的突触和细胞组织极其一致,只涉及几种类型的神经元细胞,看上去它似乎只是在完成一种特定类型的计算。78
尽管小脑的信息处理方式是同样的,但是其广泛的职能可以通过从大脑皮层(通过脑干细胞核,然后通过小脑的苔状纤维细胞)和其他区域(特别是大脑的“下橄榄核”区域,通过小脑的攀缘纤维细胞)接收的各种输入来进行理解。小脑负责理解我们感觉输入的时间和顺序,同时控制我们身体的运动。
小脑也是说明大脑如此大的容量是怎样大大超过了它的紧凑基因组的一个例子(见图4-4)。大多数基因组致力于大脑对于各种神经细胞(包括树突、棘和突触)的详细结构的描述以及这些结构如何应对刺激和变化。相对的,几乎没有基因代码负责实际的“布线”。在小脑中,基本的布线方法被重复数十亿次。显然,没有基因组提供有关每个小脑结构每一次重复的具体信息,相反,它们提供了具体的某些约束,对这些结构怎样重复(正如基因组没有指定其他器官细胞的确切位置一样)制定了一些限制。
图 4-4
小脑的产出输送到大约20万α运动神经元中,从而确定最终的信号来控制身体中大约600块肌肉组织。输入到α运动神经元的物质不会直接指定每个肌肉组织运动,而是进行更紧凑地编制,因此很难明确理解这一过程。指定肌肉运动的最终信号由更低级的神经系统决定,特别是脑干和脊髓。79有趣的是,这个组织在章鱼的身体里使用到了极限,中枢神经系统向它的每个触角发出高层指令(如“抓住这个物体,把它拿得近一些”),将信号传递给每个触角内的外围神经系统来执行该任务。80
最近几年,我们对小脑的三种主要神经类型有了很多认识。称作“攀缘纤维”的神经元提供信号来训练小脑。小脑的大多数输出结果都来自蒲金耶氏细胞(是以约翰内斯·蒲金耶氏的名字命名的,他于1837年发现了这种细胞),每一个蒲金耶氏细胞可以接收大约20万的输入(突触),而普通的神经元一般只能接收10万左右。大部分的输入都来自于颗粒细胞,这种细胞是最小的神经元,大约每平方毫米600万个(见图4-5)。在研究小孩学习写字时小脑作用的试验中,研究人员发现蒲金耶氏细胞决定着移动的序列,每一个细胞影响一个具体的移动动作。81很明显,小脑需要从视觉皮质不断获得视觉感知。研究人员将小脑细胞的结构和实验观察关联起来发现,在写字时,移动轨迹的曲率和移动的速度成反比。就是说,当你写字时,画直线的移动速度明显比画曲线时快得多。
图 4-5
复杂细胞研究和动物研究为我们提供了关于生理学和小脑突触组织,82输入和输出的数据解码,以及执行转变的详细描述。基于多项研究得到的数据,哈维尔·麦迪纳、迈克尔·马克和他在得克萨斯州医学院的同事们为小脑设计了一种自底向上的详细模拟。83它具有一万个模拟神经元和三万个神经突触,并且它包括了小脑中所有重要类型的细胞。84这些细胞和神经突触的连接由一台计算机控制,这台电脑依据一些限制和规则进行“布线”,从而模拟小脑区域的功能。这一点与遗传序列控制真实人脑布线的随机(有限制条件的随机)方法类似。85而想把得州大学的小脑模拟扩展成一个更大规模的模型也并不困难。
得州大学的研究者们为他们的神经模拟提供了重要的研究经验,并将实验结果与很多关于真实人类的相似实验进行了对比。在人类研究中,我们进行了这样的实验:在发出音响的同时对被研究人员的眼睑吹一阵空气,这样人的眼睑就会关闭。如果结合空气和音响这两种因素进行100~200次实验,这名参与者就会学到这种关联,而之后仅仅是听到音响,就会闭上眼睛。而如果之后又采用只有声响而不再对眼睛吹气,那么该参与者将最终分离这两种刺激(并会“结束”这种响应),所以学习是双向的。之后经过调整各种参数,使模拟能够合理匹配人和动物小脑调节的实验结果。有趣的是,研究人员发现,如果他们模拟小脑损伤(删除部分模拟小脑网络),结果和使兔子小脑真实损伤实验得到的结果也很相似。86
由于这一大块大脑区域的一致性以及与之相关的神经元间布线的简单性,其输入输出的转变与其他区域相比要容易理解一些,尽管这些关联方程式还需要继续精炼改进,但这一自下而上的模拟确实令人印象深刻。
另一个例子:瓦特的听觉区域模型
我相信创造一个类人脑智能的方法就是建造一个实时工作模拟系统,足够详细和准确地表达每个需要执行的计算的本质,并能对该实时系统进行度量以核实其操作的正确性。之所以要求实时系统是因为我们不得不去处理那些不方便的、复杂的真实世界的输入,而这些输入我们以前并没有考虑如何去表达。这一模型一定要在足够的分辨率下运行,这样才能与实时系统相匹配,所以我们对于每一阶段所代表的信息都建立了正确的直觉知识。根据密德的说法,87这一模型有必要从实时系统中已经理解得很好的系统边缘(例如传感器)开始,之后进入理解得少一些的区域……通过这种方法,这一模型可以从根本上促进我们对这一系统的理解,而不是简单地反映已具备的理解水平。在这种极其复杂的情况下,也许唯一能够理解实时系统的实际方式就是建立一个工作模型,随着不断发展,在传感器内部建立我们新的有效能力——形象化系统的复杂性。这种做法可以称作大脑逆向工程……请注意,我不是在倡导盲目地复制这些我们不明白其目的的结构,就像故事中的那样,伊卡洛斯天真地建造了羽毛和翅膀,以为这样就可以飞翔。相反,我主张尊重已经是在较低水平被很好理解和认识的复杂性和丰富性,只有这样我们才能向更高的水平进发。
——劳埃德·瓦特88
关于大脑区域神经形态建模的一个重要例子就是劳埃德·瓦特和他的同事们开发的人类听觉处理系统的一个关键部分的综合复制(见图4-6)。89它基于特定神经类型的神经生物学研究以及神经元连接信息。该模型与人类听觉有着许多相同的属性,可以进行声音来源定位和声音识别,它有5条听觉信息处理的平行通路,包括神经处理每一阶段信息的中间表示法。瓦特按照实时计算机的操作实验他的模型,虽然这项工作仍在进行当中,但它已经阐明了神经生物学模型和大脑连接数据转化为仿真的可行性。这一软件不是像已经描述过的小脑模型那样基于复制单个神经元和连接,它是基于每一区域所执行的转换。
图 4-6
瓦特的软件已经能够匹配人类的听觉和辨音能力小实验中所显露出的错综复杂的关系。瓦特使用这一模型作为语音识别系统的预处理(前端),已经证实可以从背景音中识别出一位发言者(“鸡尾酒会效应”)。这是一个了不起的壮举,这将实现人类有能力做到而在自动语音识别系统中却一直未实现的功能。90
就像人的听力,瓦特的耳蜗模型被赋予了光谱灵敏度(我们在某个固定的频率范围能够听得更好)、时间回应(我们对于声音的传送时间很敏感,它使我们感知到声音来源的空间位置)、掩蔽、非线性频率相关的振幅压缩(允许更大的动态范围,即同时听到响亮和安静的声音)、增益控制(扩增),以及其他微妙的特征。它获得的成果可以直接由生物和心理物理数据给出验证。
该模型的下一个部分是耳蜗神经核,耶鲁大学神经科学和神经生物学教授戈登·谢福德91将其描述为“大脑内理解得最好的区域之一”。92瓦特的人工耳蜗神经核仿真模型正是基于杨戈的工作,杨戈详细描述了“这些并不可少的细胞类型,旨在探测频谱能量,宽带瞬变和光谱波道的微调,提高暂时包围在光谱波道、光谱边缘和缺口内的灵敏度,以及所有在尖峰神经编码的有限动态范围内再次调整而获取的最优灵敏度”。93
瓦特模型还捕捉到了许多其他的细节,例如由中间上橄榄体细胞计算出来的两耳时间差(lTD)94。除此之外,它还能描绘由侧面上橄榄体细胞计算出的双耳位准差(ILD),以及下丘细胞产生的规范化和调整方法。95
视觉系统
我们在视觉信息编码上已经取得了足够的进步,实验性的视网膜移植已经取得了很大进展并可以利用外科手术移植到病人的眼部。97但是由于视觉系统的相对复杂性,我们对于视觉系统的认识还远远不如对于听觉区域的认识深刻。我们有初步的两个视觉区域(分别称为VI和MT)执行转换的模型,尽管它们不在视觉神经层。另外还有其他的36个视觉区域,我们需要在很高的解析度下或者是利用精确的传感器才能够扫描这些更深层的区域,以便查明它们各自的功能。
麻省理工学院的托马斯·博吉奥是视觉处理认知的先驱,他将自己的工作分为两种:识别和分类。98根据他的解释,前者相对来说比较容易理解,我们已经设计出能够成功识别人脸的实验版和商业版系统。99这些系统已经成为安全系统的一部分,用来控制职员的出入的门禁,另外,在提款机中也有应用。分类,即辨别如人和汽车之间或狗和猫之间的不同之处,这是一个比这些更复杂的工作,尽管现在已经取得了一些进步,但还是远远不够的。100
视觉识别系统的早期阶段(根据进化论)很大程度上是一种前馈系统(没有反馈),这个系统能够检测到日益复杂的事物特征。博吉奥和马克西米兰·瑞斯胡博尔写道:“猕猴的后颞叶下皮质的一个单一神经元可能会变成……具有成千上万复杂形状的字典。”有证据表明视觉识别在识别过程中(包括MEG研究)使用了前馈系统,并显示人类视觉系统检测物体时需要大约150毫秒。这和颞叶下皮质的功能检测细胞的潜在因素相匹配,所以在早期的决策阶段,反馈作用的时间看上去并没有发挥很大的作用。
最近的实验已经开始采用分等级的方法,由此检测的特征就可以在系统的后期阶段进行分析。101从对猕猴的研究得知,经过训练的猕猴,其颞叶下皮质的神经元好像对物体的复杂特征会做出回应。尽管大部分的神经细胞只是对所看到的物体的特殊景象有反应,还有一些则是不管看到什么景象都有反应。其他关于猕猴视觉系统的调查还包括研究一些细胞的特殊类型、连通性模式,以及对于信息流的高水平描述。102
很多的文献资料表明,在很多更复杂的模式识别任务中,我称为“假设和检验”的方法是很有效的。例如,首先猜测观察到的事物究竟是个什么东西,然后再检验你的假设和你的实际观察有多大的匹配度。103我们经常更关心的是假设,而不是事后的检测,这也就解释了为什么人们常常宁愿相信他们假设看见和听见的事物而不是实际存在的事物。当然,“假设和检验”在我们以计算机为基础的模式识别系统中也非常有用。
尽管我们常常错误地认为可以眼睛中获得高分辨率的图像,而实际上,视神经传递给我们的只是视觉区域感兴趣点的大致轮廓和蛛丝马迹。然后我们通过皮质记忆(用来解释一系列平行通道上极端低分辨率的影像)来制造这个世界的幻象。在2001年的《自然》杂志发表的一篇文章上,加州大学伯克利分校的分子与细胞生物学教授弗兰克·维布林和他的博士生波顿·罗斯卡,M.D.向我们展示了视神经所承载的10~12个输出通道,它们每一个都只承担已给出景象的很少信息。 104我们称为神经节细胞的其中一组只是传递了一些关于物体边缘轮廓的信息(changes in contrast),另一组则具有检测大面积相同颜色的功能,而第三组只是对于兴趣点背后的背景比较敏感(见图4-7)。
图 4-7
维布林说:“尽管我们认为我们如此完整地看到了这个世界,而事实上,我们所看到的也仅仅只是一些暗示性的信息以及时间和空间的轮廓而已。这12张图像是我们一直以来所获得的周围事物的所有信息,它们是如此稀疏,而我们正是利用这些重建了我们丰富多彩的视觉世界。我很好奇,为什么自然最终会选择这么简单的十二种影像,而它又是如何向我们提供我们所需要的这个世界的全部信息的呢?”这样的发现对于智能系统的发展肯定具有很大的推进作用,而在这种系统中,眼睛以及早期的视觉处理将会被取代。
在第3章中,我提到的了机器人技术的先行者汉斯·莫拉维茨,他已经通过视网膜神经和大脑中早期的视觉处理转变了工程学上的图像处理。汉斯·莫拉维茨用了30年的时间致力于建造一个系统,期望这个系统能够赶上人类视觉系统的能力,从而达到从视觉上重建世界的目标。而它只是在最近才有足够的处理能力,因为微处理器已经能复制人类级别的特征检测,而莫拉维茨正在应用他的计算机模拟新一代的机器人,使之能够通过人类水平的视觉能力在复杂的环境中自动导航。105
卡福·密德一直引领着特殊神经芯片的研究,它将晶体管使用于它们天然的模拟模式,这一模式可以提供非常有效的神经处理的模拟仿真。密德展示过这样一个芯片,此芯片可以应用该方法模拟视网膜的功能,并进行视觉神经早期转换。106
检测移动是视觉识别的一种特殊类型,它是杜平根生物物理研究所的重点研究领域。最基本的研究模型很简单:将一个感受器上的信号和在其邻近感受器的延迟信号相对比。107这一模型要求速度在特定范围内,如果超过某一特定速度,则会导致令人惊讶的结果。这时,当观察对象的速度继续增加,移动探测器响应灵敏度将减少。动物实验结果(基于行为和我的分析,以及神经产出)和人的实验结果(基于报道的看法)都与该模型很匹配。
正在行进中的其他工作:人造海马体和人造小脑
海马体对于新信息的学习和长期的记忆存储都具有很关键的作用。南加州大学的特德·伯杰和他的同事们通过数万次的电信号刺激老鼠的海马体切片,从而绘制出该区域的信号模式,以此来确定哪些输入可以产生相对应的输出。108随后他们开发出了一种模拟这种结构的实时数学模型,这种数学模型模拟了海马体的信息转换,并且他们已经把这个程序固化到一个芯片上。109为了测试这一芯片,他们计划首先破坏动物原有的海马体,并记录产生的失败存储,然后将海马体芯片安装到被破坏的区域,并检测动物的记忆能否在芯片上重现。
最终这种方法能够用来取代患伤风、癫痫或者阿尔兹海默症的病人的海马体。这种芯片将被植入病人的头盖骨上,而不是大脑内,它能够通过两列导线和大脑进行通信,以取代损坏的海马体区域的功能。其中一列导线是用来接收大脑传来的电信号,另一部分则是用来向大脑回馈相应的信息。
另一个被模式化和被模拟的是人类的小脑区域,它负责调节人的平衡和协调四肢的运动。该国际研究小组努力的目标是将他们的人工小脑电路应用到军用机器人以及一般的机器人中,以便有效地协助残疾人。110选择这一特定的大脑区域的一个原因是:“这是目前在所有脊椎动物都具有的部分,不管是在最简单还是最复杂的大脑中,它都是大同小异的,”鲁道夫·利纳斯,纽约大学医学院神经学的研究人员之一,他这样解释道,“这一假设是保守的(在进化过程中),因为它是一种很智能的解决方案。由于系统涉及运动协调,因此我们希望一个机器拥有先进的电机控制,那么(用来模拟的电路的)进行选择将会很容易。”
他们的模拟器的一个独特的方面是它使用模拟电路。类似于密德对大脑区域仿真的开创性研究,研究人员发现,通过在模拟模式中使用晶体管可以实现更少的组件而达到更高的性能。
其中一个小组的研究人员是美国西北大学的神经学家,费尔南多·穆萨-伊瓦尔迪,他评论了一个人造小脑电路在帮助残疾人上的应用:“想想一个瘫痪的病人,可以设想很多寻常的事情,例如取一杯水、穿衣、脱衣,如果有一个机器人可以帮助他,就可以使病人更加独立。”
高级别的理解功能:仿效、预言和情感
思想的运作就像是战斗中的骑士——严格地控制着自己的数量,他们需要马匹,并且只在关键的时刻派上用场。
——阿尔弗雷德·诺斯·怀特海德
人类智能的显著特点不是运作的时候它在做什么,而是停止的时候它在做什么。
——马文·明斯基
如果爱是一个答案的话,你能为这个答案寻找一个问题吗?
——莉莉·汤姆林
因为它位于神经层次的顶端即大脑皮层,这是人类知之甚少的大脑部分。这个区域由六个位于大脑半球的最外层薄层组成,其中包含了数十亿个神经元。根据索尔克研究所计算神经学实验室的小托马斯·巴托尔的生物学研究,“1立方毫米的大脑皮层可能包含了5亿个有秩序的不同形状和大小的神经突触。”大脑皮层负责知觉、规划、决策以及我们认为是意识性思维的大部分。
我们能够使用语言——这个我们人类物种的另一个特有的属性似乎就位于大脑皮层区域中。这里有一个有趣的线索,是关于语言起源和促使区别性技能形成的关键性进化变革的:我们观察到只有少数灵长类动物能够使用(实际的)镜子去掌握技能,如人类和猴子。理论家吉亚科莫·里佐拉蒂和迈克尔·阿比布提出假设:语言起源于做手势(猴子会,当然人类也会)。做手势要求能够在思想上将动作和对自己手势的观察相关联。111他们的“镜子系统假说”中语言进化的关键是一个叫做“等价”的性质,所谓“等价”是指对于做手势的一方和接受手势的一方对手势(或者言论)的理解有着相同的意义。这就解释了为什么你在镜子中所看到的和某个观察你的人所看到的是一样的(尽管要左右颠倒)。其他的动物不能够以这种方式理解镜子中的影像并且可以相信它们失去了等价这一关键能力。
一个与此紧密相关的概念是仿效他人动作的能力(或者像人类婴儿学发声的例子)对语言的发展至关重要。112模仿要求能够将看到的演示分解成几个部分,每个部分都能够通过递归和迭代的改进来掌握。
在语言能力学的新理论中,认为递归是一项关键能力。在诺姆·乔姆斯基的人类语言早期理论中,他引用了许多共同属性来解释人类语言的众多相似之处。在2002年由马克·豪泽、诺姆·乔姆斯基和特库姆塞·费奇所撰写的论文中,作者引用了递归这一单一属性来证明人类物种独特的语言天赋。113递归是将多个小的部分组合成一个大的部分,并且将这个大部分作为其他结构的一部分来使用,然后反复继续这个过程的能力。通过这种方式,我们就能够以有限个单词建立句子和段落的详细结构。
另一个重要的人类大脑特征是预测的能力,包括预测我们的决定和行为的结果。一些科学家认为预测是大脑皮层的主要功能,尽管小脑在预测活动中也起着重要作用。
有趣的是,我们能够预测或者预期我们自己的决定。加利福尼亚大学戴维斯分校的生理学教授本杰明·里贝特的工作显示,发起一个行为的神经活动比大脑做出采取行动的决定要早1/3s。言外之意,里贝特认为决定是真实存在的错觉,即“意识跳出了循环”。认知科学家和哲学家丹尼尔·代尼特描述的现象如下:这一行为由大脑的某个部分加速,飞速把信号发送给肌肉,并且在途中暂停告诉你的意识代理将要发生什么。114
最近进行的一项相关的实验是,神经生理学家用电信号刺激大脑上的点位来产生特定的情感。这一课题随即给出了经历那些情感的解释。众所周知,那些左右大脑无法沟通的患者,大脑的其中一半(通常是左半脑)会对由另一半脑引起的动作给出复杂的解释(“虚构症”),就像左半脑是右半脑的公共关系经纪人一样。
人类大脑最复杂的能力是我们的情商,我将它视为大脑最尖端的技能。我们能够恰当地感知回应情感,在社会环境中做出反应,有道德,听得懂笑话并且能感知艺术音乐,这些都是大脑有内部连接的复杂的高级功能。很明显,低级的感知与分析功能会参与到大脑的情感处理过程中,但是我们已经开始理解大脑的这个区域甚至能够模拟特定的神经元去解决这些问题。
这些最近的解释可以帮助我们去理解人类大脑与其他哺乳动物差异。答案很微小但却很关键,这些能帮助我们理解大脑怎样处理情绪和一些相关的情感。一个区别点是人类的大脑具有非常大的脑皮层,使我们拥有很强的规划、决策和一些相关的分析思维能力。另外一个重要的区分点是情感被一种叫做梭形细胞(只在人类和类人猿中发现)的特殊细胞所控制,这些细胞非常大,而且有很长的神经细丝(称作尖端突触),这些神经细丝传递着来自很多其他大脑区域的特异性信号(见图4-8)。随着人类进化进程的深入,这种特殊神经元提供的广泛连接或者这种深层次的连接变得越来越显著。考虑到感情的复杂性,我们不会为梭形细胞建立深层连接以帮助我们处理情感和道德判断而感到惊讶。
图 4-8
令我们惊奇的是,在这狭小的区域里只有极少量的梭形细胞,人类大脑中大概只有80000个(45000个在右半球,35000个在左半球),虽然差别很小,但是这些不同似乎能够解释为什么情商是由右脑控制。大猩猩拥有约16000个梭形细胞,倭黑猩猩有2100个,黑猩猩有1800个。其他哺乳动物则完全没有。
凤凰城巴罗神经学研究所的亚瑟·克雷格博士最近提供了一个关于纺锤体细胞结构的描述。115来自皮肤、肌肉、组织和其他地方的神经输入(估计在数百兆每秒)流进脊髓上部。这些神经携带的信息涉及触觉的、温度的、酸度的(例如,在肌肉中的乳酸)、食物通过胃肠道时的蠕动,以及许多其他类型的信息。这些数据会在脑干和中脑中进行处理。称作Lamina 1的关键神经元细胞绘制了一幅反映身体当前状态的地图,就像飞行控制者用来跟踪飞机的显示器。
然后信息会流过一个称为后腹内侧核(VMpo)的螺母大小的区域,它似乎能够推断出身体状态的一些复杂反应,例如,“这个尝起来很糟糕”,“好臭”,或者“光好刺眼”。这些日益复杂的信息最终在两个称为岛状皮层的区域结束。这些小指大小的结构位于皮层的左右两侧。克雷格把VMpo和两个岛状区域描述为“代表物质我的一个系统”。
虽然机制尚未明确,但是这些区域对于自我意识和复杂情感是至关重要的。它们在其他动物身上更小。例如,VMpo在猕猴身上差不多只有一粒沙子大小,在低级动物中就更小。根据爱荷华大学的安东尼奥·达玛西奥博士的观点,这些发现越来越达成一个这样的共识,那就是我们的情感和那些包含身体地图的大脑区域是紧密联系的。116他们也与这样的观点达成一致,即我们很多的想法直接针对于身体,保护和提高自身,积极满足它们无数的需求和欲望。
最近,我们已经发现从身体上以感知信息开始的另外一个层面上的过程。从两个脑区来的数据传输到右脑前面的一个叫做前岛叶的微小区域中。这是一个存在梭形细胞的区域,tMRI扫描为我们揭示出这个区域在人类处理像爱情、愤怒、忧伤和性欲的高层次的情感时会变得非常活跃。目标人物看着他的伴侣或者听到自己孩子的哭声时,梭形细胞也会受到刺激。
人类学家认为梭形细胞第一次出现是在1000~1500万年前,在一种未被发现的常见的类人猿和猿人祖先中,他们的数量在10万年前迅速增长。有趣的是,新生儿没有梭形细胞,这些细胞在小孩4个月大的时候开始出现,并在1~3岁时迅速增长。幼儿对道德问题与复杂感情(比如爱)的处理和感知能力也是在这个时期发育的。
梭形细胞是通过它们长的顶端树突与其他大脑部位的深入联系来获得能量的。因此,顶端树突所处理的高水平情感活动受感觉和认知领域的影响,对梭形细胞的具体活动方法进行逆向工程是很困难的,正因如此,只有掌握与它们相连接的其他区域的更好模型才能够实现。然而,令我们意外的是,专门处理这种情绪的神经元非常少。小脑有500亿神经元帮助我们处理技能的形成,大脑皮层中有数十亿神经元用来转换认识和理性规划,但却仅有八万梭形细胞处理高级情感活动。必须指出的很重要的一点是,梭形细胞并不做合理分析,这就是为什么我们在音乐与爱情面前没有理性。然而,大脑的其他区域则忙于赋予我们神秘的高级情感活动以真正的意义。