众所周知,新皮质的某些区域的确是分等级的。其中以视觉皮质的研究最为深入,它被分成了V1、V2以及MT(或V5)区域。当我们进一步观察视觉皮质中更高级别的领域时(是指处理“更高”层级的概念,而非物理学意义上的“更高”,因为新皮质只有一个模式识别器的厚度),可识别的特质就变得更为抽象。V1负责识别眼睛看到事物的基本线条和初始形状。V2负责识别物体的轮廓,处理两眼的视觉差异,并对事物进行空间定位,以及判断影像是主体部分还是背景。[123]新皮质的更高层级区域负责处理诸如对象的身份脸孔及其动作等这类概念。在这个层级体中,信息可以向上一级传输,也可以向下一层级传输;信号既可以是刺激性的,也可以是抑制性的。麻省理工学院的神经科学家托马索·波吉奥(Tomaso Poggio)做了很多人脑视觉成像的研究,他过去35年的研究对视觉新皮质“早期”(最低概念)层级上的分层学习和模式识别的发展具有重要意义。[124]
我们对视觉新皮质较低层级的理解与我在第3章描述的思维模式识别理论是一致的,而且近来人们对大脑神经处理分层本质的研究远远超出了这些层级。得克萨斯大学的神经生物学教授丹尼尔·费勒曼(Daniel J.Felleman)与他的同事致力于“25个新皮质中大脑皮质的分层结构”的研究,该研究既包含了视觉区域,也包含了负责处理各种感官模式的更高层级的区域。随着对新皮质层级结构研究的深入,他们发现:层级越高,新皮质处理信息的过程越抽象,处理信息时调动的区域越多,处理所需的时间也越长。对新皮质的任意一个联结来说,信息在层级结构中总是呈现向上和向下的双向交流。[125]
近来的研究在很大程度上允许我们将这些研究扩展到视觉皮质之外的区域,甚至融合了很多来自感官输入信息的联合区。普林斯顿大学心理学教授尤里·哈森(Uri Hasson)和他的同事在2008年发表了研究结果,该研究论证了大脑神经区域的绝大部分区域与视觉皮质有着相似的活动。
很明显,沿着视觉皮质通路,神经元不断扩大自身的空间接受域。这是视觉系统的基本组织原则……真实事件的发生地点绝不会只在扩大的空间中发生,也不会在扩延的时间中发生。因此我们猜测,应该也有与空间接受域大小相适应的分层结构存在,负责处理大脑不同区域发出的时间反应特性。根据上述发现,我们认为,与已知空间接受域的皮质分层相类似,人脑中也有一个为时较长的时间接受窗口的层级结构。[126]
大量证据证明大脑具有可塑性,这就是新皮质处理信息的方式具有普遍性的最有力证据(学习与信息交流),换句话说,通过使用新皮质的通用算法,我们可以使一个区域完成本该由另外一个区域完成的任务。如今大量神经科学研究正在试图确定新皮质不同区域与模式类型的一一匹配。完成这项任务的传统方法是找出因受伤或重击而受损的大脑丧失的功能,并找出大脑具体的受伤部位,通过前者和后者的结合,我们就可以确定新皮质内不同区域的功能。举个例子,如果一个病人脑部的梭状回(fusiform gyrus)区域刚刚受伤,而他突然无法像之前那样根据他人的脸部肖像识别来人,却依然能无障碍地根据人的声音和语言模式识别他人,我们可以推测上述区域与脸部识别有一定的关系。这个判断的基础是,新皮质的不同区域只负责处理和识别特定模式类型。不同的身体区域负责处理不同的模式类型,因为这是正常情况下信息传播的方式。但如果由于某种原因,信息传播受到阻碍,那么新皮质的另一区域就会介入,并接管受阻区域的工作。
可塑性受到了神经学家的广泛关注,他们观察到由于受伤或中风而导致大脑受损的病人,能够在新皮质的另一区域重新习得该技能。关于可塑性最受关注的例子也许是2011年的一项研究,即由美国神经科学家玛丽娜·贝德尼(Marina Bedny)以及她的同事进行的关于“先天性盲人视觉皮质发生过什么”的研究。人们普遍认为视觉皮质早期层,如V1和V2,天生就是处理非常低级的模式(如边缘或弧边),而前皮质(frontalcortex,位于我们特有的大前额中的新皮质进化新区域)天生是处理复杂和微妙得多的语言以及其他抽象概念模式。但正如贝德尼和同事们所发现的:“人类进化了左前脑区域以及特别善于语言加工的颞叶皮质。然而,先天性盲人在某些语言任务上也能激活视觉皮质。我们可以证明这种视觉皮质活跃实际上反映了语言加工。我们发现,对于先天性盲人来说,左视觉皮质与传统语言区域表现相似……我们推断为视觉而进化的脑域会因早期经验而具有语言加工能力。”[127]
想一想该项研究的启示:它意味着物理上相对远离的新皮质区域,以及被认为概念很不一样的新皮质区域(原始视觉线索对抽象语言概念),本质上来说使用的却是相同的算法。负责处理不同模式类型的区域可以相互替代。
来自加州大学伯克利分校的神经科学家丹尼尔·费尔德曼(Daniel E.Feldman),于2009年写了一篇关于被他称为“新皮质上可塑性的突触机制”的综述,并提供了这种可塑性在整个新皮质上存在的证据。他写道:“可塑性允许大脑学习、记住感官世界中的模式,并修正行动……帮助伤后恢复功能。”他补充道,这种可塑性的实现是通过“结构变化,包括皮质突触和树突棘(dendritic spines)的形成、移除以及形态改变”。[128]
关于新皮质可塑性(以及新皮质算法的一致性)的另一个令人震惊的例子是,最近由加州大学伯克利分校的科学家们所展示的——他们将植入式微电极列阵联结起来,以接收老鼠运动皮质某一特定区域的脑部信号,此区域负责控制触须的活动。他们将实验设计成,如果老鼠们能在某种心智模式上控制那些要激活的神经元,而又不移动它们的触须的话,那么它们就会得到奖励。要获得奖励,所需要的模式涉及一种它们的前端神经元通常无法实现的精神任务。不过,老鼠们能够完成这项精神任务,主要是一边通过它们的运动神经元进行思考,同时从精神上切断其对运动的控制。[129]科学家们得出的结论是:负责协调肌肉运动的新皮质区域的运动皮质也使用标准的新皮质算法。
不过,使用新皮质的新区域来代替受损区域,重新习得的技能或某种知识未必会跟原有的一样好,又是为什么呢?有几点理由可以说明。学习并完善一项特定技能,需要花费一生的时间,因而新皮质另一区域重新习得其他区域负责的技能时,并不能瞬时产生同等的效果。更重要的是,新皮质新区域并不只是要担当受损区域的替补,它本身也发挥着至关重要的作用,因此在弥补受损区域时,就要抛弃它的新皮质模式,所以表现得很犹豫。它可以从释放模式的一些冗余的副本开始,但是这样做会微妙地降低已存技能,也不会释放出与再学习到的技能原先占用大小相同的皮质空间。
可塑性的局限性还有第三个原因。因为大多数人的特定类型的模式会流经特定区域(例如梭状回区域处理脸部识别),所以这些区域已经通过生物进化优化出了最适合处理那些类型的模式。正如我将在第7章中介绍的,在我们的数字新皮质发展中出现了同样的结果。我们可以通过字符识别系统来识别语音,而反之亦然。但是,由于言语系统最适合识别语音,字符识别系统最适合识别印刷字体,因此,假如我们用一个代替另一个的话,其执行力就会被减弱。实际上,我们会运用进化(基因)公式来完成这种优化,这种优化模拟的是生物自然。假设大多数人的脸部成百上千年(或更多)来一直由梭状回区域识别,生物进化就能够形成有力的能力来处理那个区域中的这种模式。它使用相同的基本公式,只不过将其应用到脸部识别罢了。正如荷兰神经科学家兰德尔·科恩(Rondal Koene)认为:“新皮质非常一致,原则上来说,皮质柱或微皮质柱可以做其他同伴所能做到的。”[130](www.xing528.com)
近来大量研究支持以下观察:基于对它们造成影响的模式,模式识别模块相互联结了起来。举个例子,神经科学家左易(Yi Zuo)和她的同事观察到:新的树突棘在神经细胞之间形成联系,所以老鼠们学到了新的技能(通过一个狭缝抓取种子)。[131]索尔克研究所的研究者已经发现新皮质模块的这种自我联结明显是由少量基因决定的。在新皮质中,这些基因和这种自我联结方法也是一致的。[132]
许多其他研究证明了新皮质的这些属性,我们来总结一下我们从神经学文献和自己的思想实验中所观察到的。新皮质的最基本单位是神经元模块,我估计约有100个。这些神经元被联结到每个新皮质单元中,这样,每个模块就不会有明显的差别。每种模块之间的联结和突触强度的模式都是相对稳定的。正是模块之间的联结和突触强度代表了学习。
新皮质中大约有1015种联结,而基因组中的设计资料却只有2.5亿字节(无损压缩后),[133]因此从基因上来说,联结本身是不可能预先确定的。这种学习有可能是新皮质查询旧脑的产物,却仍然只体现了相对较少的信息。模块之间的联结大体上是从经验中确立的(后天培养而不是自然形成)。
大脑并不具备足够的灵活性,无法保证每种新皮质模式识别模块都能够轻易地与任一种模块相联结(就像我们能轻易地在电脑上或网上编程一样)——必须创建实体物理联系,轴突联结到树突上。我们每次都是从大量可能的类神经联结开始。正如韦丁恩的研究所展示的,这些联结以一种很重复而又很井然有序的方式组合在一起。基于每种新皮质模式识别器所识别到的模式,这些等待中的轴突的终端联结就会发生。没有用的联结最终会被删除。这些联结是分等级建立的,反映了事实的自然等级秩序。这也正是新皮质的关键优势所在。
新皮质模式识别模型的最基本公式在新皮质中,从处理最基本感官模式的“底层”模型到识别最抽象概念的“高层”模型都是对等的。新皮质区域可塑性和可交替性最明显的证据就是这个重要观察的确实证明。处理特定类型模式的区域有一些优化,但这只是二阶效应——最基本的公式是通用的。
信号沿着概念阶层上上下下。往上的信号意味着“我发现了一种模式”,往下的信号意味着“我在期待你的模式产生”,这本质上是一种预测。往上或往下的信号要么是兴奋的,要么是抑制的。
每种模式自身都处于一种特定的秩序并且不易逆转。即使一种模式似乎有多面性,它也只是由更低层模式的一种一维模式所体现,因此每种识别器都有固有的递归性。不过,分层可以有很多层。
我们所了解的模式有很多是重复的,尤其是那些重要的模式。模式识别(诸如普通物体和脸部)和我们的记忆使用相同的机制,这些机制正是我们所了解的模式,它们也被作为模式序列储存着,且基本上是故事。那种机制也用于学习和在物理世界中进行物理运动。模式的重复使得我们能识别物体、人和那些有变化且发生在不同环境中的想法。尺寸和大小的变化参数也使得新皮质能够编码不同维度的变化幅度(就声音而言是持续时间)。编码这些幅度参数的一条途径就是通过不同数量重复输入各种模式。举个例子,口语“steep”就有模式,它有不同数量的重复长元音[E],每个都有中等层级的重要性参数集表明[E]的重复是有差异的。从数学上来说,这种方法并不等于拥有明确的尺寸参数,也不像实际运行那样工作,就只是一种编码幅度的方法而已。关于这些参数,我们目前拥有的最有力的证据就是为了得到接近人类层级的准确程度,人工智能系统需要它们。
以上总结包括了从我所分享的研究结果抽样和我早先讨论的思想实验抽样中所得出的结论。我坚持认为我所呈现的模型是唯一能满足研究和我们的思想实验所确立的所有约束条件的模型。
最后,我再提供一个具有说服力的证据。数学上来说,过去几十年里我们在人工智能领域开发的用来识别和智能处理真实世界现象(如人类话语和书面语言)、理解自然语言文件的技术,与我上文所呈现的模型很相似。它们都是思维模式识别理论的例子。人工智能领域并不是尝试复制人脑,却仍然达到可与人脑匹敌的技术水准。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。