正如爱因斯坦所说,发现问题往往比解决问题更难。从分子神经科学到亚细胞、细胞,再到系统,一直到神经组织等,都发现了大量现象,但是在神经信息学中进展还是很有限。神经信息学研究为什么长期以来进展不大?关键问题究竟在哪里?从目前看,神经信息学真正的困难所在还是比较模糊的,一般都是把所有的原因归结为脑太复杂。其实这种想法会阻碍我们正确地思考,我们应该经常反复思考神经信息最核心的困难所在。如果真正抓到了核心问题,那就说明我们已经解决了问题的一半。
由于脑的复杂性,神经信息学的研究十分艰难,国内外都没有取得很大进展,还处在积累经验的阶段。虽然有很多数学模型被提出,特别是很多非线性动力学的研究在近期取得了巨大成果,但是对神经系统内信息过程的研究还是很少,对神经编码方面的研究还停留在三类编码理论的基础上。这些模型的分析往往不被生物学家所接受,因此,就像埃里克·坎德尔(Eric Kandel)所说的,对神经信息学的研究还处在非理性的阶段[20],神经信息学成为科学界最难攻克的堡垒之一。经仔细分析,其原因至少有如下几点。
1.脑是典型的不稳定和不确定的系统
追求确定性几乎是所有科学家的愿望,由于牛顿时代确定性理论取得了辉煌成就,所以确定性思想深深地扎根在人们的脑海中,科学家们总想在千变万化的现象中找到确定性的规律。一个系统有确定的输入和输出,那么这个系统也必定是确定的,同时干扰的存在会使输出产生不确定的变化,但是总可以追求它们在统计上的确定性。这是科学家长期来所采用的思想方法。
可是这一观点很难用于脑研究,研究神经信息学的困难在于脑的复杂性,脑的复杂性并不在于有大量神经元,低等动物神经系统的神经元其实是相当有限的。大规模集成电路中的元件数量和神经系统的神经元在同一数量级水平上。人们能搞清集成电路,却为何搞不清神经网络?事实上,脑的复杂性关键在于它的不稳定性和不确定性。
(1)神经系统在结构上的不确定性
一个集成电路可以由成千上万个门电路组成,它们相互之间的连接一点也不能随便,否则它就成了另一个集成电路。如果这成千上万个门电路中有一个损坏,那么集成电路就不能正常工作,这是具有完全确定性的系统。对于信息科学家来说,这是理所当然的,很难想象如果集成电路中某些门电路经常损坏,而集成电路本身还能正常工作。
如果要了解计算机工作原理,首先要知道它的电路结构,否则就无从下手。要了解脑的信息处理原理,也要了解脑的结构。可是到目前为止,人们还是没有完全搞清神经系统的结构,只知道一个大概的趋向。图1.1是一张生物神经网络图,这是生物学家根据实验观察所得出来的示意图。每一个神经元都像一棵树一样,有很多“根”与其他神经元相连。要像了解集成电路那样去理解神经网络,是很困难的。实际上,每一个神经元所分出的树突和轴突像树根一样都是不确定的,我们不可能找到根长得完全一样的两棵树。人的指纹、虹膜各不相同,因此常把它们当作辨别个人的标记。神经系统也一样,我们不可能找到神经网络一模一样的两个生物体。任何一个脑都是世界上独一无二的[22]。这反映了神经系统在结构上的不确定性。
图1.1 生物神经网络
(2)神经系统工作的状态不确定性
神经的可塑性是普遍存在的;多次生物系统实验中,实验数据会因为细胞疲劳程度不同而不一样;细胞有生长、发育、衰老、死亡的过程,例如嗅感受细胞一至两个月要全部换一次[25],这就意味着系统参数在不断变化着,而且细胞需要新陈代谢来维持,受外界影响很大。这些原因使系统的参数产生很大的不确定性,同样也使系统状态产生很大的不确定性。
单个神经元是稳定的,但组成网络就不一定了。神经系统是个不稳定和不确定的系统。文献[26]明确指出:“Spike trains are unreliable.”“unreliable”是不可信、不确定的意思,长期做实验的人也可体会到这样的经验。文献[27]引证了很多文献[28-31],说明在大脑皮层中出现的极不规则的脉冲序列是不可能重复同样的实验来得到的。这就说明了神经系统状态的不确定性。
(3)我们应该欢迎不稳定性和不确定性
在控制理论中,稳定性理论差不多要占很大篇幅,微分方程稳定性理论有专门的书籍,各种系统理论几乎都会讨论稳定性问题,信息科学家都尽量避开不稳定和不确定系统,认为不稳定系统无法用于工程实际。可是,我们发现这种不稳定和不确定系统实际上具有极大的优越性。
①只有不稳定系统才会有初值敏感性,有了初值敏感性才能提高神经系统的灵敏性;而且系统越不稳定,灵敏度越高。这也解释了为什么狗能闻到几公里以外的气味,猫头鹰能区分5μs 的时间差[3-4]。
②结构不确定的简并系统[32]将比计算机具有更强大的适应性(我们将在第9 章专门讨论简并问题)。
③根据我们的研究经验,不稳定系统还有更大的好处。脑内自由意志[33]的存在、灵感的突然出现、意识的量子理论[如Eccles(埃克尔斯)的微位假设成立[34]]等,不可缺少的条件都是系统不稳定性。正是脉冲序列的不确定性,才使脑有别于计算机(我们将在第13 章讨论此问题)。
应该说,我们不仅要正视不稳定性和不确定性,而且应该欢迎不稳定性和不确定性,要向神经系统中的不稳定性和不确定性学习,来改变自己固有的确定论的思想。
2.神经信息过程是定量过程(www.xing528.com)
“神经信息过程是定量过程”这个问题可以从宏观的行为观察上找到明确答案。两耳对声源定向检测问题需要定量检测,蝙蝠测量多普勒效应也需要定量,视觉神经系统只有定量才能分辨千万种颜色,嗅觉区分气味实际上也需要定量,高音质声音系统和高清图像需要高位A/D 转换。人能分辨出高音质音乐和高清晰度图像,说明人的听觉和视觉都是定量的,并且量化分辨率是很高的。
仔细分析之后可以发现,人的辨识过程也是定量的。例如,人对味觉信息的辨识,并非仅仅把牛奶和咖啡分开来,或辨识出它是牛奶和咖啡混合体,其实在牛奶和咖啡之间还有很多混合的状态,不同的比例味道不同,这种混合状态变化是一个连续的过程。人能区分其中的混合味道,说明人的味觉是定量的。再举一例,香料厂生产的香精产品里有很多成分混合在一起,其中成分之比受严格控制,企业家为了商业竞争往往把配方保密起来。人的嗅觉能区分不同配比的香料,这说明嗅觉辨别气味是定量的,而且这种定量具有很高的分辨率。姚明投篮要投得准,也需要定量控制。眼球要跟踪远方某一目标移动,眼球的控制也需要高灵敏的定向。神经系统输入输出都是定量的,中间神经系统会是不定量的吗?应该说,神经系统的工作本质上是在定量状态,而不是定性状态。
可能有人会问,语音识别是定量的吗?图像识别是定量的吗?意识或情绪可以定量吗?确实脑活动的有些结果是不能定量表示的,但这并不能说明脑活动不是定量过程。有定量过程的系统可以得到定量结果,也可以得出定性结果;可是定性过程系统永远不可能得到定量结果。正像计算机一样,它的信息处理是定量过程,但是同样能做语音和图像的定性识别,脑活动也是如此。
目前对神经系统的认识都集中在定性分析状态。所采用的分析方法也都是定性的。如人工神经网络只能用于定性分析,它是依靠不动点来实现辨识的,无法处理多普勒效应,也不能用于处理声源定向问题。人工智能的辨识过程和现代机器学习的基本原理都离不开数据库,离不开大量统计,最后还得靠聚类分析、模式识别之类实现学习,虽然这里有大量数学公式,但是对这些公式的分析方法实质上仍属于定性分析方法。
3.不稳定和不确定系统能实现高分辨率的定量吗
现在又有问题产生了:不稳定和不确定系统能实现高灵敏定量吗?不稳定和不确定系统能测量小信号吗?这是现代信息技术所不能接受的矛盾。这一矛盾限制了对神经系统的定量研究,也限制了对神经系统的进一步认识。这个矛盾也是现有信息科学与神经信息系统之间的一条鸿沟。
混沌系统为什么不能很好地用于信息科学?关键问题也是因为混沌系统是不稳定系统,混沌轨道是不可预测的,而信息技术要求是确定的、定量的。不稳定和不确定的混沌系统如何能用于确定的定量的信息系统呢?在脑研究中也有类似的问题。或者反过来说,现代科技理论无法解决混沌通信这一类问题,这同样也阻碍了我们对神经信息系统的认识。只有解决这一问题,才能使信息科学更接近神经系统,才能使信息科学有根本性突破,使神经信息研究取得突破。
4.海量突触问题
神经信息编码存在于脉冲序列之中,神经回路是处理这些脉冲序列信号的基础。回路的最基本单元是神经元。首先要考虑的问题是一个神经元的输入输出的变化关系。而要考虑神经元输入输出的变换关系,首先会碰到像图1.2的浦肯野细胞(Purkinje cell)这样海量的树突问题。特别是小脑中的浦肯野细胞,一个细胞树突有高达15 万个数量级的突触连接,也就是有15 万个信号输入处。即便是脑中的锥体细胞(见图1.3)也有上万个突触。这么多的突触会产生很多令人难以想象的问题。
图1.3 锥体细胞
图1.2 浦肯野细胞
(1)从生理实验看,细胞一般工作在几十赫兹到几百赫兹的范围,最高不会超过1000Hz。如果每个突触一秒内接受一个脉冲,那么十几万个突触就会在一秒内接受十几万个脉冲,这表明细胞工作的频率在1MHz 以上。但是细胞在这么高的脉冲频率下根本不能工作。
(2)平时这些与该细胞相连的十几万个细胞,都没有神经脉冲发出。当一两个突触分支有信号输入时,其他信号不会输入,这种状态不太可能。而且,神经系统是靠神经脉冲来维持它的生命“健康”状态的,如果没有神经脉冲,那么这些突触和相连的细胞突触一定会萎缩掉。因此,不管是否工作,每一突触一定会有一定频率的脉冲序列通过。实验也可证明,脑在休息时仍有脉冲信号存在。
(3)15 万个信息综合能代表什么?特别是靠一个细胞能综合出什么?实在很难使人理解。再有一种可能的解释是15 万个信息都来自一两个细胞的信息源。也就是说,这许许多多的突触实际上接收同样的信号,以便提高可靠性。即使是这样,也用不着这么多,否则神经系统的效率太低了。
(4)在脑中存在大量的锥体细胞和浦肯野细胞。由这些细胞构成的神经回路,不是仅仅在一处具有海量输入,而是在很多处都有海量信号输入。这样的神经回路如何工作呢?
诸如此类的问题还有很多。霍金斯在他的书中提出了12 个可检验理论的假设,其中之一也是大量突触的输入问题[2]。海量树突输入信号处理实在难以理解。似乎以单细胞神经回路来分析神经编码非常困难。这也许是提出群体编码(population code)的重要原因之一。从宏观上(也就是从统计上)找规律可能是唯一的途径。文献[35]讨论了几百个突触,Song 确实采用了统计的方法,但是所得结果很少。海量输入问题不解决,神经回路理论就很难站住脚。这也许为群体编码理论和功能网络理论的建立提供了理由。
不管是什么理论,都必须克服上述困难;解决不了上述困难,肯定不能成为真正的神经信息学理论。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。