首页 理论教育 统计方法与现有处理方法对比分析

统计方法与现有处理方法对比分析

时间:2023-11-20 理论教育 版权反馈
【摘要】:仔细分析这些方法,它们都属于统计方法。任何一种以统计为基础的理论,都属于确定论观点。现在的信息处理中,有很大一个领域是随机信号处理,它的数学模型实质上都是在确定性系统中加上随机信号,或是在稳定系统中加随机信号,这种方法根本不是普适的。人工智能的核心是学习[20],学习离不开数据库,也就是统计数据中的规律。

统计方法与现有处理方法对比分析

人们总是认为人的行为是有规律的,因此,神经信号也会有规律,神经脉冲序列看起来可以没有规律,但是在统计上,或在群体编码信号中就会有规律。这种想法反映出人们受现有的统计物理的思想影响深远,认为没有统计规律的东西就是没有规律,有规律的东西一定满足统计规律。因此,正如文献[1]所说,在生物系统中,统计方法已到了不可或缺的程度。文献[1]的思想是典型的线性观思想,这也是极大部分生物学家的思想。问题是这种思想已经有几十年历史了,可是在神经信息研究中并没有显示出巨大的威力,相反却制造了很多矛盾的假设和理论。

经历了这几十年来大量的实验数据分析,我们是否应该反思一下,离开统计真的不行吗?如何抛弃统计的偏见?S 空间的假设至少是一次有意义的尝试。

脑中微观和宏观的关系不能与统计规律放在一起。有一种观点需要分清,在脑中,微观和宏观的关系不符合第二类统计规律,因此不要把这一关系与统计连在一起。群体编码中所提出的微团假设,是含糊其辞。有人认为微团内会出现“自组织”,所谓自组装编码也是良好的愿望。在不知道究竟是否存在自组织以前,不能随便用综合的电位曲线去代表什么,否则会使人无从入手去分析和理解其机理。微观和宏观之间不仅仅只存在统计关系,特别是在非线性、不稳定的系统中不一定存在统计规律。在神经系统中,两者的关系十分复杂,对这一问题的认识也将影响到我们对神经信息的认识。

信息论与神经信息。为了深入分析神经脉冲内部存在的规律,目前已经引入了很多信息论方法,如相关、互信息、信息熵等。仔细分析这些方法,它们都属于统计方法。如文献[19]提出了用信息论来分析神经编码问题,可以说是比较严格的对脉冲序列的理论分析。其中用了信息论中的互信息(mutual information)原理。从互信息定义可知,它是建立在概率论的基础上的,也就是企图在脉冲序列统计中找出规律。可是到目前为止,这种方法没有得到多少人的肯定,这是为什么?任何一种以统计为基础的理论,都属于确定论观点。而用这些观点来分析神经系统,常常会有很大的局限性。从S空间观点来看,互信息是很难解决S 空间中的神经编码问题的,因为它还没有跳出统计的框框,还是在追求统计上的不变性。

确定性系统加随机信号不能代表脑信号。现在的信息处理中,有很大一个领域是随机信号处理,它的数学模型实质上都是在确定性系统中加上随机信号,或是在稳定系统中加随机信号,这种方法根本不是普适的。对于非线性、不稳定系统就不能用此模型。脑确实是非线性不稳定系统,用稳定系统加随机信号不能描述神经系统。(www.xing528.com)

对目前数据挖掘方法的分析。目前,大数据、“云”技术被宣传得很火,似乎大数据能解决人们无法想象的东西。应该说确实我们可以从大数据中发现很多,但是目前数据挖掘的唯一方法也是统计方法,没有统计规律的数据能有规律吗?有了本章的分析,可能会有另一种看法。我们不能随便拉两组数据进行相关分析,而是首先要看被统计系统是否稳定,是线性系统还是非线性系统,随便利用统计来挖掘数据可能会出现相反的结果。现在,不管是在经济系统还是在社会系统等中,都会出现不稳定和不确定的系统。在这样的系统中进行数据挖掘,是不能靠统计方法的。统计的适用性很值得思考。在数据挖掘中,只有跳出统计的框框才会发现更多有用的信息。

人工智能中“学习”的看法。人工智能的核心是学习[20],学习离不开数据库,也就是统计数据中的规律。例如语音识别就是根据大量数据库来进行统计(称为学习或训练)的。利用不同的数据库,所得的“学习”结果也不一样。到目前为止,人们还没有找到标准的英语的中心模式,也没有找到中文语音的中心模式样本,这是为什么?即使有再大的数据库,机器学习的能力总没有人的识别能力强。而且人学习外语,不需要数据库。多少年来,人工智能研究的进展不多,至少说明统计在这里不太适用。应该说,人的学习不等于用统计,关于这一点,人工智能开发人员是否理解错了,文献[20]的观点是否错了?在这方面,第13 章还会再讨论。

中医针灸的看法。很多学西医的人认为中医不是科学,一个主要的原因是中医疗法没有严格的统计学的实验证明。从这一角度看来确实很有道理。中药成分、制法不确定,对哪些药能治什么病没有一个确定的临床统计指标,因此很多人不认可中药。针灸有效吗?很多中国人相信有效,外国人不太相信。长时间以来,中医经验证明它是有一定效果的,但是在医学上它没能通过统计检验,说明它确实不符合统计规律。应该说只要有一个针灸治疗案例确定是有效的,我们就应该承认针灸是有效的,至于它的有效范围有多大,这是另一个问题。在这里我们并非想证明针灸的有效性,而是仅仅提出一个问题,即是否需要考虑一下统计的局限性,也考虑一下西医经典理论的可信度。生物体本身都是非线性很强的系统,对其应用统计方法往往不合适,西医严格地用统计结果来说话也是有一些问题的。同时,医学实验中所得到的统计数据也往往不是很“理想的”,根本不能与工程上的统计相比。但是,我们总会因生物系统太复杂而“原谅”这些统计结果。当我们认识到统计的局限性时,要重新对中医进行思考:中医是否跳出了统计的框框来思考问题?这种思考是否更适合生物系统?但可以肯定的是,至少不能用统计随便否定中医和针灸。

其实这不仅仅是对待中医的问题,在高层次信息研究中也常会碰到这一类问题。例如文献[21]中提到:一觉醒来突然有了一个灵感。很多人都有此经验,会相信这种现象存在,但是肯定没人能对此做出统计规律。现在我们是否也要重新思考类似的问题?这些还会在第13 章再讨论。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈