首页 理论教育 研究方法:探索复杂性科学的4.3步骤

研究方法:探索复杂性科学的4.3步骤

时间:2023-07-23 理论教育 版权反馈
【摘要】:长期以来,必然性与偶然性之间的关系,形成了两种对立的科学观。一种是机械决定论的观点,认为必然性统治着宇宙的一切。在牛顿力学中,用微分方程表示的力学规律的根本特性是确定性和必然性。这种观点从根本上否认了原因与结果之间的必然联系,把宏观的必然性看成是主观的信念与习惯。但是,这并不意味着严格的自然规律不存在。的确,在宏观世界中存在必然性占统治地位的

研究方法:探索复杂性科学的4.3步骤

科学求真的过程是一个不断从相对真理走向绝对真理的过程。纵观人类的科学发展史,从必然性到偶然性(或者说从确定性到随机性)的认识经历了一个漫长的历史进程。中世纪的神学目的论认为人的未来是由命运决定的,反抗是没有用的,但生活的经验和科学的逻辑告诉人们,并没有什么注定的命运,更没有人能预知未来的吉凶祸福。17世纪末期牛顿理论的形成是对神学目的论的彻底否定,牛顿理论认为未来是由现在决定的,这就是因果决定论。它不是一种超自然宿命论,而是根据过去的事实,由物理定律给出的因果决定论,其基本观点认为必然性统治着宇宙的一切。所谓必然性是指一切现象都是由因果关系联系起来的,一切物质运动都是由确定的规律所决定的。人们知道了原因就一定能知道结果,现在发生的一切都是由过去所决定的,它们都是通过因果链建立联系的。人类未来的命运操纵在人类现在的手中,现在的努力、奋斗会决定人类未来的命运。这是对人类精神思想的一个革命,也是人类自然的一个很大的进步。决定论在18、19世纪基本上统治了科学界。进入20世纪后,随着物理学的进展,人们发现偶然、不稳定、演化和分岔的现象四处存在,从原子原子核再到宇宙尺度,乃至我们的日常生活中。按照决定论的观点,世界万事万物都以预定的方式存在着,并将永远如此存在下去,没有任何新的东西。20世纪20年代量子力学的创立,首次突破了决定论思维中“必然性”的概念,确认了微观过程遵循的只是统计原则,决定性因果关系在微观世界那里成为不确定的了。我们不可能预见某个光子在何处,我们只能计算出光子在空间某个区域出现的概率,也就是说它是随机的。量子论只谈统计量而不是确定量,只谈概率和可能性。量子论的出现又将我们对客观世界的认识提高到了一个新水平。

今日的科学不仅要处理那些必然发生的事情,还要处理那些最可能发生的事情。人们主观思维和认识对象中的不确定性,构成了我们新的认识方式与思维方式的核心,不确定性的存在不影响科学的发展和繁荣,相反,离开不确定性会导致科学本身不能进步。美国著名科学家波拉克在其畅销作品《不确定的科学与不确定的世界》中写道:“科学会因为不确定性而衰弱吗?恰恰相反,许多科学的成功正是由于科学家在追求知识的过程中学会了利用不确定性。不确定性非但不是阻碍科学前行的障碍,而且是推动科学进步的动力。”自1926年海森堡提出著名的不确定性原理以后,不确定性理论在科学探索中显示出了其强大的力量。例如,将不确定原理应用于宇宙学,人们据此推断出宇宙中存在着“暗物质”(在我们的星球和其他星系中存在着比我们肉眼看到的多得多的物质);将不确定性原理应用于宏观研究领域,美国斯坦福大学著名创新研究专家罗森伯格认为,在考虑科学技术与文化时,不确定性起了支配作用;将不确定性原理应用于经济日本著名学者野中郁次郎认为,在当前的经济环境中,不确定性是唯一可确定的因素;将不确定原理应用于管理,形成了名叫“不确定性管理”的一种新模式,以适应瞬息万变的市场。英国著名科学家马修斯在2003年5月的《焦点》月刊上发表了《不可思议的世界》一文,他在文中指出:“此时此刻,在你周围比原子还小的粒子正在不断出现(生成)又消失,它们凭空产生(生成),又转瞬即逝。你可能不知道它们的存在,但如果没有它们,无论是你还是整个宇宙都将不复存在,你应该庆幸它们的存在。它们被称为虚粒,是所有科学中意义最深刻,也是最匪夷所思的理论——不确定性原理”的推理之一。

1.两种对立的科学观:机械决定论与辩证唯物论

确定性与不确定性揭示和反映了事物发展变化过程中必然与偶然、清晰与模糊、精确与近似之间的关系。确定性是指客观事物联系和发展过程中有规律的、必然的、精确的属性。不确定性是指客观事物联系和发展过程中无序的、偶然的、模糊的属性。确定性与不确定性既有本质区别,又有内在联系,两者之间的关系是辩证统一的。

长期以来,必然性与偶然性之间的关系,形成了两种对立的科学观。

一种是机械决定论的观点,认为必然性统治着宇宙的一切。所谓必然性,是物质运动的因果关系的规律性的体现。在决定论者看来,无论是自然现象还是人的思维都被包罗万象的必然的因果关系所决定。昨日种种,是今日种种的原因,明天种种,是今日种种的结果。宇宙间每一件事物之所以出现,之所以按这种方式出现而不按另一种方式出现,都是因为宇宙本身不过是一条无穷的原因和结果所组成的锁链,因此,确定论者完全否定了偶然性。

在牛顿力学中,用微分方程表示的力学规律的根本特性是确定性和必然性。它的解单值地取决于初始条件。只要给定初始条件,根据运动方程,就可以确定地计算出系统在过去和未来任何时刻的状态,并做出准确的预言。这样,力学规律就具有严格的可确定性和可重复性,被看作是自然界一切因果联系的最普遍、最基本的形式,从而形成了机械确定论的观点。这种观点把宇宙描述成一个结构严密的确定性机器,一切都是按照某种定律精确地发生的,未来的一切都是由过去的一切严格确定的。18世纪的科学家拉普拉斯说“没有什么不是确定的,未来一如过去,都呈现在我的眼前。”如果人们接受了拉普拉斯的观点,那么随机过程和偶然性就不存在。在这种世界观下,人们知道得越多,不确定性越少。从理论上说,只要知道的足够多,就能消除所有的不确定性。这样一来,岂不是像黑格尔所说的那样,“在自然界中从来没有什么新事物”?正是这种决定论为我们描述了一个被动的、僵死的世界,使人们失去了一切创造性,也妨碍了一切革新。这与人类追求自由、向往改革、进行创造的精神相违背,也与人类的目标和本性相违背。

另一种是主观唯心主义的观点。这种观点从根本上否认了原因与结果之间的必然联系,把宏观的必然性看成是主观的信念与习惯。火烧了手会使人感到疼痛,这不能说明火与疼痛之间有因果关系,只能说明两件事之间存在一定的次序,火只是能引起疼痛的标记而已。从主观唯心主义的立场来反对决定论的,在西方哲学中还有唯意志主义、存在主义等。它们的基本观点认为,支配世界的是一系列的偶然性,历史是一系列个人偶然事件的堆积。但是,这并不意味着严格的自然规律不存在。

的确,在宏观世界中存在必然性占统治地位的领域,最明显的例子是天体运行,它是由严格的因果关系所支配的。人类很早就掌握了四季变化,月亮盈亏的规律,甚至能精确地预报日食月食彗星的出现。

两种对立的科学观给人们以启示:是不是世界上有些事情是必然的,又有一些事情是偶然的呢?

回答是肯定的。辩证唯物主义认为,客观世界中既存在必然性也存在偶然性。必然性与偶然性既有区别又有联系,必然性存在于偶然性之中,并通过偶然性为自己开辟道路。

那么,必然性与偶然性是如何区别,又如何联系的呢?为什么偶然性能够为必然性开辟道路呢?必然性能不能也为偶然性开辟道路呢?数学研究的进展为上述问题提供了有益的回答。

2.不确定性的数学描述

在自然界和人类社会活动中所遇到的各种现象,大体上可以分为两大类:确定性现象和不确定性现象。

所谓确定性现象是指,在一定条件下必然会出现的现象。例如,同性电荷相互排斥;在标准大气压下,纯水加热到100℃就会沸腾等。

为了回答确定性问题,数学家提供了动力系统的方法,按照这个方法研究那些严格地遵从因果关系的系统,即所谓的确定性系统。

对确定性系统的数学描述,大家较为熟悉的一个例子就是迭代方程。如果某个系统服从确定性的因果关系,那么,它明天的状态Y与今天的状态X之间就有一个确定性的关系。在数学上就叫作Y是X的函数:

Y=F(X)。

这个关系式既可以表示今天和明天的状态之间的联系,也可以表示昨天和今天、明天和后天的状态之间的联系。如果Z是系统后天的状态,那么根据上面的关系式便有

Z=F(Y)=F(F(X)),

而大后天的状态则是

W=F(F(F(X)))。

一般说,n天之后的状态可以用函数F的n次迭代表示:

Xn=Fn(X)。

迭代运算是完全确定的。一个简单的例子就是存钱中利息的问题,人们把x元钱存入银行,然后按照与银行间的约定,按年(月或日)计算利息即可。用计算机进行迭代运算特别方便,在一个固定的计算机程序中,给定一个初始值,其计算出的结果又能被当成初始值,继续进行下一步运算,反复多次,完全不用人操心。因此,自从有了计算机,确定性系统的迭代模型在自然科学工程技术管理科学领域获得了广泛的应用。

描述确定性现象的数学方法,可以是代数方程、微分方程、积分方程、网络图等。这种方法实际上就是经典数学方法。

为了研究自然界和人类社会活动中的不确定性现象,不确定性数学也相应发展了起来。

1654年,法国数学家巴斯卡(Blaise Pascal)发表了第1篇概率论文,标志着数学的应用范围从精确领域扩大到了随机领域;1965年,美国控制论专家扎德(Lotfi Aliasker Zadeh)创立了模糊集合论,标志着数学的应用范围又从随机领域进入了模糊领域;1982年波兰数学家帕夫拉克(Zdzislaw Pawlak)提出了粗糙集理论,将数学的应用范围更进一步地延伸到了不完备、不一致信息处理的新天地。可以说,数学发展史上所创立的随机理论、模糊理论和粗糙集理论是分析处理不确定性问题的3个里程碑。

综上所述,我们把不确定性归结为3类:随机性、模糊性和粗糙性,然后运用相应的数学方法去处理。

对于随机现象,数学家提供了概率论数理统计方法,我们按照这个方法去处理那些偶然性占统治地位的系统——随机系统。

所谓随机性现象,是指即使条件完全相同,所产生的结果往往也不尽相同,或不完全确定。人们把钱存入银行能得到利息,是确定无疑的,这是必然现象;但是用钱买彩票,能不能中奖,是不确定的,这是随机现象。

以抛硬币为例。掷一枚硬币出现正面还是反面是偶然的。即使硬币是绝对的均匀,我们也找不出任何理由断言它该出现正面还是反面。如果只掷两次,可能有4种结果:(正,正);(正,反);(反,正);(反,反)。

两次结果相同的概率为,正与反各占一半的概率也是。如果掷1 000次呢,每次都相同的概率只有,实际上我们无法观察到这种现象,而正与反大体上各占一半是必然会发生的。

由此可见,微观的偶然性集中起来,抵消了种种相互矛盾的因素之后,呈现出来的是宏观上的必然性。于是我们得到这样的结论:必然性存在于偶然性之中,偶然产生必然。

当涉及人类系统的行为或处理与人类系统的行为相似的复杂系统时,确定性、随机性的处理方法不再十分有效。例如,清早起来某人说一声“今天天气很好”,所有人都能明白,但计算机却不能明白。因为“很好”是一个模糊的概念,它不是简单的对事物的绝对肯定或否定,而是介于两者之间的,以二值逻辑为基础的计算机是无法理解的。由于人类思维的显著特点是具有模糊性,它是人类自然语言的本质属性,因此,这就给计算机和人脑之间造成了一条无形的鸿沟,使人-机之间的接口受到阻碍。为了准确地表达大脑思维中的模糊性,同时又让计算机能够理解,人们把常常使用的模糊语言设计成计算机能够接收的指令和程序(机器语言),以便计算机能像人脑那样简捷灵活地做出相应的推理和判断,这就需要研究另一种不确定性——模糊性。人们按照模糊集合论提供的方法,研究那些模糊性占统治地位的系统——模糊系统。

在现实世界中还存在着大量不完备、不精确的知识(或信息),在知识不完备的情况下,人脑可以相应地做出比计算机更快速、更精确的判断,但基于传统的信息处理方法,一旦遇到信息缺损或不完全时人脑的认知能力会急剧降低。比如,某个事物本来应该由属性a1,a2,a3来描述,但是由于目前观察条件有限,我们只能得到属性a1,a2的信息,这些信息不能完全描述这个事物。粗糙集的建立,为人们处理知识不完全、不精确的系统——粗糙系统提供了一种新的数学工具。

综上所述,随机性、模糊性和粗糙性这3种不确定性有如下描述。

(1)随机性

随机性是指事物本身是确定的,但因为事物的因果关系是不确定的,从而导致事件结果的不确定性。例如,骰子的6个点都是确定的,但掷出后朝上的点是不确定的。不确定性用“概率”来度量,概率表示事件发生的可能性的大小。概率的客观意义可以由随机试验中所呈现的频率的稳定性来承担。概率论的运用是从随机性中把握广义的因果律——概率规律。

(2)模糊性

模糊性是指事物本身是不确定的,它在质上没有明确的含义,在量上没有明确的界限,导致事物呈现出“亦此亦彼”的状态,是事物类属的不确定性,但事件发生的结果是确定的。例如,要在一个连队中挑选出一个高个子、红脸膛的战士,“多高”“多红”是模糊的、不确定的,但肯定可以找出一个来,这一点是确定的。模糊的不确定性用“隶属度”来度量。隶属度表示事物有多大程度属于某一类。隶属度的具体确定包含人的某种主观因素。模糊集合论的运用则是从模糊性中去确立广义的排中律——隶属规律。

随机性是因果律的一种破缺,而模糊性则是排中律的一种破缺。

(3)粗糙性

粗糙性是指由于描述事件的知识(或信息)不充分、不完全,从而导致的事件间的不可分辨性。粗糙集把那些不可分辨的事件都归属到一个边界域,因此,粗糙集中的不确定性是基于一个边界的概念,当边界域为空集时,则问题就变为确定性的了。粗糙集认为知识的粒度性是造成使用已有知识不能精确地表示某些概念(事件、对象等)的原因。在没有掌握所有关于对象域的知识的情况下,我们只能用一对近似集来刻画不精确性或含糊性。

粗糙集理论基于知识的不可分辨性,而模糊集理论则侧重于知识的模糊性。不可分辨性和模糊性实际上是不完全知识的两个不同的侧面,因此,粗糙集和模糊集并不是互相对立的理论,它们是互补的。从集合论的观点来看,粗糙集既是经典集合的延拓,又是模糊集合的补充。

经典集合认为一个集合完全由其元素所决定,一个元素要么属于这个集合,要么不属于这个集合,只有“真”与“假”之分。经典集合的隶属函数采用的是二值逻辑,μA(x)∈{0,1},因此只能处理确定性问题。

模糊集合认为事物具有中介过渡性质,而非突然改变,集合中元素的隶属函数为μA(x)∈[0,1],即隶属函数是连续光滑的,在闭区间[0,1]内可以任意取值,因此,模糊集合对不确定信息的刻画是细而充分的,但其隶属函数不可计算,只能凭人的主观经验给定。

粗糙集合把用于分类的知识引入集合。一个元素x是否属于集合X,需要根据现有的知识来判断,可分为3种情况:

(1)x肯定属于X;

(2)x肯定不属于X;

(3)x可能属于也可能不属于X。

到底属于哪种情况依赖于我们所掌握的关于论域的知识,上述3种情况分别对应于粗糙的正区域、负区域和边界域,因此,我们大体上可认为粗糙集是一种三值逻辑(正区域、负区域、边界域)。粗糙集的隶属函数为阶梯状,它对不确定性信息的描述是粗糙的,但粗糙隶属函数是可以计算的。粗糙集主要用于对信息系统进行约简和分类。

模糊集研究的是属于同一类的不同对象的隶属关系,重在隶属的程度。粗糙集研究的是不同类中的对象所组成的集合之间的关系,重在分类。两种方法在处理不完善数据方面可以互为补充。

3种集合的隶属函数如图4.1所示。

图4.1 隶属函数示意图

必须指出,同一种不确定现象可以从不同的角度去研究,采用不同的处理方法,而不是将其局限地定义为某一种不确定性,因为不确定性本身是复杂的。例如,考虑这样一个问题:西安到北京的路程有多远?由于观测的不充分会引起以下3种不确定性:

(1)若我们用某一种方法去测量,得到一系列的样本值,那么由于测量过程中存在着各种误差,因此路程就可以被看成是一个随机变量

(2)若人们凭主观判断认为,西安到北京大约有1 000 km,那么路程则是一个模糊变量;

(3)若我们根据某一部分信息可以确定路程至少为1 000 km,至多为1 500 km,或者至多为1 200 km,那么路程则又可以被看成是一个粗糙变量。

在实际应用中,系统中所呈现出的信息通常不是单式信息,而是含有两种或多种不确定性信息。比如,随机模糊性、随机粗糙性、粗糙模糊性等。这时就要运用两种或两种以上不确定性信息的综合处理方法。

3.随机不确定性的数学处理方法

在自然界的生产生活中,存在着大量的随机现象。比如,每期体育彩票的中奖号码、同一条生产线所生产的灯泡的寿命、路面结构的某些未来的属性(如强度、变形、使用年限等)、火灾会在何处、何时发生等都具有随机性。随机现象所产生的结果的不确定性,是受多种因素的影响而造成的,但它们在客观上却遵循一定的规律。正如恩格斯所说:“在表面上是偶然性起作用的地方,这种偶然性始终是受内部的隐蔽着的规律支配的,而问题只是在于发现这些规律。”我们把这种由大量同类随机现象所呈现出来的集体规律性,叫作统计规律性。概率论与数理统计学就是在数量上研究随机现象内在规律的数学分支。

概率论产生于17世纪,是由赌博问题引起的。直到20世纪初,俄罗斯数学家柯尔莫哥洛夫发现了将集合论和测度论应用到概率论的方法,才使概率论建立在了坚固的数学基础上,并赋予了概率论严密性。

概率论根据大量的随机现象的统计规律,对随机现象出现某一结果的可能性做出一种科学的判断,对这种可能性的大小做出数量上的描述,并比较这些可能性的大小,研究它们之间的联系,从而形成一整套数学理论和方法。

现在概率论的应用极其广泛:根据某个部件及备用构件出现故障的似然性来估计核反应堆的安全性;在设计电话网络时,用概率论来决定网络的容量是否能够处理预期的流量;卫生部门的官员在推荐(或不推荐)公众使用某种疫苗时,他们的决定部分来自概率分析。

19世纪,统计学伴随着概率论的发展而发展起来。统计学运用概率论的理论来研究大量随机现象的规律,对通过科学安排的一定数量的实验所得到的统计方法给出严格的理论证明,并判定各种方法应用的条件,以及方法、公式、结论的可靠程度和局限性,使我们能通过一组样本来判定是否能以相当大的概率来保证某一判断是正确的,并可以控制发生错误的概率。

统计规律的实质是概率性的,它涉及自然界的随机现象。在研究物质运动时,由于分子数目很大,我们没有必要也不太可能去求解每个分子的运动轨迹,通常运用概率统计方法,求运动着的大量分子的各种数据的平均值。总而言之,首先统计学打破了确定性规律独霸天下的局面;其次,统计学的提出也直接冲击了因果决定论。因为统计规律使得由前一状态产生的结果不是完全确定的,所以单值的因果链条就不存在了。

从系统科学的角度来看,统计规律是由大量子系统组成的复杂系统所满足的规律,整个系统的行为可以用一些宏观参量来刻画,但同时个别子系统仍然可以遵循一定的动力学规律。

统计学是数据的艺术和科学。在统计学中,人们通过收集、整理、描述、分析和推理,以达到发现新知识的目的。当人们应用统计方法去解决一个实际问题时,一般需要经过以下几个步骤:建立数学模型、收集和整理数据、进行统计推断、预测和决策。

(1)模型的选择与建立。在数理统计中,模型是指关于所研究的总体的某种假定,一般是给总体分布规定一定的类型(如正态分布型)。建立模型要依赖于概率知识、与所研究的问题相关的专业知识、以往的经验,以及从总体中抽取的样本数据。

(2)数据的收集。收集数据的方式可分为全面观测、抽样观测和安排特定的实验3种。全面观测又称普查,即对总体中每个个体都加以观测,然后测定所需要的指标。抽样观测又称为抽查,是指从总体中抽取一部分,测定其相关的指标值。这方面的研究构成了数理统计的一个分支,叫作抽样理论。安排特定的实验以收集数据,这些特定的实验具有代表性,并使所得数据便于分析。这里所包含的数学问题构成了数理统计的又一个分支,即实验设计。

(3)数据的整理。数据整理的目的是把包含在数据中的有用信息提取出来。一种形式是制定适当的图表(如散点图),以反映隐含在数据中的粗略规律或一般趋势;另一种形式是计算若干数字特征,如样本均值,样本方差等统计量,以刻画样本某些方面的性质。

(4)统计推断。根据总体模型及由总体抽出的样本,做出有关总体分布的某种推断。数据的收集和整理是进行统计推断的必要准备,统计推断是数理统计的主要任务。

(5)统计预测。统计预测的对象是随机变量在未来某个时刻所取得的值,或设想在某种条件下对该变量进行观测时将取得的值。例如,预测某种商品在未来3年内的销售量,某个10岁男孩在3年后的身高、体重等。

(6)统计决策。依据所做的统计推断或预测,并考虑到行动的后果而制定的一种行动方案。其目的是使损失尽可能小,或反过来说,使收益尽可能大。

统计学与其他数学学科的区别如下。

(1)由于随机现象的统计规律是一种集体规律,必须在大量同类随机现象中才能呈现出来,所以,观察、试验、调查是概率统计这门学科的研究基石,但是作为数学学科的一个分支,它依然具有本学科的定义、公理、定理。这些定义、公理、定理来自自然界的随机规律,但定义、公理、定理本身都是确定的,不存在任何随机性。

(2)在概率统计中,使用的是“由部分推断全体”的统计推断方法。这是因为它的研究对象——随机现象的范围是很大的,我们在进行试验、观测的时候,不可能也不必要对研究对象一一进行研究,但是研究部分资料所得到的结论,要在全体研究对象范围内都具有可靠性。

(3)随机现象的随机性是针对试验、调查之前来说的,而在得出结果之后,对于每一次试验它只可能得出这些不确定结果中某一确定结果,因此,在研究一种现象时,我们应当注意在试验前能不能找出这一现象本身的内在规律。

4.模糊不确定性的数学处理方法

现代科学有一个基本信条:对于一种现象,未经定量描述,就谈不上彻底地理解。而人类的思维活动,在面对自然现象和人间百态时,首先给出的是定性描述。例如,大小、强弱、好坏、冷热、高矮、胖瘦、美丑等都是对事物的定性描述,我们难以明确地划定界限。即使带有数字的语言,例如,一本万利、三头六臂、四分五裂、五花八门、七上八下、十万八千里等都作为模糊数词使用。这究竟模糊到了什么程度?有什么规律?在什么范围内使用?计算机是无法理解的,只有对话的双方可以理解。总之,人类的生活环境基本上是一个模糊的环境。在人类的社会活动中,人们经常接触各种模糊事物,接受各种模糊信息,随时需要对模糊现象进行识别、推理并做出决策。

为了分析和处理模糊现象,突破精确数学的框架,美国加利福尼亚大学控制论专家扎德创立了模糊集合论,标志着一门新兴数学——模糊数学的诞生,从而实现了对另一类不确定性(不同于随机不确定性)现象的科学处理,这是在数学方法上的重大突破。

模糊数学有一个关键概念是隶属度。隶属度函数是这样定义的:假设论域U={x}的模糊集合为A,对于U中任意元素x属于A的程度用μA(x)来表征,μA(x)可以在闭区间[0,1]上取值,则称μA(x)是A的隶属度函数,或称元素x对A的隶属度。

例如,扎德曾给出“年老”的隶属函数。他将论域取为U=[0,100],用A表示模糊集合,其隶属函数为

(www.xing528.com)

经计算得到这说明年龄60岁时,属于“年老”的隶属度为80%,而年龄为70时,属于“年老”的隶属度达到94%。

μA(60)=0.8,

μA(70)=0.94。

如何建立隶属度函数?目前仍无统一的方法,人们主要根据经验来进行对应法则的探求。其标准在于是否符合客观规律。运用模糊数学方法处理模糊不确定性的问题,表现出了鲜明的辩证思想,具体反映在如下5个方面。

1)确定性与模糊性

确定性与模糊性既相互对应、相互独立,又相互联系、相互补充,并在一定条件下相互转化。精确性也是相对的(如存在测不准原理)。模糊数学把现实世界中的精确事物和模糊事物联系起来,体现了人们从数量方面认识事物的精确性与模糊性的辩证统一。

2)特殊性与一般性

模糊数学将数学从描述清晰的量拓广到描述模糊的量。普通集合与模糊集合之间的关系,可通过特征函数与隶属函数之间的关系来刻画。当隶属函数的值域取[0,1]闭区间的端点,即取0或1时,隶属函数便退化为特征函数,模糊子集也就退化为普通集合。普通集合是模糊集合的特殊形式,而模糊集合是普通集合的拓广,是普通集合的一般形式。

3)非此即彼与亦此亦彼

模糊数学认识到对立事物的“非此即彼”的精确形态,又认识到对立事物的发展往往要经过一个“亦此亦彼”的中介过渡形态。

在经典集合中,对于任意元素x和集合A,要么x∈A,要么x∉A,两者必居其一且只居其一。这种关系属于二值的、绝对化的,是对清晰事物类属关系的科学抽象,刻画了清晰事物要么具有某种性态,要么不具有某种性态的非此即彼的特征。

模糊集合把元素属于集合的概念模糊化,承认论域上存在非完全属于集合、又非完全不属于该集合的元素,变绝对的属于概念为相对属于的概念,引入隶属度,把属于概念数量化,承认论域上的不同元素对同一集合有不同的隶属度(年老的例子)。

4)客观性与抽象性

模糊数学如同精确数学一样,是对客观世界抽象思维的结果。正是由于客观世界存在大量模糊现象,所以才有模糊数学的诞生。模糊数学就是用模糊关系这一数学模型来描写事物之间的联系的。在隶属度函数之后,模糊数学又形象地提出用模糊矩阵及一系列运算来处理模糊关系,进而又引入了模糊图等数学手段。

5)划分性与综合性

客观世界中千差万别的事物混在一起,如果没有划分、没有聚类,我们就不能认识世界,便没有了判断和思维。实践中所遇到的划分有硬划分和软划分。多数属于软划分,即模糊划分。为了研究和处理模糊划分,人们提出了模糊聚类分析方法。

当前学科之间的相互渗透是一个很大的特点。所谓学科渗透就是指一个学科领域中的思想、原理、方法,应用或移植到另一个科学领域中去,综合渗透学科双方的某些属性,特别是一些优点,从而获得新的发现和新的领域。

模糊数学的应用至少有以下几个领域。

(1)模拟人类的智能。它广泛应用于智能控制、模式识别和机器学习等。

(2)建立人类活动系统的模型。它灵活应用于社会、经济中的风险分析、环境评定、市场选择、综合评价、事故预报等。

(3)作为人-机联系装置,开发人-机自然交互、知识工程。

5.粗糙不确定性的数学处理方法

在现实世界中存在着大量不确定知识(或信息),知识的不确定性主要来自两个方面:

(1)认知对象之间缺乏足够的区分度;

(2)对象集合存在不确定性。

这里对集合的不确定有两种解释:一是按照模糊集理论的观点,集合中的成员对集合的隶属度可以从0到1变化,用隶属度函数来描述对象与集合间的不确定性;另一种解释是由于知识存在颗粒性,使得我们无法区分属于同一粒度范围内的对象,如果某个集合覆盖了某一粒度范围内的一个对象,那么这一粒度范围内的其他对象也可能属于该集合。按照粗糙集理论的观点,我们对对象的认识程度取决于我们拥有的知识的多少,知识越多,知识的粒度就越小,对象间的区分就越精细;知识越少,知识的粒度越大,对象间的区分就越模糊。但知识的粒度不是越小越好。粒度过于精细,会造成知识冗余和低效。

1)粗糙集的基本概念

(1)知识与分类

在粗糙集理论中,知识被认为是一种分类能力。人们的行为本质上是一种分辨现实或抽象事物能力。如在远古时代,人们为了生存必须要能辨别出什么可以食用,什么不可以食用;医生给病人诊断,必须辨别出患者得的是哪一种病。这些根据事物的特征差别将其分门别类的能力均可以看作是某种知识。在更抽象层上的分类是推理、学习、决策的关键,是一种基础知识。

假定我们起初对论域内的对象(或称元素、样本、个体)已经具备必要的信息或知识,通过这些知识能够将其划分到不同的类别。若我们对两个对象所掌握的信息相同,则它们是不可区分的,即根据已有的信息不能将它们划分开来,显然它们之间是一种等价关系。粗糙集理论的核心是等价关系,通常用等价关系来代替分类。根据这个等价关系将样本集合划分为等价类,进而,求出所需的最小等价关系集合,称为约简。

(2)不可分辨关系

在粗糙集中,论域U中的对象可用多种信息(知识)来描述。如表4.1中的医疗信息,U中的对象是病人,病人可以由他们发病的症状(条件属性)来描述。当两个不同的对象由相同的属性来描述时,这两个对象在该系统中就被归于同一类,它们之间的关系称为不可分辨关系(indiscernibility relation)。即对于任意属性子集B⊆R,如果对象xi,xj∈U,∀r∈B,当且仅当f(xi,r)=f(xj,r)时,xi和xj是不可分辨的,简记为Ind(B)。不可分辨关系称为等价关系(equivalence relation)。

表4.1 医疗信息表

我们对不可分辨关系(或等价关系)做进一步解释。假设只用黑白2种颜色把空间中的一些物体划分成黑色物体和白色物体2类,那么同为黑色的物体就是不可分辨的,因为用于描述它们的特征属性的信息是相同的,都是黑色。如果又引入“方、圆”的属性,那么,我们可以进一步将物体划分为4类:黑色方、黑色圆、白色方、白色圆。这时,如有2个同为黑色方的物体,则它们还是不可分辨的,而2个同为白色圆的物体间的不可分辨关系可以理解为它们在白、圆2种属性下存在等价关系。

不可分辨关系在粗糙集理论中十分重要,它反映了我们对世界的观察的粗糙性。若2个对象分别处于Ind(B)的不同划分中,那么它们就可以为现有的知识所分辨;若2个对象分别处于同一划分中,那么它们就不能为现有的知识所分辨。另一方面,不可分辨关系反映了论域知识的颗粒性,即通过现有的知识我们往往不能精确地认识每一个对象,属性相同的对象聚合在一起以颗粒的状态呈现在我们面前,彼此无法分辨开来。

(3)基本集合

由论域中相互不可分辨的对象所组成的集合称为基本集合,它是组成论域知识的颗粒。

在上面的医疗信息表中,考虑条件属性:头痛和肌肉痛。对于x1、x2和x3这3个对象,其条件属性头痛的值都是“是”,条件属性肌肉痛的值也都是“是”,因此,从条件属性头痛和肌肉痛的角度来看,这3个对象是不可分辨的。同样,x4和x6在这两个属性上也是不可分辨的。由此构成的不可分辨集{x1,x2,x3},{x4,x6}和{x5}都称为基本集合。

由此,基本集合定义为:论域U是有限集,R是U的等价关系集,则K={U,R}称为知识库,若有B⊆R且B≠∅,则∩B(B中全部等价关系的交集)也是一种等价关系,我们称其为B上的不可分辨关系,记为Ind(B)。若{xi,xj}∈Ind(B),则称xi与xj是B不可分辨的,即xi和xj存在于不可分辨关系Ind(B)的同一等价类中。依据等价关系簇B形成的分类知识,xi与xj无法区分。Ind(B)中的各类等价关系被称为B基本集,基本集是粗糙集中构成知识的基本模块。

一般来说,知识库中的知识越多,知识的粒度就越小,随着新知识不断加入知识库中,粒度会不断减小,直至将每个对象区分开来,但知识库中的知识粒度并不是越小越好,粒度小必然导致知识量的增大,储存知识的费用也会增高。

(4)下近似集和上近似集

下近似集(lower approximation)定义为根据现有知识R,判断U中所有肯定属于X的对象所组成的集合,即

R-(X)={x∈U,[x]R⊆X},

其中[x]R表示等价关系的下包含元素x的等价类。

上近似集(upper approximation)定义为根据现有知识R,判断U中一定属于和可能属于X的对象所组成的集合,即

R-(X)={x∈U,[x]R∩X≠∅}

综上所述,可以给出下近似集和上近似集的定义:给定知识库K={U,R},对于每一个样本集X⊆U和等价关系R,所有包含于X的基本集的并(逻辑和)为R-(X);所有X的交(逻辑积)不为空集的基本集合的并为R-(X)。

(5)正域、负域和边界域

正域(positive region):Pos(X)=R-(X),即根据知识R,U中能完全确定地归入集合X的元素的集合。

负域(negative region):Neg(X)=U-R-(X),即根据知识R,U中不能确定一定属于集合X的元素的集合,它们是属于X的补集。

边界域(boundary region):Bnd(X)=R-(X)-R-(X),边界域是某种意义上论域的不确定域,根据知识R,U中既不是肯定属于集合X,又不是肯定属于集合(即U—X)的元素构成的集合。

边界域为集合X的上近似与下近似之差,如果Bnd(X)是空集,则称X关于R是清晰的;反之如果Bnd(X)不是空集,则称集合X关于R是粗糙的。因此,粗糙集中的粗糙(不确定性)主要体现在边界域的存在。集合X的边界域越大,其确定程度就越小。

(6)粗糙度(近似精确度)

对于知识R(即属性子集),样本子集X的不确定程度可以用粗糙度αR(X)来表示:

αR(X)亦称近似精确度,式中Card表示集合的基数(集合中元素的个数)。

显然0≤αR(X)≤1,如果αR(X)=1,则称集合X相对于R是确定的,如果αR(X)<1则称集合X相对于R是粗糙的,αR(X)可认为是在等价关系R下逼近集合X的精度。

以医疗信息表(表4.1)为例,对于属性子集R={头痛,肌肉痛}={r1,r2},计算样本子集X={x1,x2,x5}的上近似集、下近似集、正域、边界域。

解 ①计算论域U的所有R基本集。

U|Ind(R)={{x1,x2,x3},{x4,x6},{x5}},

令R1={x1,x2,x3},R2={x4,x6},R3={x5}。

②确定样本集与基本集的关系。

X∩R1={x1,x2}≠∅,

X∩R2=∅,

X∩R3={x5}≠∅。

③计算R-(X)、R-(X),Pos(X)和Bnd(X)。

R-(X)=R1∪R3={x1,x2,x3,x5},

R-(X)=R3={x5},

Pos(X)=R-(X)={x5},

Bnd(X)=R-(X)-R-(X)={x1,x2,x3}。

④计算近似精确度。

从近似精度的计算,我们了解粗糙集的知识不确定性是通过近似集的计算来获得的,而不是人为指定的,知识的不确定性是通过计算来确定的。这与很多不确定理论不同,并不需要先验知识或预先提供所要分析数据之外的精确值来代表不确定性,而是通过概念化来获得不确定知识。

2)粗糙集的基本思想

粗糙集理论的基本思想可以概括为以下几点。

(1)粗糙集(rough set)理论,简称RS理论,认为知识就是将论域中的对象进行分类的能力,人们对对象的认识程度取决于其所拥有的知识的多少,知识越多,则分类能力越强,知识越少,对象之间的区分越模糊。

从数学角度来看,RS理论反映出人类以不完全信息或知识去处理不分明现象,以及依据观察、度量到的某些不确定的信息去对数据进行分析和对未知的信息进行估计预测的能力。

(2)在没有掌握所有关于对象域的知识的情况下,为了刻画模糊性,RS使用了一对下近似与上近似的精确概念来表示每个不精确概念,也就是使用一对逼近来描述对象域上的集合。下近似与上近似之差是一个边界集合,它包含了所有不能被确切判定是否属于给定类的对象。这种处理可以定义近似的精确度,能够很好地近似分类。

(3)在RS中,论域中的对象可用多种知识来描述(通常描述为属性),当2个不同的对象由相同的属性来描述时,这2个对象在该系统中被归于同一类,它们的关系称为不可分辨关系或等价关系。不可分辨关系是RS理论的基石,它反映了论域知识的颗粒性。由于知识的颗粒性,我们通过现有的知识往往不能精确地认识每一个对象,属性相同的对象聚合在一起以颗粒的状态呈现在我们面前,彼此无法分辨开来。若知识的粒度过大,则对象得不到有效的区分;若粒度过于精细,则造成知识冗余和低效。

(4)影响分类能力的属性很多,不同的属性重要程度不同,其中某些属性起决定性作用,属性取值不同对分类能力也会产生不同影响。RS理论提出了知识的约简方法,在保留基本知识、对对象分类的能力不变的基础上,消除重复、冗余的属性和属性值,实现了对知识的压缩和再提炼。RS理论以知识的约简为核心,减少结构化数据的维数,从而达到简化数据集合的目的。

3)粗糙集的基本特点

RS的基本方法是使用等价关系将集合中的元素(对象)进行分类,生成集合的某种划分,与等价关系相对应。根据等价关系的理论,同一分类(等价类)中的元素是不可分辨的,对信息的处理可以在等价类的粒度上进行,由此可以达到对信息进行简化的目的。RS是一种基于集合论的针对不确定信息的处理方法,它具有以下基本特点。

(1)RS是一种软计算(soft computing)方法。传统的知识处理是一种硬计算(hard computing)方法,使用精确、固定和不变的算法来表达和求解问题,而软计算方法则允许利用不精确性、不确定性和部分真实性以得到易于处理、鲁棒性强和成本低的解决方案,以便更好地与现实系统相协调。

(2)RS仅仅从数据本身进行分析,无须提供所要分析的样本数据之外的任何先验知识或附加信息,不需要预先给出主观评价,如统计学中要假定概率分布,模糊集中要给定隶属度函数,证据理论中要赋予似然值等。

(3)RS能分析各种数据,包括确定性的和非确定性的、不精确的和不完整的,以及拥有众多变量的数据,并能对数据进行简化,从而发现知识,推理决策规则。它不仅是一种决策方法,还是一种系统建模方法。系统模型是由求出的一种决策规则来表达的,因此,利用该组系统特性的表达公式来建立系统模型,我们可以进行系统预测、控制和决策分析等。

(4)RS与其他不确定方法一样,它们都是处理含糊性和不确定性的数学工具,但是它们又有不同之处:在主观Bages中,不确定性被看成概率;在D/S证据理论中,不确定性是可信度;在模糊集理论中,不确定性是集合的隶属度;在RS理论中,不确定性是上下近似集之差集,有确定的数学公式来描述,所以含糊元素的个数是可以计算出来的,这就使得边界域具有清晰的数学意义,大大减少了算法设计的随意性。

尽管RS理论对知识的不完全性处理具有优势,但由于RS理论本身未包含处理不精确或不确定的原始数据的机制,单纯使用RS理论,不一定能有效地描述不精确或不确定的实际问题,所以实际应用时,RS理论常常需要与其他方法结合起来使用,互为补充,相得益彰。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈