首页 理论教育 抗体编码方案对土地利用现状数据库的影响

抗体编码方案对土地利用现状数据库的影响

时间:2023-05-18 理论教育 版权反馈
【摘要】:在生物学中,遗传基因是抗体A中的ai,其可能取值与采用的编码方式有关,也称为等位基因。抗体的编码方式有多种,主要包括:二进制编码、符号编码、浮点数编码、特征序列编码等。结合土地利用现状数据库的建库标准,本模型不是对所有的地类进行编码,而是根据本书2.5.2中表2-4的土地利用演化规则进行整理后直接用二进制编码,这样可以简化数据聚类,提高算法的执行效率。

抗体编码方案对土地利用现状数据库的影响

在生物学中,遗传基因抗体A中的ai,其可能取值与采用的编码方式有关,也称为等位基因。一般将抗体位串分为m段,每段长度为li,每段分别表示变量xi∈[di,ui],i=1,2,…,m。

抗体的编码方式有多种,主要包括:二进制编码、符号编码、浮点数编码、特征序列编码等。一般说来浮点数编码适用于处理变量是连续的问题;符号编码不存在基因操作后产生无效码,但是在具体使用时,要认真设计基因操作;采用二进制编码时,需要反复地进行解码,并且码串太长,但它有一个重要优点是简便且易于操作。在土地用途分区中土地利用的图斑是聚类的对象,虽然要处理一些变量是连续的问题,但是还存在大量类属型数据,在设计基因操作的过程中有一定的困难,因此可以借助二进制编码的简便易操作的优点来处理复杂数据的问题。

基于多目标优化的土地用途分区可以转换为聚类目标函数。在基于CICSA的模糊聚类算法中,可以定义聚类的目标就是要获得关于区域内土地利用图斑X的一个模糊划分矩阵(分区)W和聚类的原型p。已知W和p是相关的,即可以通过二者中的其一求得另一个值的解。因此可令一组聚类原型p就是一个抗体,把原型中的k组特征(属性)连接起来,根据各自的取值范围,就可以将其量化值(用二进制串表示,也可以使用其他的编码方式)编码成一个抗体,并将其用于空间聚类:

其中,参数集依据每个原型pi(1≤i≤k)取值。由于土地用途分区中处理的是混合特征数据,所以在抗体中,对数值型特征(包括可以离散化的连续型数值数据和有序的类属型数据)可以采用一定的方式进行编码。对无序的类属特征数据,它们可以直接编码到抗体中,而不需要量化,比如可以用一比特位的字符变量表示一个类属特征,但在进行亲和度的测度的时候需要定义类属型数据之间的亲疏关系。

假设每个聚类的原型具有t个参数,其中数值型和类属型的参数分别为m和t-m个,如果采用256级对每一个数值型参数进行编码,则每个抗体由长度由8×m×k+(t-m)个比特位的串组成。使用这种方式进行编码,当量化级越多其精度越高,但是计算量也就越大。这种编码方案的最重要的优点在于原型参数的数目只与t以及类数k有关,而与待聚类的图斑数量无关,因而搜索空间往往较小(李洁,2006)。在实际的应用中可以使用不同的编码方法对原型的m×k个数值型参数进行编码。本模型采用简单并易于操作的二进制编码,这种方式虽然要反复解码,但是由于土地用途分区中的聚类原型较少,因此在处理大量的图斑数据的时候还是相对比较有效的。

(1)数值型属性编码

设某数值型参数V的编码范围为[Vmin,Vmax],采用Gary码对区间[Vmin,Vmax]编码,即由[0,255]表示[Vmin,Vmax]。当某一8比特Gray码得到其对应数值i时,则它对应的数值型参数V取值为:

(www.xing528.com)

(2)类属型属性编码

根据土地利用现状分类(过渡期)(表2-1)可以将类属型属性进行编码。结合土地利用现状数据库的建库标准,本模型不是对所有的地类进行编码,而是根据本书2.5.2中表2-4的土地利用演化规则进行整理后直接用二进制编码,这样可以简化数据聚类,提高算法的执行效率。特别地,对于二进制代码采用如下译码方式:

通过编码抗体种群空间为:

式中,正整数n称为抗体的种群规模,抗体群A=[A1,A2,…,An]为抗体A的n元组,是抗体群空间In的一个点。定义问题(P)的全局最优解集为:

对于抗体种群A,表示抗体种群A中包含的最优解个数。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈