在一些昆虫的种群(如蚂蚁种群)巢穴中,幼虫按照其大小被分拣聚类(corpse clustering and brood sorting),形成体型较小的幼虫在中央,体型较大的幼虫在巢穴的边缘的模式[44]。这一分拣聚类模式是依靠每个昆虫个体根据整个种群的整体需求和其所处的当前环境,单独选择和执行捡起幼虫、放下幼虫的实现。而通过对其抽象、概括、提炼、总结、归纳,即可以建立分拣聚类计算机仿生隐喻。此隐喻可以天然地运用于数据的聚类分析(clustering)。聚类分析(本书4.3节中阐述)执行的恰是将相似的数据放在一起的操作。
分拣聚类计算机仿生隐喻有两大基础模型。一是德纳堡(Deneubourg)等[45]建构的基本模型(Basic Model,BM)。在此模型中,物体(如幼虫、数据等)随机地分布在整个区域。蚂蚁是否要捡起和放下物体是根据当前物体与其周边物体的相似度来决定的。
Ppu=(k+/(k++f))2
Pd0=(f/(k-+f))2
如上述第一个公式所示,蚂蚁捡起某一物体的概率是Ppu,k+是捡起一个物体的阈值,函数f用于判断该物体与周边物体相似度(其取值在0到k+之间)。从第一个公式可以发现,若一物体周边的物体与其都不相同(即f值较小),那么其被捡起的概率就较大。这亦包括该物体周边完全没有其他物体的情况。
如上述第二个公式所示,蚂蚁放下某一物体的概率是Pd。,k-是放下一个物体的阈值,函数f的定义与第一个公式的定义一致。从第二个公式可以发现,若当前物体与周边的物体相似度较大(即f值较大),那么其被放下的概率就较大。
二是分拣聚类计算机仿生隐喻的基础模型是卢默尔(Lumer)等[46]建构的标准蚂蚁聚类算法(Standard Ant Clustering Algorithm,SACA)。
蚂蚁捡起一物体oi的概率由上述第一个公式描述,放下该物体的概率由上述第二个公式描述。f(oi)表征的是当前物体oi与周边物体的相似度。在蚂蚁行进的过程中,其同时维护一份最近放下物体的地点。蚂蚁将倾向于将物品放置到近期放下过物品的位置。
自从上述两大分拣聚类计算机仿生隐喻模型被建构出来之后,就不断有研究者对其进行改进,包含:(1)改变蚂蚁感知周边的灵敏度[47];(2)单个蚂蚁可以同时捡起和放下的物体的个数[48];(3)蚂蚁行进的方向[49];(4)蚂蚁可以持有物体的时间[50]等。(www.xing528.com)
正是因为分拣聚类计算机仿生隐喻具有天然的聚类特性,已被运用于数据挖掘(如传播数据的聚类分析)[51]和图区隔分析(如社交网络中的社群发现)[52]。与常规的非监督式机器学习的聚类相比,其具有诸多优势:
(1)其能够自动决定相似数据形成簇(cluster)的个数。在常用的基于非监督式机器学习的数据聚类分析(如K-means)之中,确定数据簇的个数往往是一个难点,需要基于人类智能进行指定,为客观的额数据分析带来强烈的主观影响。
(2)其对数据当中的异常数据(outliers)能够具有鲁棒性[53]。换而言之,其能够进行异常数据较多的数据聚类分析。这也恰是常用的基于非监督式机器学习的数据聚类分析的另一个难以解决的难点。
(3)其具有非常明显的自组织(self-organization)和去中心化(decentralization)的特点[54],十分适应对当下移动互联网时代传播数据的挖掘分析。
(4)不需要对数据的预先了解(prior information),可谓“来之能战,战之能胜”。
(5)分拣聚类计算机仿生隐喻在进行聚类分析时,具有线性的扩展性(scales linearly)[55],非常适合处理高维度的数据。
分拣聚类计算机仿生隐喻生成的解决方案,不仅可以运用于全部与聚类分析相关的传播学研究和应用实践,还可以以其智能生成的独特模式启发包括新媒体艺术、生成艺术在内的传播讯息的塑造。本书4.3节阐述的非监督式机器学习的新塑传实践新模式解决方案皆可以基于分拣聚类计算机仿生隐喻被建构出来。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。