到目前为止我们对流的分析很大程度上是从测量和观察活动的角度来进行的,如出行、移民、信息流等。例如伦敦上班行程矩阵,是从全面人口普查记录中观察到的流中提取出来的,尽管我们用上一章中的引力模型可能预测到这种流模式,但要假设其中所包含的网络不存在。然而,从更一般的意义上来说,当我们检验感兴趣对象之间的连接时,我们也关注基于其他对象或它们的属性会如何解释这种连接。如何提取连接及其模式构成了多变量分析的核心,而且有可能从网络结构方面了解对象之间的关联。我们将在此处探讨这一观点,因为它代表了一种观察网络的间接有力的方法,让我们可以通过改变解释对象间连接如何建立的已有观点,来对网络进行分类。
我们将从定义一个对象或元素集{Yi,i=1,2,…,N}开始,以及一个属性集{Xk,k=1,2,…,M},从中我们注意到每个对象i都与一个属性k通过一系列的连接或联系相关联,可以定义为NxM矩阵{Aik}。我们可以在对象和它们的属性之间生成不同的比较,可以在比较对象的过程中通过比较属性中的共同元素或对共同元素进行计数,或者在比较属性的过程中比较对象。对象可以是位置,那么位置之间的共同元素可以看作流。就位置的属性而言,那些可能是位置特性的属性,共性更可能是这些特性在不同位置之间的比较。让我们假设,不对共同元素进行计数,而是对它们的分布进行比较。我们通过把元素相乘来实现这一比较。首先,我们可以建立矩阵Fij用于对象之间的比较
每个元素Fij是具有属性k的对象i和对象j的分布的被乘数。从方程3.4中我们可以看出该矩阵是对称的;即Fij=Fji;这意味着边缘、行和列的总和相等:
对于相同位置的属性可以进行一个相似但相反的比较,通过建立属性比较矩阵Hkℓ
同样是对称的,且行与列的总和相等。总体理念是在这些连接、网络中进行上述可以提取或生成的比较,我们会在后续章节中广泛地用到这些概念。这里我们不对矩阵符号进行介绍,但稍后我们会在更详细介绍这些概念的时候提到。(www.xing528.com)
这种类型的比较有两种变体。一是考虑到数值大小,乘法比较可能需要通过某种方式标准化,我们马上会讲到这点。但对于关系矩阵{Aik}来说,我们有可能将其分割成整数或二进制形式再进行比较,这也可以看作标准化的一种形式。一旦成功,我们也可以用同样的方式对矩阵{Fij}分割,然后就可以通过不同的图形分析来寻找与这类连接相关的模式和步骤。替换矩阵{Hkℓ}也可以同样处理,这样我们就可以得到大量可用于流和网络分析的可能结构。
基于这种方法,最粗浅的比较是计算对象和它们的属性之间的不同相互关系。为了描绘任意两个对象i和j的属性分布的关系ρij,也称为皮尔森积差相关(Pearson product-moment correlation),我们从相应观察中减去平均值,建立每个对象的协方差,然后除以各自标准差。其形式为
这比方程3.4中的通用形式更好,可以被分割并形成多种多样不同的流系统或网络。当然,相关系数在-1到+1之间,而且如果除了强度以外不需要其他关联标志,那么系数可以取平方值(尽管这会造成变化幅度方面的不同解释)。也存在其他形式的相关关系,但我们在这里只强调,很多从数据提取模式和结构的多变量分析往往可以用网络来解释。在这些情况下,我们的方法简单而有效。下面我们将要开始探索二部图,其中基础的对象起点-属性矩阵实际上是与这一图形相关的流矩阵,从而向这些关系赋予实质性内容。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。