物理学上有了著名的“测不准原理”。用海森堡的话说:“在因果律的陈述中,即‘若确切地知道现在,就能预见未来’,所错误的并不是结论,而是前提。我们不能知道现在的所有细节,是一种原则性的事情。”在社会测量中,“测不准原理”也同样适用,因为很多社会现象比物理现象更难测量。在社会空间数据的采集过程中,会出现偏差。一般认为,社会时空数据的误差可分为源误差、处理误差和输出误差,即数据采集和录入中产生的误差、对社会时空数据进行处理时产生的误差以及数据输出过程产生的误差。这三类主要的误差是社会时空数据采集过程中存在的误差,三类加起来就构成了社会时空数据的总误差。可见,所谓社会时空数据的误差是指在数据采集过程中各种误差的统称。若要减少和空间社会时空数据的误差,就需要从数据采集全流程进行管理和质量控制,确保数据采集全流程都是尽可能的高质量,从而尽可能减少每个环节上的误差产生的可能性,最终实现数据采集全流程上的总误差最小。社会空间数据的源误差是指与数据源有关的所有误差,这类误差对于数据质量具有深远的影响力,会通过数据分析过程而持续影响后面的分析结论和判断,因此,是社会时空数据质量控制的重要环节。当社会时空数据采集的源头出现了误差,那么,这种误差具有累计效应,源误差会随着数据分析和处理而被放大。因此,要提高社会时空数据质量,首先要尽可能控制和减少源误差。
在社会时空数据处理过程中,也会产生相应的误差。社会时空数据一般都是需要把社会数据和地理空间数据进行匹配,而地图数据则是最常用的空间数据。当测绘后制作成地图,这个过程就可能存在误差,即测绘过程中的误差。当把地图进行数字化,无论通过手工的还是扫描的数据化方式,地图转化为数据过程中的误差不可避免会产生。通过卫星遥感获得的社会空间数据,在图像压缩、数据分析和判读分析、影像存储、影像增强、处理、量化、空间滤波以及影像模式识别等过程都可能产生误差。此外,通过数字摄影测量技术获取社会时空数据,尽管具有速度快、效率高且能获得最新动态数据等优点,但通过摄影测量采集数据会产生两大主要误差,即像点误差与定向的误差。所谓的像点误差,是指在进行绝对定向前各种系统误差与偶然误差的综合误差。所谓的定向误差包括相对定向和绝对定向的误差,在数据建模和计算过程中,本身就存在估算的过程。上述这些误差,在社会空间数据的采集过程的不同环节会出现,需要有针对性地去控制,尽可能减少各类误差出现的概率。(www.xing528.com)
在社会时空数据分析过程中,也往往会产生误差。选取何种变量以及采用何种分析模型,都会产生对应的误差。任何实证模型,都是对现实中的客观存在的社会空间进行模拟,对于社会时空中的社会关系发展规律进行假设,通过实证研究来检验这些假设是否成立。在此基础上,获得基本的研究结论。但是,任何实证模型,都具有残差项,而残差往往被认为是误差的观测值。这种实证模型方法,本身就已经承认了模型分析过程中的误差的存在,并且需要进一步对误差进行分析,利用残差所提供的信息,来考察模型假设的合理性及数据的可靠性,即所谓的残差分析。对于减少社会时空数据分析的误差而言,残差分析显得尤为重要。实证模型结果得到的残差,往往本身就具有空间结构和空间特征,因此,不能简单就用传统的回归模型进行实证分析,否则会产生分析误差。因此,空间计量学的研究者就提出了新的数据分析方法,就是空间误差回归模型。这种回归模型在分析社会空间数据的同时,还要对残差进行分析,揭示残差中的空间结构和空间影响,从而减少社会时空数据分析过程中的空间误差(Bivand 2002)。这是数据分析过程中的误差,采用正确的实证模型以及选择合适的变量,都有助于减少这类误差。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。