首页 理论教育 数据可视化:让数据更生动

数据可视化:让数据更生动

时间:2023-06-27 理论教育 版权反馈
【摘要】:在计算机视觉领域,数据可视化是对数据的一种形象直观的解释,实现从不同维度观察数据,从而得到更有价值的信息。数据可视化的目的,是对数据进行可视化处理,以更明确、有效地传递信息。数据可视化是为了从数据中寻找三个方面的信息:模式、关系和异常。

数据可视化:让数据更生动

近年来,随着大数据时代的到来,面对越来越复杂的数据,数据可视化已经成为各个领域传递信息的重要手段。数据可视化也可以理解为一个生成图形、图像符号的过程。人类对图形、图像等可视化符号的处理效率要比对数字、文本的处理效率高很多。有研究表明,绝大部分视觉信号处理过程发生在人脑潜意识阶段,例如,人们在观看包含自己的集体照时,通常潜意识会第一时间寻找照片中的自己,然后才会寻找其他感兴趣的目标。更为深层次的理解是,可视化是人类思维认知强化的过程,即人脑通过人眼观察某个具体图形、图像来感知某个抽象事物,这个过程是一个强化认知的理解过程。因此,帮助人们理解事物规律是数据可视化的最终目标,而绘制的可视化结果只是可视化的过程表现。

在计算机视觉领域,数据可视化是对数据的一种形象直观的解释,实现从不同维度观察数据,从而得到更有价值的信息。数据可视化将抽象的、复杂的、不易理解的数据转化为人眼可识别的图形、图像、符号、颜色、纹理等,这些转化后的数据通常具备较高的识别效率,能够有效地传达出数据本身所包含的有用信息。

数据可视化的目的,是对数据进行可视化处理,以更明确、有效地传递信息。比起枯燥乏味的数值,人类能够更好更快地认识大小、位置、形状、颜色深浅等物体的外在直观表现。经过可视化之后的数据能够加深人们对数据的理解记忆。

例如,对于这样一个问题:如果额外给你1万美元现金,你会选择如何使用它?美国投资机构针对三个年龄段的本土公民做出的调研结果如图5-1所示。

图5-1 不同年龄的人如何进行投资

由图5-1可以看出,偿还债务是得票率最高的选项,这显然与美国发达的信贷市场和消费结构有关。其中,公民的年龄段越大,还款意愿就越强。除了还款,55岁以上的美国人还比较倾向于低风险的理财项目,如选择高息储蓄或购买债券,或者把钱直接存入退休金账户。我们还可以看到,不动产也是较受美国人欢迎的投资项目之一,其中年轻人的买房欲望相对而言是最高的。(www.xing528.com)

由此可见,将数据经过图形化展示后,人们可以从可视化的图形中直观地获取更有效的信息。

数据可视化是为了从数据中寻找三个方面的信息:模式、关系和异常。

(1)模式。模式指数据中的规律。例如,机场每月的旅客人数都不一样,通过几年的数据对比,发现旅客人数存在周期性的变化,某些月份的旅客数量一直偏低,某些月份的旅客数量则一直偏高。

(2)关系。关系指数据之间的相关性,通常代表关联性因果关系。无论数据的总量和复杂程度如何大,数据间的关系大多可分为三类:数据间的比较、数据的构成、数据的分布或联系。例如,关于收入水平与幸福感之间的关系是否成正比,经统计,对于月收入1万元以下的人来说,一旦收入增加,幸福感会随之提升,但对于月收入水平在1万元以上的人来说,幸福感并不会随着收入水平的提高而提升,这种非线性关系也是一种关系。

(3)异常。异常指有问题的数据。异常的数据不一定都是错误的数据,有些异常数据可能是设备出错或者人为错误输入,有些可能就是正确的数据。通过异常分析,用户可以及时发现各种异常情况。如图5-2所示,图中大部分点都集中一个区域,极少数点分散在其他区域,这些都属于异常值,需要特殊处理。

图5-2 异常值

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈