1.数据可视化的作用
数据可视化的作用包括记录信息、分析推理、信息传播与协同等。
1)记录信息
自古以来,记录信息的有效方式之一是用图形的方式描述各种具体或抽象的事物。如图5-3所示,图(a)是列奥纳多·达·芬奇绘制的人体解剖图,图(b)是自然史博物学家威廉·柯蒂斯绘制的植物图,图(c)是1616年伽利略关于月亮周期的绘图,该图记录了月亮在一定时间内的变化。
2)分析推理
数据可视化极大地降低了数据理解的复杂度,有效地提升了信息认知的效率,从而有助于人们更快地分析和推理出有效信息。1854年,伦敦爆发了一场霍乱,医生John Snow通过绘制街区地图分析了霍乱患者的分布与水井分布之间的关系,发现在一口井的供水范围内患者明显偏多,据此找到了霍乱爆发的根源——被污染的水泵。
图5-3 记录信息
3)信息传播与协同
图5-4是介绍中国烟民数量的图形,如果只看图(a),可知中国烟民的数量是3 200 000,这个数据是很大的,但具体有多大读者不能直接感知。结合图5-4(b)可知,中国烟民数量超过了美国人口总和,通过这种对比,对数据的感知就加深了。
图5-4 中国烟民数量
随着计算机技术的普及,数据无论从数量上还是从维度层次上都变得日益繁杂。面对海量而又复杂的数据,各个科研机构和商业组织普遍遇到以下问题:
(1)大量数据不能有效利用,弃之可惜,想用却不知如何下手。(www.xing528.com)
(2)数据展示模式繁杂晦涩,无法快速甄别有效信息。
数据可视化就是将海量数据经过抽取、加工、提炼,通过可视化方式展示出来,改变传统的文字描述识别模式,达到更高效地掌握重要信息和了解重要细节的目的。数据可视化在大数据分析中的优势主要体现在以下几个方面:
(1)动作更快。使用图表来总结复杂的数据,可确保对关系的理解要比那些混乱的报告或电子表格更快。可视化提供了一种非常清晰的交互方式,从而能够使用户更快地理解和处理这些信息。
(2)以建设性方式提供结果。大数据可视化能够用一些简短的图形描述复杂的信息。通过可交互的图表界面,轻松地理解各种不同类型的数据。例如,许多企业通过收集消费者行为数据,再使用大数据可视化来监控关键指标,从而更容易发现各种市场变化和趋势。例如,一家服装企业发现,在西南地区,深色西装和领带的销量正在上升,这促使该企业在全国范围内推销这两类产品。通过这种策略,这家企业的产品销量远远领先于那些尚未注意到这一潮流的竞争对手。
(3)理解数据之间的联系。在市场竞争环境中,找到业务和市场之间的相关性是至关重要的。例如,一家软件公司的销售总监在条形图中看到,他们的旗舰产品在西南地区的销售额下降了8%,销售总监开始深入地了解问题出现在哪里,并着手制订改进计划。通过这种方式,数据可视化可以让管理人员立即发现问题并采取行动。
2.数据可视化的分类
数据可视化的处理对象是数据。根据所处理的数据对象的不同,数据可视化可分为科学可视化与信息可视化两类。
1)科学可视化
科学可视化是可视化领域发展最早、最成熟的一个学科,其应用领域包括物理、化学、气象气候、航空航天、医学、生物学等各个学科,涉及对这些学科中数据和模型的解释、操作与处理,旨在寻找其中的模式、特点、关系以及异常情况。
科学可视化的基础理论与方法已经相对成熟,其中有一些方法已广泛应用于各个领域。最简单的科学可视化方法是颜色映射法,它将不同的值映射成不同的颜色。科学可视化方法还包括轮廓法,轮廓法是将数值等于某一指定阈值的点连接起来的可视化方法,地图上的等高线、天气预报中的等温线都是典型的轮廓可视化的例子。
2)信息可视化
与科学可视化相比,信息可视化的数据更贴近我们的生活与工作,包括地理信息可视化、时变数据可视化、层次数据可视化、网络数据可视化、非结构化数据可视化等。
我们常见的地图是地理信息数据,属于信息可视化的范畴。时变数据可视化采用多视角、数据比较等方法体现数据随时间变化的趋势和规律。在层次数据可视化中,层次数据表达各个个体间的层次关系。树图是层次数据可视化的典型案例,它是对现实世界事物关系的抽象,其数据本身是具有层次结构的信息。在网络结构数据可视化中,网络数据不具备层次结构,关系更加复杂和自由,如人与人之间的关系、城市道路连接、科研论文的引用等。非结构化数据可视化通常是将非结构化数据转化为结构化数据再进行可视化显示。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。