数据可视化是关于数据的视觉表现形式的科学技术研究。其中,这种数据的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。
我们常见的那些柱状图、饼图、直方图、散点图等是最原始的统计图表,也是数据可视化最基础、最常见的应用。图4-1所示为数据可视化的常见表现形式,其中就包括了柱状图、饼图等多种统计图表。因此,可以看出使用它们可以快速认识数据,同时传达了数据中的信息。
图4-1 数据可视化
因为这些原始统计图表只能呈现基本的信息,所以当面对复杂或大规模结构化、半结构化和非结构化数据时,数据可视化的流程要复杂很多,具体实现的流程如图4-2所示。
图4-2 大数据可视化实现的流程(www.xing528.com)
其具体描述是:首先要经历包括数据采集、数据分析、数据管理、数据挖掘在内的一系列复杂数据处理;然后由设计师设计一种表现形式,如立体的、二维的、动态的、实时的或者交互的;最终由工程师创建对应的可视化算法及技术实现手段,包括建模方法、处理大规模数据的体系架构、交互技术等。一个大数据可视化作品或项目的创建,需要多领域专业人士的协同工作才能取得成功。
所以,大数据可视化可以理解为数据量更加庞大、结构更加复杂的数据可视化。例如图4-3展示的是非洲大型哺乳动物种群的稳定性和濒危状况。图中面朝左边的动物数量正在不断减少,而面朝右边的动物状况则比较稳定,其中有些动物的数量还有所增加。因此,在数据急剧增加的背景下,数据可视化将推动大数据更为广泛的应用就显得尤为重要。
图4-3 非洲大型哺乳动物种群的稳定性和濒危状况
综合以上描述,现将大数据可视化与数据可视化做以下比较,如表4-1所示。
表4-1 大数据可视化与数据可视化的比较
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。