统计图表是最早的数据可视化形式之一,作为基本的可视化元素仍然被广泛使用。对很多复杂的大型可视化系统而言,这类图表更是不可或缺的基本组成元素。
基本的可视化图表按照其所呈现的信息和视觉复杂程度可以分为三类:原始数据绘图、简单统计值标绘和多视图协调关联。
数据可视化基本图表有:数据轨迹、柱形图、折线图、直方图、饼图、走势图、散点图、气泡图、维恩图、热力图和雷达图等。
1.数据轨迹
数据轨迹是一种标准的单变量数据呈现方法:x轴显示自变量,y轴显示因变量。数据轨迹可直观地呈现数据分布、离群值、均值的偏移等。图5-11所示为某股票随时间的价格趋势图。
图5-11 某股票随时间的价格趋势图
2.柱形图
采用长方形的形状和颜色编码数据的属性。柱形图的每根直柱内部也可以用像素图方式编码,这种柱形图称为堆叠柱形图。图5-12所示柱形图为2013—2017年国内生产总值及其增长率。
3.折线图
排列在工作表的列或行中的数据可以绘制到折线图中。折线图可以显示随时间而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。图5-13所示为全年温度折线图。
4.直方图
直方图是对数据集中某个数据属性的频率统计。直方图的各个部分之和等于单位整体,而柱形图的各个部分之和则没有限制,这是两者的主要区别。图5-14所示为我国某高校学生体重(kg)的频率分布直方图。
图5-12 柱形图
图5-13 全年温度折线图
图5-14 直方图
5.饼图
饼图采用环状方式呈现各分量在整体中的比例。由于人眼对面积的大小不敏感,当饼图各个分量比例相差不大时,应用柱形图替代饼图。图5-15所示为2017年全国居民人均消费支出及其构成,采用饼图的形式,用户就能够直观地看出各个消费部分的占比。
图5-15 饼图
6.走势图(www.xing528.com)
走势图是一种紧凑、简洁的数据趋势表达方式,它通常以折线图为基础,往往直接嵌入在文本或表格中。走势图使用高度密集的折线图表达方式来展示数据随某一变量的变化趋势。图5-16所示为北京地区2014年8月至2015年9月的房价走势图。
图5-16 走势图
7.散点图
散点图是表示二维数据的标准方法。在散点图中,所有数据以点的形式出现在笛卡儿坐标系中,每个点所对应的横、纵坐标分别代表该数据在坐标轴上的属性值大小。图5-17所示为快递的单票成本与单票收入统计,每个散点代表一个快递站点,横坐标表示该快递站点每个快递的平均成本,纵坐标表示该快递站点每个快递的平均收入,不同的颜色代表快递站所属的区域。
图5-17 散点图
8.气泡图
气泡图是散点图的一种变形,通过每个点的面积大小来表示第三维。如果为气泡图加上不同的颜色,气泡图就可以用来表示四维数据。图5-18所示为某产品在三个地区的销售统计,该图直观地显示出B地区的销售额最高,且增长率也最高。
图5-18 气泡图
9.维恩图
维恩图使用平面上的封闭图形来表示数据集合之间的关系。每个封闭图形代表一个数据集合,图形之间的交叠部分代表集合间的交集,图形外的部分代表不属于该集合的数据部分,如图5-19所示。
图5-19 维恩图
10.热力图
热力图使用颜色来表达位置相关的二维数值数据大小。这些数据常以矩阵或方格形式排列,或在地图上按一定位置关系排列,每个数据点都可以使用颜色编码数值。图5-20所示为我国2018年11月4个一线城市的深夜出行人数热力图,颜色越深,范围越大,则表明深夜出行人数越多。很明显,从图中可以看出,北京深夜出行人数最多。
图5-20 热力图
11.雷达图
雷达图又称为戴布拉图、蜘蛛网图,适用于多维数据,且每个维度必须可以排序。图5-21所示为某初中期末考试的得分统计信息。
图5-21 雷达图
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。