运营人的数据看板应该如何选择图表
前言
一份数据可视化分析报告,往往要考虑很多方面,从数据的处理,到分析方法的确定,图表类型的选择,报告整体的设计等,在这个过程中,我们经常会遇到一些问题:
1、数据质量问题。数据不准确、数据表多而乱,有效信息有时存储在多个表中,又格式混乱;
2、数据在手,但不知道如何入手分析。各种分析方法在实际数据面前用不上;
3、图表不会选不会用。各种图表类型眼花缭乱,选择全凭感觉,做出来效果单一
之前我们讲了数据分析的思路应该如何建立,那图表制作上遇到的最大的痛点,往往是不会正确选择图表,来准确表达数据背后的问题。实际分析中,当数据量较大时,我们很少直接通过原始数据直接观察数据的变化或问题,所以我们借助不同图表的展现形式,来帮助我们发现问题。
不同的图表类型的选择一般需要依据2点:
1、熟悉不同图表表现的数据关系
总的来说,分为对比、关系、构成、分布四大类
2、明确数据想表达的信息
在前期整理数据时,需要对数据关系和逻辑有一定的把握,如何建立数据分析思维,这一点我们之前讲到过,后续会继续分享如何建立业务思维。
一、对比类
当数据中存在不同分类、不同时间段时,我们可以选择对比类图表,对比类图表可以通过图形长度、宽度、面积、颜色等来实现对比效果
雷达图:
雷达图是一种显示多变量数据的图形方法,可以用来在变量间进行对比,或者查看变量中有没有异常。另外,也可以像示例图中,在多幅雷达图之间或者雷达图的多层数据线之间,进行总体数值情况的对比。
不适用的场景:分类过多的数据;数据不能在统一程度上标准化的情况
折线图:
折线图是最常用的图表类型之一,常用来表示数值随连续时间间隔或有序类别的变化,适合用在数据项较多的非周期性数据中,当数据项较少时,更适合用到下面说到的—柱状图
不适用的场景:横轴数据节点过多,且数据波动大,导致不能形成清晰折线,如下图2
图2: 不适用场景
柱状图:
最基础的柱形图,需要一个分类变量和一个数值变量,在实际分析中也可以根据不同分组,添加对比维度
条形图:
条形图是通过横向摆放的数据条的长短,来展现数据关系,普通条形图的表现和柱状图差别不大,所以我们这里重点讲下堆积条形图
堆积条形图中,可以通过设置不同颜色,清晰的区分出,同一维度下,不同类别的数值对比。
二、关系类
关系类图表展示的是多维度数据之间的关系,例如数据的流向,常用层级或位置设置来展现,可以根据数据间的关系是基于流程或变量来选择不同图表。
桑基图:
桑基图可以描述数据之间的流向,分支的宽度代表了数据流量的大小。适合表现分配情况、归类情况,以及变化和流动情况
漏斗图:
桑基图是多流程的表现,而漏斗图是用于单流程的数据分析,在数据间有逻辑关系且依次减少时适用。
气泡图/散点图:
基于不同变量进行分析时,可以考虑气泡图和散点图。散点图是将所有的数据以点的形式展现在平面直角坐标系上的统计图表,需要x/y两个变量,而气泡图则是通过气泡大小增加了一个变量。
三、构成类
构成类图表用于变现数据之间有所属关系,分总关系,其中占比类图表应用最多。
饼图:
饼图是通过扇形面积、弧长来表示数据的分类和占比的图表,使用时需注意:
1、分类数量最好小于5个
2、各不同分类间的占比差异明显。
3、最好是其中有一部分占比较高
环图:
环图的适用场景和饼图类似,可以表现数据的分类和占比,区别是会把占比最大的数据放在中间,更加突出重点数据。
和饼图类似,环图适用于其中一项数据占比较高的情况下。
堆积图:
堆积图是在普通面积图的基础上,将不同数据项一层层堆叠起来,既能看到各数据系列的走势,又能看到整体的规模和不同数据项的占比情况
堆积图可以描述数据的走势,所以适合随时间变化的数据,另外数据分类建议少于7个。
不适用场景:x轴为分类数据;带有负值的数据;数据分类过多的情况
词云图:
词云图通过排列关键词,并根据文字大小来展现关键词占比情况
适合有明显占比较高的关键词分析
旭日图:
旭日图是一种父子级构成类图表,可以表现层级数据,离原点越近,数据的层级越高,也就是说内层是外层的“父”,父级弧线对应的外层是它的“子”,通过环形嵌套,来表现数据间的构成和数据的大小关系。
瀑布图:
瀑布图是采用绝对值与相对值结合的方式,适用于表达数个特定数值之间的数量变化关系 。能够在反映数据多少的同时,更能直观地反映出数据的增减变化过程
四、分布类
分布类图表主要表现数据在不同维度上的分布情况,例如地理空间上的分布、数据范围内的分布等。
地图类:
地图:表现数据在地理空间位置上的分布情况,结合数据,可以选择多种不同表现形式的图,例如热力图、气泡地图、柱状/饼图和地图的结合、3D柱状地图等。
直方图:
直方图是表现数据在不同数据范围内分布的图表类型,用横轴表示数据区间,纵轴表示分布情况,柱子越高,则落在该区间的数量越大。
需要注意的是直方图和柱状图的区别:
箱线图:
又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理,快速识别异常值。
图形往往比文字能更好的表达动态的效果,了解图表的使用场景和不同图表展现的数据关系,有助于我们更好的表达数据背后的问题,使我们做的数据看板让领导看的懂,看的清楚。
-END-