一文读懂数据分析如何正确地使用图表分析?
最近发现了一个令人惊喜的现象:连小卖铺阿姨都用上可视化图表了!
但又出现了新的糟糕情况:大多数人都用错了图表!
比如:对比不同地区各种产品的销售情况。
你是不是觉得用饼图很合理?还能看出不同产品在某一城市中的销售占比?
错了呀!大错特错!怎么能用饼图来做对比呢!
睁大眼睛学学,下面才是正确示范:
有问题就要解决,那老李就给大家讲一讲各种图表的用法,以免大家在吹嘘自己会可视化的时候被人揪出来说:“你这图表用错了!”
有效图表特征
首先,我们要弄清楚,什么叫做有效的图表。我归纳了三个特征:
(1)传达正确、必要的数据信息。
(2)易于理解,信息量足但不过分。
(3)在展示清晰的前提下尽可能美观。
确定图表分类
接着,我们来看看图表的分类。
这张图大家应该都见过,毕竟做数据分析,经常会出现脑子里充满了绝妙的想法,但一到展现的时候就两手一摊,不知道该用什么。建议掏出这张陈年旧图,一个一个对照,总有一个能给你启发。
具体讲解图表用法
如果还觉得有些难以捉摸,那我挑了10种常用图表的最简形式,跟大家细细展开说。
(1)柱形图
柱形图主要用于表示数据量的大小并进行比较,还能较快找到最大值、最小值。
优点:清晰直观,很容易看出数据差距,比较大小。
缺点:分类太多就没办法展示数据特点。
(2)折线图
折线图主要用于显示随时间或有序类别变化的趋势。
优点:能够显示数量大小,还能看出变化趋势。
缺点:无序的数据无法展示数据特点。
(3)散点图
散点图主要用于分析数据系列中各数值之间的关系。
优点:大量数据情况下能直观反应变量之间的关系。
缺点:看上去很乱,也只能从相关、分布和聚合三个角度看。而且数据量小的时候,观察不出东西。
(4)气泡图
气泡图主要用于展示三个变量之间的关系,在散点图基础上第三个变量就用气泡大小表示。
优点:大量数据情况下能直观反应变量之间的关系,适合三维数据对比。
缺点:看上去很乱,也只能从相关、分布和聚合三个角度看。而且数据量小的时候,观察不出东西。
(5)饼图
饼图主要用于展示各类占比情况。
优点:直观,清晰显示分布情况。
缺点:分类多的情况下,比较难观察。
(6)漏斗图
漏斗图主要用于展示固定业务流程中上个环节与下一个环节的差异。
优点:直观展示每个环节比例关系,便于进行流程优化。
缺点:必须有固定流程。
(7)词云图
词云图主要用于展示大量文本数据,比如产品的用户画像、搜索引擎关键词搜索情况。
优点:根据关键词的大小直观地展示数据频率,便于找出最大特点。
缺点:无法直观地展示数据的变化规律,词量太少或太类似就无法起到分析效果。
(8)雷达图
雷达图主要用于多维度展示性能、经营状况、身体状况等。
优点:清晰展示多个关键特征,便于整体分析。
缺点:不宜维度过多。
(9)甘特图
甘特图主要用于展示任务进展情况,可用来评估工作完成情况,也可以表示机器状态等。
优点:展示直观、易于理解。
缺点:仅反映项目管理的时间、成本、范围三重约束。
(10)热力地图
热力地图主要用于分析带有地理位置的数据,并且主要是汇总信息。
优点:和地图相结合,通过颜色深浅、气泡大小等容易判断度量的大小,能够直观反应分析点。
缺点:必须有地理信息,气泡容易叠加,数据不精确。
最后,希望大家在做图表的时候问自己三个问题,需要用图表吗?用什么类型的图表?展示清晰吗?