【数据篇】我要这数据有何用—数据的基本概念
查理芒格说:“在商业社会,不懂数学的人,就是在独腿走路”。在互联网公司,如果你不懂数据,还敢开口说话吗?数据的重要性无需再强调,没有数据的结论,就像是一块水豆腐,看着方正,经不起任何目光的打量。
如今我们不缺数据,甚至有点数据泛滥。互联网已经将我们的生活数据化。如何使用才是我们的目的。我们需要加强的是对数据的理解和背后因果关系的洞察,这就是数据分析的本质。
实际工作中,很多同学拿着大把数据,却不知如何下手。不禁仰天一声长叹,我要这数据有何用?
来来,我们这就来聊一下运营工作中的数据分析该怎么去做?
分开说,这次先聊一下基础的内容,包括数据分析的基本作业方法、数据分析在工作中的应用场景以及运营工作中数据的分类;后面我们再聊具体的分析方法,以及分析工具。
上面已经提到过,数据分析表面上是对数据的整理,实际是对因果关系的处理。
所以当你开始做一份数据分析,无论数据有多残缺,分析方法有多少逻辑上的漏洞,都一定要输出相应的结论。一定要这样,才会不断的进步;
关于数据分析,致远老师曾经做过一个比喻:“做数据就像是在体检”。体检选择套餐就是在做数据规划;拿到体检报告就是在做数据;通过体检发现身体哪个地方有问题,并找到了改善方法,这就是数据分析并得出了相应的结论;迭代动作之后不断的跟进改善之后的数据。
致远老师的这个例子写出了数据分析的基本流程
数据规划->数据收集->数据分析->驱动方法
一、数据在运营工作中的使用场景
我们来把这个流程更加细化一点,和实际的运营工作结合起来。对于运营来讲,需要做数据分析的基本来源于三方面。
1、对日常业务进行数据监测
这是我们和数据打交道最频率最高的事件了,主要目的是为了及时发现业务中的一些大的变动,找出相应的原因。对于这类业务,我们首先需要有一个数据模型,来实现对异常的监测。这类数据分析的做法通常是:
分解业务模型->设定关键数据指标->关键数据对比->得出相应结论
2、分析工作中的异常现象
工作中会有一些突发的异常数据情况需要我们进行处理,比如说订单的断崖式下滑或者急剧增长;某个地域新用户进入减少;这些都需要我们快速分析出原因,并给出解决方案。通常这类数据的做法是:
明确具体问题->做出相应假设->选出关键数据->拆分关键指标->得出结论->迭代方法。
这类的数据处理比较复杂一点,最重要的是要明确具体问题。我对这类数据分析的作业习惯通常是先用txt写一个简单的分析思路出来,包括问题是什么?相应的猜测是什么?具体的分析思路是?可能会用到的数据是哪些?如果更加复杂的数据处理,建议写个xmind。
3、利用数据进行决策
工作中还有一种类型,需要用到数据,那就是决策。比如说ROI的拆解,活动可行性的分析、以及其他一些需要进行数据决策的东西。这类的数据我们通常是根据已有的数据去推测未来的发展趋势。 经常会用的方法就是
数据维度拆分->数据取样->估测->叠加
之所以把各个流程细化到具体的工作场景,是因为对于数据分析来讲,能够清楚的认识到问题,并且选择了正确的数据维度是整个数据分析中最关键的两步。
二、运营数据的纵与横
下面我们就要讲一下数据分析过程中选取哪些数据?以及这些数据代表了什么含义?
对于新手运营来讲,总感觉数据有很多,每个都有用。一头扎进数据里面,结果什么也没有捞出来。运营数据可以从横纵两个方向进行划分。
以横来讲,可以分为:用户数据、行为数据以及业务数据;
以纵来讲,可以分为一级数据、二级数据甚至更多,如果你觉有必要。
1、我们先来看下运营数据的横坐标。
用户数据/行为数据/业务数据,简单点,这是三个数据可以理解成谁?做了什么?对业务产生了什么样的影响?
1.用户数据:顾名思义,是用来描述产品的用户群体。基本可以划分成以下部分:存量用户、新增用户、健康程度和用户来源。
(1)存量用户:衡量产品的体量有多大,主要数据指标是MAU(月活)/DAU(日活)
MAU:monthly active user(月活跃用户):当月至少活跃一次的用户总数,需要说明的是,月活不等于是日活的相加,需要进行去重。
DAU:daily active user(日活跃用户):产品一个自然日的活跃用户数,定义活跃用户,各个产品都没有明确的界定。尤其是一些特定周期性的产品,比如说,旅行类的APP,用户只有在特定周期才会打开。同时DAU不能线性的来看,要结合新用户的进入情况。
(2)新增用户:新用户每日进入的人数。新增用户除了要看新增的绝对值,还看看一个日活增长数据。举例来讲
比如某APP,第一天新增并活跃用户( DNU)数为1000人,第二天同样也是1000人,看着没有什么变化,其实日活增长已经下降了。
第一天APP的日活是8000人,其中1000是新增并活跃用户;第二天的日活是9000人,其中新增并活跃用户也是1000人。所以第一天的日活增长为:1000/8000=12.5%,第二天的日活增长为1000/9000=11.1%,这个就说明了日活增长这个数据是下降了的。
(3)健康程度:主要数据指标是留存率。 某段时间内的内增用户,过来一段时间依然在使用这个应用,就被称为留存用户。一般APP以以一周为计算单位,分为7日日留存和7日内留存。
7日日留存算法:(第七天留存用户数/第一天新增用户数)*100%;
7日内留存算法:(第二天~第七天去重后的留存用户数/第一天新增用户数)*100%
2.行为数据是指用户在产品各个模块中的动作,包括用户的使用频次:PV/UV,路径的走通程度:转化率,做了多久:时长,质量如何。
3.业务数据指标:衡量业务的健康程度,通常的数据指标有GMV/ARPU/付费人数/付费率/付费频次等。我们这里尤其讲一下ARPU值。
计算ARPU我们可以把市面上的APP分为两类来看,一类偏平台类产品,用户的每一笔消费,平台都会从中抽取一部分利润,比如滴滴和猫眼,这类的产品在计算ARPU通常是以月为单位,用月总收入/月付费人数;另一种产品构成是大量免费用户+付费用户,像QQ音乐,这类APP通常也是以月为单位,用月总收入/月用户数,得出ARPU值;但这种算法看起来有点吃亏,所以后来这类的APP也会用用月总收入/月付费人数,计算出的数据用ARPPU
数据的横向划分大致就是这个样子,因为篇幅有限,没有把所有的数据都解释一遍。
横向划分数据有什么意义呢?或者说是数据划分有什么意义呢?
最重要的就是能在我那浆糊一般的脑海里面建立起一个清晰的数据体系。做成一件事情的关键指标是什么?反映数据是哪几个?某个数据是什么性质?在哪个层级?对它的上级造成什么影响?等等;
另外做运营工作,不免会向研发提数据导出的功能,你有一个清晰的数据框架,这样就不至于让你漏掉你要导出的数据。
2、运营数据纵向划分
运营的本质就是不断细分的过程,用户运营就是对用户进行分层并制定个性化运营,活动运营就是不断拆分活动礼包以符合新老用户的需求;
如果我们不断向下进行拆分,我们很有可能得到一条极其精细化的数据,比如:
“在某天的几点几时,在某市某某办公大厦,一个25岁的男性,职业是白领,拿着小米手机,通过好友XX的分享,注册成为了我们的小程序用户。
同样,数据也能拆分,一般情况下我喜欢按照级数进行划分,比如一级数据和二级数据。一级数据是描述产品和业务的状态值,比如新增用户数,ARPU值,新老用户占比等,二级数据则描述因果,是影响到一级数据的元素数据。如果新增用户作为一级数据,拆分出来的二级数据就是,新用户进入人数和新用户转化率;一级数据告诉我们的是一个状态值,无法进行分析;二级数据是可以的,当然你还可以往下细分是可以拿来,如果有必要的话。
以上就是我所知道的关于数据分析的一些东西 了,比较粗浅;另外再多说两句
1、我是从做品牌到转行到做运营,两者之间最主要的区别是品牌是创意驱动,而运营是数据驱动;如果你能专注其中某一个领域,取长补短,也是对自我能力的一种极大提升。
2、在最初开始做数据的时候,我一直会有个疑惑,是数据给了我们答案呢,还是数据帮我们验证了答案?
再展开解释一下,是我们从这个数据的展示中发现了异常,然后得出相应的答案;还是我们看到了异常数据,做了相应的假设,然后用更加详细的数据验证我们的假设。
后来才发现不用纠结,这是因为场景不同。数据本质上是不会直接给你答案的,除非已经把数据分解成为很小的个体,或者答案很简单。如果是稍微复杂的运营问题,我们需要根据经验和异常数据,给出相应的假设,然后再对假设进行判断。
以上
-END-