商业数据洞察分析 —— 层次分析法
一、日常生活中的数据分析
当你第一次使用支付宝花呗的时候,花呗会给你一个信用额度,有人是5000,有人是50000,这个信用额度是怎么评估的呢?当你预订机票和酒店的时候,价格经常都会变动,平台和商家是根据什么来调整价格,获得最大的收益呢?
尽管你是第一次使用花呗,但是花呗已经有超过5亿的用户使用。绝大部分用户都能够按时还清贷款,但有一小部分用户做不到。花呗要判断的是你是更像那些会正常还款的用户,还是不能到期还款的用户。所以花呗会把你的支付宝交易记录,实名注册时提供的身份信息,结合其他可以获得的借贷记录、财产信息、亲戚朋友的关系信息,同已经使用花呗的用户进行庞大数据库进行比对,从而对你的还款能力进行评估,给出信用额度。
在预定机票的时候,我们会发现同样来回两个地方,在不同的日期,机票价格会有很大差异,在同一天内,早晚班次的飞机也比其他时段要便宜。导致这些价格变动的原因,是因为航空公司根据大量的机票历史销售数据,来预测未来的机票销售情况。这些预测将会输入到复杂的优化模型中,来确定每条航线的最优票价,让售价和售出数量的乘积 —— 即该班次的总收入达到最大化。
上述种种商业场景在我们日常生活中随处可见,相信每个人都会接触到,大数据、千人千面、推荐算法、“大数据杀熟”等词语或多或少都听过。那么在这些商业场景里面,企业是如何运用数据是,让用户对买买买乐此不疲,或者刷抖音刷到半夜1点都不愿意放下手机的呢?在这里我们决定挖个大坑,推出《商业数据洞察分析》系列文章,与大家一起分享在商业世界里面,数据分析在各行各业中是如何应用的。
二、企业如何利用数据决策
上述案例是我们从消费者的角度接触到的数据分析的应用结果,如果我们站在企业的角度来看,经营管理人员需要作出战略、战术、运营层面的决策,制定计划、协调、组织和领导企业,从而提升业绩。那么经营管理者应该如何做决策呢?有些企业管理者会基于传统惯例:“业内大家都是这么做,我们也这么做。”有些管理者会基于经验:“我们之前是这么做,接下来也是这么做。”也有些管理者全凭直觉。
以上三种方法看起来很简单,但在商业市场上有着强大的生命力,主要原因还是在于过去企业经营中收集的数据量很少,在客户和市场方面的数据极其欠缺,对于新企业或者新产品和品牌,往往没有可以搜集以供研究的数据,所以大量的决策都取决于管理人员个人的洞察和决策能力。
那么在缺乏数据的情况下,我们是否就只能通过经验和直觉进行决策呢?显然不是的,接下来我们通过某快递柜公司对投放地点的数据决策案例,来演示低数据量情况下的数据决策方法 —— 层次分析法。
案例背景:
某快递柜公司融资了大量资金,打算在全国范围内大展拳脚布置快递柜,抢占优质点位资源,占领先机。快递柜一般布置在居民小区、学校等地方。中国城市规模很大,虽然快递柜公司背后有强大的资金支持,但是也不可能在城市的所有地方全面铺开,因为前期资金、人力资源的投入都非常大,后续还需要持续的人力维护。
在快递柜公司发展之初,各个区域都处于需要拓荒的状态,并没有现成的案例可以参考应该如何投放快递柜,企业管理层对于选址的因素考虑得非常多,但资源是有限的。应该在大城市布置多,还是在中小城市布置多,应该在新城区布置多,还是老城区布置多,种种定性因素结合成本投入这样的定量指标,要形成数据决策是非常困难的。我们根据快递柜公司当时所处的环境,数据决策所需要的因素,建议管理团队使用层次分析法,来解决低数据量以及定性定量指标混杂时的数据决策问题。
三、构建层次分析法
层次分析法,简称AHP,是指将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的数据决策方法。该方法是美国运筹学家匹茨堡大学教授萨蒂于20世纪70年代初,在为美国国防部研究"根据各个工业部门对国家福利的贡献大小而进行电力分配"课题时,应用网络系统理论和多目标综合评价方法,提出的一种层次权重决策分析方法。层次分析法比较适合于具有分层交错评价指标的目标系统,而且目标值又难于定量描述的决策问题。
层次分析法是指将一个复杂的多目标决策问题作为一个系统,将目标分解为多个目标或准则,进而分解为多指标(或准则、约束)的若干层次,通过定性指标模糊量化方法算出层次单排序(权数)和总排序,以作为目标(多指标)、多方案优化决策的系统方法。
层次分析法是将决策问题按总目标、各层子目标、评价准则直至具体的备投方案的顺序分解为不同的层次结构,然后用求解判断矩阵特征向量的办法,求得每一层次的各元素对上一层次某元素的优先权重,最后再加权和的方法递阶归并各备择方案对总目标的最终权重,此最终权重最大者即为最优方案。(来源:百度百科)接下来我们构建快递柜企业的层次分析法模型,因为篇幅有限,我们仅使用3个变量,分别是城市、建设成本、覆盖人群。
城市指的是城市规模,规模越大的城市潜在用户越多,快递量越大,而且有一定的品牌宣传效应,所以城市是一个非常重要的因素。
建设成本指的是快递柜建设成本的高低。
覆盖人群指的是所覆盖的小区、学校的估计人数。
现在企业手中有两个方案,需要对比孰优孰劣,进行科学的数据决策:
A点位:位于1线城市,建设成本10万元,覆盖周边5000小区居民。
B点位:位于3线城市,建设成本5万元,覆盖周边2000小区居民。
首先我们使用SPSSPRO对指标进行评分:
这里要注意的是,由于这些指标的属性(定型/定量)不一样,同为定量指标的话量纲也不一样,所以指标打分会带有主观因素,这一点企业管理者在进行数据决策前需要慎重的进行考虑。接下来需要在不同指标上对不同方案进行评分:
在方案对比评分环节,仍然是依照重要性评价,但我们并非完全主观的进行评价。比如说建设成本是一个可以量化的指标,两个方案可以直接对比,那么我们可以设定一个比例,当A方案比B方案的建设成本差异达到某个值,那么评价就可以达到某个值,使得在多方案进行对比的时候,量纲趋于一致性,让数据决策更有依据。
接下来我们看一下分析结果:
从结果可以看到,A点位得分1.584分,B点位得分0.722分,所以A点位是显著优于B点位的。在我们这个案例里面只是有2个方案对比,但是在实际工作中,可以进行多方案对比,每个方案都会有评分,我们根据评分就可以选择最优方案。
另外SPSSPRO会根据指标打分,计算出层次分析模型各个指标的权重值:
上表展示了层次分析法的权重计算结果,根据结果对各个指标的权重进行分析,通过展示了一致性检验结果,用于判断是否存在构建判断矩阵的逻辑问题。
● 特征向量,系统默认采用方根法进行计算,特征变量反应了因素的权重。● 权重值,即为特征变量的归一化结果,将特征向量映射到0~1的区间上。● 一致性检验结果要求CR值(CR=CI/RI)小于0.1,用于判断人们在构建判断矩阵时,是否存在逻辑错误,例如有ABC三个指标,我们判断A比B重要,B比C重要,因此逻辑上A肯定比C重要,但是如果在构建判断A比C时,认为C比A重要,那么就犯了逻辑错误,无法通过一致性检验.
在我们这个案例里面,CR=CI/RI=3.224>0.1,不通过一次性检验。我们回头看一下我们指标打分是否出现了逻辑错误。
这里错误很明显,我们认为城市比建设成本重要,而覆盖人群比城市重要,那么覆盖人群应该比建设成本重要,所以这个指标打分是有误的,我们应该对其进行调整。
优于快递柜的使用率决定了后续能否获得比较高的收入,而使用率是收到覆盖人群的影响的,快递柜附近的居民越多,理论上使用率越高,所以覆盖人群是最重要的因素。
而由于受到资金投入的影响,建设成本的重要性也比较高,而且建设成本往往跟城市挂钩,经济发达的大型城市建设成本比较高,所以我们应该将提高建设成本的重要性,调整指标如下:
计算结果如下:
我们可以看到调整后的CR=CI/RI=0.062≤0.1,通过一次性检验。
在快递柜企业的案例中我们可以看到,在低数据量,且指标不明确的情况下,企业仍然可以使用数据决策,这仅仅是数据分析在商业领域的一个简单的应用。
随着整个世界进入信息时代,海量数据的产生、搜集、储存和分析变得原来越简单,根据调查统计,世界上所有数据量每2年就会翻一番,而且速度还有加快的趋势,那么管理人员如何使用数据来指导决策,更加高效的管理企业,作出有利于经营的决策,就成为了一个重要的能力。
接下来我们《商业数据洞察分析》系列文章会继续分享更多数据分析在商业中的应用,请大家持续关注!