我是如何准确预测今年京东618战绩的
18天前的 6·1 儿童节,我在朋友圈发了这么一张图(点击看大图),用儿童的想象力预测了今年京东 618 的战绩,预测的结果是 3489 亿。而今天(6月19日)京东官方公布的数字是 3438 亿。
对比 18 天前做的预测值和今天官方的公布值,差异率只有 1.5% ,无论在业务侧,还是在数据侧,都可以肯定地说非常精准。而这个预测的过程,我只用了大约 5 分钟的时间,下面我用三个部分和大家深入拆解这个预测流程。
第一部分:图文详解预测的流程
第一步:准备历史 618 的战绩,数据来自历年官方公布的结果。
第二步:创建柱状图,留意数据范围是 2017 ~ 2020,不要选 2021。
第三步:为柱状图添加趋势线。在柱状图的柱子上点击右键,选择添加趋势线。
第四步:显示公式和 R2 值,并在趋势线格式中选择指数。
第五步:前推中填写 1,开始预测。
第六步:计算预测值,在 2021 年的单元格中填写公式:
922.05*EXP(0.2662*5)
第七步:所以预测结果就是 G3 单元格所示:3489.7991 亿,四舍五入为 3489.8 亿。第二部分:几个容易被挑战的问题
1)你究竟凭什么可以预测?
在2010年美国《科学》期刊上有一篇论文,题目叫做《Limits of Predictability in Human Mobility》,其中明确指出:“平均有93%的用户行为可被预测”论文作者:艾伯特 - 拉斯洛 · 巴拉巴西,全球复杂网络研究权威,“无标度网络创立者”。在我的课程中同样应用了他这篇论文中的主要观点,见下图。
2)当时未有实际结果参照,所以你对预测结果有多大的信心?
当时做完预测,其实我对 18 天后的实际结果已经“非常期待”和“非常胸有成竹”,原因在于这条指数趋势线对历史数据的拟合程度相当之好,而 2021 年的 618 如果没有黑天鹅事件,那么在趋势上将和这根指数趋势线必然保持一致,最终官方公布的战绩只会出现在 3489 亿附近。3)所以,还有哪些场景可以用预测?
基本上所有需要评估未来发展和趋势的场景都可以用趋势预测来做,涉及的算法也非常多,就不多浪费笔墨了。第三部分:进阶提升
我们深入到预测流程中就能提炼出 6 个极其重要的概念,也是数据科学领域最基础的 6 个概念。
①数据(Data):历年来的 618 战绩,未经任何分析和处理,不具备任何价值,就是数据。
②模式(Pattern):这根线代表了历年 618 的增长趋势,是对数据的进一步加工和分析,就叫模式。
③模式识别(Pattern Recognition):寻找出这根线的过程,叫做模式识别。
④建模(Modeling):但是只有一根线说明不了什么问题,我们需要进一步寻找到某种精确的数学形式来表现识别出来的模式,这个过程就叫建模。
⑤模型(Model):这个精确的数学形式就叫做模型。
⑥算法(Algorithm):模型中的指数回归,就叫做模型的算法。-END-