接口解密:约2亿人的航旅及铁路出行数据如何卖1亿元?
本文笔者将通过数据字段反推数据提供商的数据源头,通过数据源头及应用场景推断潜在的创收规模系列第【3】篇。
笔者上次在分析运营商体系有哪些数据在金融行业应用较广中提到用户的位置轨迹数据,这次的航空及铁路出行其实也属于用户位置轨迹的两个来源,只不过出行数据除了有个区域位置外,还包含了票价等可以侧面体现用户资质的信息,出行数据已经在金融风控和营销场景都有相对成熟的应用。
同样是位置相关数据,为什么这两个来源可以大大方方的应用到场景中?
笔者认为主要有几个方面:
航旅与铁路里的位置数据主要指出行地及目的地,位置范围最小都是以县级市为单位,非精确数据,无法定位用户精准位置; 用户通过航旅或铁路出行的频率99%都是不高的,非高频的出现轨迹,你想反推这个用户的实际身份信息其实是不可能的; 其对外的数据产品经过合规处理,对外的字段也不算很多,相较于一些可以查到用户消费字段的产品,航旅出行数据算是很保守了; 对外的接口产品是严格要求用户授权的,有用户授权的场景,字段再敏感也是很难追责的。 除了出行涉及的区域位置,还包括了用户的票价信息、座位等级、出行时间等信息,对外主打非位置信息。一句话总结:这样的数据维度无法反推个人身份,也没有太多用户的敏感信息,没在信息安全法明确禁止的范围的其实都可以拿去变现,更何况有用户授权。
航旅及铁路出行两者的数据,在金融行业现在比较成熟的形态有:
数据API接口:部分数据属于统计数外,基础字段都是根据原始订单记录信息输出,尽量原汁原味; 分值产品:航旅分、铁路出行分这些通过数据权重及用户出行轨迹判断而得出的分值产品,不会输出数据详情; 出行信用报告:主要围绕航旅及铁路的出行数据,叠加用户的出行黑名单、金融失信名单、其他一些数据机构可以获取的用户数据,可能有社保公积金、消费记录等,形成相对完善的集合型报告产品。(市场上常见的航旅数据接口字段表)
(航旅失信名单字段表)
本文主要针对航旅数据做分享,且不细分航旅分、数据接口及信用报告类形态,因为这三者基本是互补的产品,金融机构能用得上航旅分的环节都可以替换成用数据接口或信用报告,所以应用场景及调研次数上,区别不大,唯一有较大区别的只有信用报告的成本相对比分值或数据接口高点。
铁路出行的产品形态及场景及调用次数与航旅的基本一致,唯一区别在于铁路人群的质量不如航旅的高, 在风控调用的权重次序中铁路数据调用也在相对靠后或者直接不采用。虽然铁路的人群覆盖率比航旅高,导致查得率方面也会高点,同时价格比航旅高。所以有调用航旅数据的场景如果都用上铁路数据,铁路数据可以带来收入会比航旅的高。
(市场上常见的铁路数据接口字段表)
航旅数据从哪来?
航旅数据源头是出自中国民航信息网络(下文简称“中航信”),其背靠中航信集团和国资委,作为全球第三大GDS(航空旅游分销系统提供商),同时也是国内GDS行业的唯一企业、航空旅游业信息技术解决方案的主导供货商。中国民航信息网络是航旅数据的源头,犹如运营商数据掌握在三大运营商,身份证信息掌握在公安局一样。
中航信的主营业务是面向航空公司、机场、机票销售代理、旅游企业及民航相关机构和国际组织,全方位提供航空客运业务处理、航空旅游电子分销、机场旅客处理、航空货运数据处理、互联网旅游平台、国际国内客货运收入管理系统应用和代理结算清算等服务,是目前航空旅游行业领先的信息技术及商务服务提供商。
服务的客户包括近30家国内航空公司以及近200家地区及海外航空公司,国内169家机场以及近7000家机票代理人,服务范围覆盖到300个国内城市、80个国际城市,并通过互联网进入社会公众服务领域。
除了春秋航空这家廉价定位的民航没在体系内,中国民航信息网络掌握了国内95%以上的用户和数据,乘客的每次票务购买,值机、登机、到达等所有信息、数据服务,都由这家公司提供,因此整个航旅环节的数据也存储在中航信内。
【GDS早期是一种票务预订系统,后来向整个产业链上下游扩张,如今,已经发展成为主要服务于整个旅游业的一个信息化服务的系统。航旅数据的代理公司为了把航旅客户数据覆盖率提升近100%,会通过单独对接与春秋航空服务的OTA在线旅行社这些在线定票机构获取部分春秋航空的用户数据,主要原因一是春秋航空自建运营系统,没对外输出数据,其数据都体系内经营,特别是和玖富集团的合作值得航空公司参考,而一些和春秋航空合作的OTA机构零散的存储了春秋航空的用户数据,这块数据暂无直接途径可以全覆盖。】
航旅数据可以应用在哪些行业哪些场景?
对于航旅数据的源头机构,可以用于航旅业务分发,提供给各种OTA或票务代理机构,用于客户在线或线下订票使用,并告知用户订票结果、航旅行程过程实时信息通知等。同时由于航旅数据源头机构是有用户的触达方式的,因此可以对接各种变现产品,例如航旅险、理财产品、机票分期等产品,为体系内客户提供增值产品。
对于金融机构的信贷风控环节,黑名单类数据可以补充航旅失信名单,用户资质及额度评估可以使用航旅数据辅助评估。
对于金融机构的营销场景,可以针对航旅部分客群,进行类似机票分期、高端理财、航旅险、寿险、意外险等金融产品。
对于其他的机构,可以与有航旅用户的机构进行产品合作分佣,例如高端电商、教育培训、私人财富等公司。
是什么支撑了航旅数据在金融场景商用价值?
航旅用户群体天然的高净值属性决定了其群体质量是非常不错的,航旅数据是可以直接用来判断客户资质、金融风控额度评估及一些轨迹反欺诈及营销环节,都有其商用变现价值。
航旅数据由于国民人均收入的上升及消费升级的趋势,对旅游出行的需求覆盖人群也逐年增长。其中OTA的发展刺激了人群在航空出行的需求,也促进了航旅在出行工具中的渗透,航旅的用户群体不仅限于高收入人群,大量中低层收入人群也被逐渐被渗透。
用户数量的提升,可以带动相关数据在各机构场景中的覆盖率的提升。而且数据由统一的机构管理,各省市各航空公司的用户数据打通也更容易,数据标准化输出就不成问题。同时时效性问题也在航旅数据不断商用过程中满足风控商用价值。最重要的是,航旅数据的确在部分风控过程用于贷前审核及用户资质评估得到不错的效果反馈。
航旅数据在金融行业的应用场景
中航信记录航旅过程中的哪些字段?中航信是记录了乘客的每次票务购买,值机、登机、到达等环节,这些环节产生的基础数据维度,至少有:用户基本信息(姓名、身份证号、银行卡号、手机号)、购票信息(航空公司、航班类型、舱位等级、座位情况、原票价、折扣、购买时间、票务代理机构等)、其他信息(到达机场时间、登机时间、起飞地点及时间、抵达地点及时间、离开机场时间、回程地点及时间等)
从时间维度看,有确定行程的时间、购票的时间、更改行程的时间、到达机场时间、登机时间、起飞时间、抵达时间、离开机场的时间、回程时间等等,有相当多的时间点可以捕捉。
从旅客维度看,即这个旅客是什么样的人。性别、年龄、对价格敏感程度、是否是白金卡会员、是否经常来回某一个地区的,这些所有的所有都是可以考量的旅客标签。
如何从这些标签提取到需要的字段形成不同的用户画像或分析用户背后的特性?以下做些简单分析参考,不一定准确。
单个指标分析:
头等舱的多数有钱人;折扣票据的多是普通阶层且提前有计划的,或出游的或定时出差的;当天往返或隔天往返的基本都是商务出行;节假日往返的多是旅游或探亲;
多指标分析:
年龄+价格:低年龄+折扣票据属于正常资质用户层;低年龄+正常票价或头等舱的不是富二代就是创业老板;中年+折扣票据的或是旅游客群或是普通阶层;中年+正常票据属正常阶层;中年+头等舱偏老板阶层(公务舱结合分析类似)。
往返地+身份证归属地:目的地与身份证归属地一致的,一般是回家探亲的;出发地与身份证归属地一致的,一般是常驻城市(可结合出发地次数增强判断)。
出行频率+目的地:出行频率高的,目的地基本一样的,基本是商务出行,且属于高端商务了,业务稳定的;出行频率高,但目的地经常变换的,大部分是开拓市场的或者是经常出游的。
另外,出行黑名单例如航旅失信人员及也属于中航信体系内记录,可用来判断用户失信行为,能出现在出行失信名单的用户,证明在出行过程中有出现严重的不良行为,那保不准其在真实贷款后,会有不还款或者在催收环节恶意辱骂催收人员的行为。只不过这部分人群数量过少,出行黑名单是从2018年下旬才逐渐按月公布,每期公布名单一般几百到上千个失信人度等,当信贷公司每天几万几十万的调用过程,只为查询这个几千个航旅失信名单,实际应用价值不大,也会增加中间的查询耗时,影响用户体验。
航旅数据能创造多少收入规模
收入规模=该场景所有机构的调用次数*查得率*每次调用费用。
该场景所有机构的调用次数,在下文分主要预估金融信贷风控场景及金融理财营销场景的调用次数。
而查得率主要与航旅数据覆盖用户数量有关,所有笔者先预估航旅数据大概覆盖的用户数量。
从2019年全国民航工作会议上获悉,2018年我国民航旅客运输量继续保持两位数的增速,乘坐中国民航航班出行的旅客人数达6.1亿人次。
6亿人次代表国内有多少人坐过飞机呢?
笔者觉得保守估计应该是少于2亿人的。坐过飞机的应该都知道,飞机出行基本都是往返算一次,这样就产生了2次的飞行记录,然后还有一些换成记录,或者经常出差的多次往返的。其中还有一部分是外籍人士记录。所以按单个人每年坐飞机的次数来算,起码有个3-4次乘机记录。2018年为止,有飞行记录的乘客数量应该少于2亿人,可能也就1亿人左右,但这里笔者暂按2亿人计算。
但在此我们就假设国内有2亿人在2018年有航旅数据记录。也就是2018年的航旅数据中的活跃人群,这部分人的航旅数据的新鲜度才能够应用于金融风控或营销分层。
【2018年国家铁路完成33.17亿人次,其中动车组20.05亿人,占旅客总人数的近60%。假设每个人在2018年的乘坐次数为4次,则有5亿人坐过动车,根据现在的动车路线布局,5亿人其实不太合理,笔者觉得2-3亿坐过动车其实更合适,非动车级别铁路人数应该在8亿人左右】
但如果要预估航旅数据潜在的市场规模,我们就要评估,这2亿人中有多少人是有借贷需求,这部分人会在借贷公司进行借贷申请,这个过程假设借贷公司是1:1查询航旅数据且能查得数据的,才会为航旅数据产品接口产生收益。
【航旅数据接口收费模式无特殊情况,基本是按查得收费】
同时现在国内高端航空市场占比90%,低端航空市场10%不到,理论上2亿中有1.8亿的高净值客户,当然这只是理论上。高端航空代表的是票价高,低端航空其实也不算便宜,航空出行是所有出行工具中算是最贵的。能够经常乘坐航空出行工具的乘客,这样的资质,假设有贷款需求也只能是大额的贷款(1万+),这样的贷款产品一般只存在于银行或消费金融机构或小贷公司的大额产品,因为这些持牌机构的利率也相对低点,高净值客户群对成本是很敏感的。
【所以正常情况航旅数据产品,在银行等持牌机构相对更容易接入变现,P2P或现金贷等高利率产品,使用这个产品其实意义不大,除了小部分资质不行的航旅客群】
那2亿航旅客户,有多少有借贷需求?这里其实有个悖论,信贷机构希望过来借款的都是高净值客户,因为借贷能力和还款能力肯定不错,但高净值客户,不缺钱,贷款意愿就相对较弱。因此真实的高净值客群去借贷的其实还是很少的。
之前笔者在运营商数据篇预估过民间借贷2018年活跃借贷用户数量应该有1200万左右,假设民间借贷中有20%是有航旅记录的,则有240万航旅用户在2018年有过民间借贷行为。240万占2亿中的1%不到,应该算合理?如果合理的话,则这240万用户符合民间借贷的客群行为,假设这240万借贷用户资质都良好且刚好为其提供贷款的机构都有使用航旅数据做用户资质评估,且每个用户都有过2次借贷行为,则这里可以为航旅数据公司创造240W*2*1元=480W的收入
【1元是借贷机构每调一次航旅数据且查得产生的费用,480万是不是少了点】
好了,这里暂不用这么悲观,航旅数据市场空间还是很大的,因为上文已经说了,航旅这些高净值客群假设有信贷需求,也起码是高额信贷产品的需求。因此大部分有借贷需求的客户,大多会在银行、消金及小贷等公司中出现。
这里需要拿央行个人征信报告2018年年度查询量17.6亿次来说事了,为啥?持牌机构的信贷产品都需要上报央行的,这个应该就知道17.6亿有什么用了吧?
之前在运营商数据分析中是假设通过资质的用户才需要做资质分层,假设只有10%的人征信是符合要求,则有1.76亿次查询量,这1.76亿中有20%是航旅用户的调用查询次数,则有3520万次是调用了航旅用户数据的,则可以为航旅数据公司创造3520W*1元=3520万收入。
【3520万指代表次数不代表人数,表示航旅用户有在各个机构申请贷款时查询航旅数据时产生了3520万调用】
以上推测来看,单纯的航旅数据在风控上的使用一年大概可以带来4000W收入规模。
【这个预估规模,笔者对了下业内的头部公司的年报,其在2019年的信息报告及评分服务收入4,847.39万元,当然这个报告及评分服务以航旅数据为主但也掺入了其他维度字段,所以单纯的航旅数据接口的收入肯定无4800万的。因此笔者对航旅数据接口的预估还是比较接近的,只不过那些非头部代理的公司一般也会接入这个数据,主要是为了丰富数据产品接口,无法靠这个数据去赚钱。PS:航旅数据单笔的调用价格成本原则上来说是比1元稍低点的。】
单纯在风控环节,航旅数据能给一家机构带来的最高收入规模看起来还是挺有限的,在金融领域还有无其他应用价值?
答案是:有的!
须知高净值人群,该群体收入高(或家庭收入高),社会地位高,具备很强的消费能力,更多的还是投资需求。围绕高净值用户做理财产品推广,应该是个潜在方向。机构才有航旅数据产品接口,针对存量或新增用户进行航旅轨迹匹配,针对有航旅记录的客户再进一步做等级分类,将客群分为航旅类及非航旅类,航旅类又可以分高端及普通,针对高端的用户推广高端理财产品,针对普通用户推广活期或低风险的理财产品。
假设50%的航旅用户在不同的金融机构有获得过服务,则至少50% 的航旅用户可以在金融机构做用户资质分层过程中查询航旅数据时被命中。既营销过程可以为数据公司至少创造1亿*1元=1亿元收入。
【1元在理财营销成本中占比很少,需要正常一个成交的客户成本都在几百元,高净值用户做理财营销的成功率比非高净值客户高,这1元该花还是要花的,数据产品的市场就存在于这些金融机构可以承担并愿意付出的有效营销成本中】
最后
笔者发现只要用户量级达亿级以上,且与金融行业客群匹配度较高的,不管是什么数据都有可以做成数据产品的可行性。航旅及铁路出行数据的例子就非常有参考价值的,他们原则上统一掌握在政府背景的机构手上,如何数据出库,如何找到合适的变现方式,数据如何合规处理,如何进行数据产品的规划及需求场景的切入,数据效果的如何得到保障,这整个流程决定了数据的变现能力的强弱。
就像位置数据,除了运营商体系的实时数据及各种有GPS强授权或后台悄悄打点的APP外,区域间的移动记录就存在统一管理出行工具数据这些机构手中了,中航信及12306就是2个特殊的例子。除了航旅及铁路,巴士出行及私家车这些记录,无统一的管理导致无法有效输出,暂无成熟的数据产品可以输出。
【电商类记录的位置信息相对来说多是同一个片区的多,跨省市的还是较少,也无法判断用户出行方向】
(位置数据矩阵)
笔者这次仅从数据输出方面分析,对于数据拥有方体系内的生态合作,例如如何通过与金融机构合作,打造体系内用户资质分层,理财产品、信用卡产品、消费分期及电商合作等变现方式;场景链条的前后延展,为客户提供登机前后叫车及订酒店服务,空中后续会单独找个机构案例进行挖掘分析。
#专栏作家#
大数据猎人,微信公众号:大数据猎人,人人都是产品经理专栏作家。多年金融科技行业相关战略研究、行业分析、商业模式及产品体系研究经验,擅长政府数据+企业数据+公开数据多源数据融合流通交易及应用
本文原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议