0
9月11日到12日,由 TalkingData 举办的T11 2017暨TalkingData智能数据峰会在北京召开。这家成立于2011年的公司,现在已经是中国最大的独立第三方移动数据服务平台。从数据的采集、处理到数据的分析,再到数据的应用与咨询,TalkingData已经形成了一套以“智能数据平台(SmartDP)”为主的完整数据应用体系。
那么,在企业实际的运作中,数据是如何改变企业决策的方式和效率呢?TalkingData 副总裁高铎就在现场围绕数据这个主题进行了分享。
以下内容由雷锋网根据高铎演讲速记整理(有部分删减):
今天下午,我们整个会场的主题就这六个字,如果大家把这六个字记熟的,就收获满满了,数据、共创、价值,我跟大家分享的部分就是数据部分。
在分享这个主题之前,我想给大家看一下TalkingData在做什么,今天上午在座的各位都听了CEO的分享,说创业的时候一堆联合创始人在地坛里面坐着聊到最后聊出我们的理想,数据改变企业决策,数据改善人类生活。但是他没有告诉大家,我们为什么得出了这样一个公司的愿景和理想?我们公司的这些创始人都有十年,十五年,甚至二十年外企的工作经验。
在这十多年的工作里面,我们既与国外500强企业打交道,也与国内数百企业打交道,在无数的会议中我们发现一个特点,所有的与外企打交道的会议里面,很多外国客户,合作伙伴他们在分享和讨论的时候,都是有数据来支撑他们的分析和决策的。
但是,在我们与中国很多企业,甚至是非常有名的大企业开会的过程当中,我们总结了,我们发现每次的会议基本上是这样结束的,大家可以反思一下自己是不是这样:第一,基本结论就是在座的谁的title最高谁说得算,大家就按这个执行了。第二,讨论来讨论去,讨论三天五天没有结论,再议。拖着拖着不了了之。第三种,拖到了最后没法再拖了,我们给一个结论,给一个决议,这个事就往下做了。
站在中国企业所处的位置,我们去思考,中国企业会走向全球化,会跟所有的国际企业站在同一个轨道里面竞争,中国企业缺什么?我们认为数据应该能去改变中国这些企业的一些决策。这个决策是分两种的,第一,它可以改变我们决策的效率,让我每次的决策都有针对性,更有时间性和规划化,第二可以改变我们的方式,让我们的决策有一些客观的逻辑在里面,而不是凭着脑袋大,凭着谁掌握的资源多谁说话,虽然这些也有可能正确,但是更多层面上是对我们决策效率,或者推进决策的一种阻碍。
我今天要分享的就是TalkingData想做什么,我们想推动数据改变企业决策的方式和决策的效率,基于此推动数据,改善我们自己的生活。这是我们的愿景,也是整个公司全体为之奋斗的方向。
我们首先得有一个数据平台,先有数据。第二,有了数据之后我们要进入企业里面,帮助这些企业解决问题,这也是上午崔晓波分析的时候讲的,TalkingData要找更好的数据。第三,蛋糕不是一家做大的,蛋糕是一起做大的。所以我们有一个数据合作生态,大家刚才或者是上午进会场的时候看到沿路各种人工智能相关的,大数据相关的企业都是我们的合作伙伴,是我们合作生态的一部分。今天下午的数据、共创、价值就会围绕着这三个圆圈进行。我会讲第一部分,第二部分由林总分享。第三部分,大家看到了,跳的最快的,也是我们公司在商业演进上做得最深入,最专业的合伙人蒋总,蒋奇来分享。
大家说你们讲三部分够吗?我还有一个分享,这几年TalkingData推进商业的过程当中,我们发现两大特点。第一,基于大数据技术深入的研究和研发不在中国,还是在美国一些先进的地方,所以大家看到了上午我们有一个硅谷感知计算实验室,我现在跟大家分享,它在美国那边负责研发和负责引入一些先进的技术。
第二是什么呢?我们发现尤其是移动互联网时代兴起之后,我们发现商业模式在逆转,什么叫做逆转?在座的各位可能有很多投资人,在几年前PC时代,大家经常讲的一个段子叫做什么?很多很多欧美的商业模式复制到中国就能火下去,但是这几年我们分明看到商业模式的变化,移动互联网时代,中国走得更远,很多中国的商业模式在被全世界所复制。所以我们讲现在叫做什么?叫做copy To W,所以第四部分有一个这样的光头老外给大家讲如何把中国的商业模式带到全球。他的中文很棒,很棒,值得期待。
讲了如何做,我们就讲讲TalkingData的数据。我们先逛一下TalkingData的智能数据世界。基本上这张图代表了我今天下午所分享的全部。如果大家对技术有恐惧症的不用细看,只要知道TalkingData在数据治理和数据论证上有完整的方法论体系,我们从始至终贯穿了三个管理理念,第一质量管理理念,从数据的收集、管理、应用是贯穿始终的。第二,安全管理是从头到尾贯穿始终的。第三,产品管理也是从数据收集管理应用是贯穿始终的。
我们先讲数据获取,简单讲数据获取在TalkingData,我们为无数的开发者提供服务。什么是开发者?就是所有开发APP的企业和个人用户。这些开发者为什么使用TalkingData的产品,这基于我们对开发者全生命周期提供服务的理念,任何一个开发者,或者任何一个互联网的创业企业,刚开始创业的时候面临一个什么问题?我们不是讲段子,我的融资都找好了,A轮也差不多了,现在就差一个CTO来研发,这就是很多创业者。这里面说了一个什么样的前提呢?所有的互联网开发都是以研发为前提的。在研发层面上,我们为开发者提供的是像灵动分析,易认证,自定义SDK。使用了我们的原始代码以后,后续不需要再买代码了,调整你的规则就可以使用,看到结果。
对于一个研发产品上线之后遇到什么问题?推广,所有的APP上线之后遇到第一个问题都是推广。对于推广来说,我们会有两大难题。第一大难题,对安卓,中国有琳琅满目数百的推广渠道。对于每一个开发者来说,每一家渠道都要生成一个渠道包,每一家都要做技术的对接,这是很复杂的。TalkingData把这个全帮你干了,我们有所有渠道的生成工具,渠道的自动分析和优化。
第二是iOS平台,这个时候你的推广渠道也是五花八门,怎么评估你这次付出是值得的,我们推出了Ad Tawracking,还有Brand Growth,帮你评估每次活动是不是有效、值得的。
另外,产品推广之后,你的APP有了一定的用户量,会遇到什么问题呢?我们会做运营优化,会考虑我们的产品怎么运营得更好,让用户和玩家的留存更长?怎么样让你的用户更喜欢对你的产品有一种使用黏性,我们有应用统计和游戏统计,这两个产品。
在这里我简单举个例子,讲讲游戏统计如何帮助企业运营和优化。在这个手游圈,有一个非常知名的企业,他们开发出来一款非常火爆的游戏,这里面有一个玩家特别喜欢玩,每天都在线上玩,但是这个玩家客观来讲太笨,无论买什么道具都被别人打死。但是这个玩家很重要,短短两个月就在这个游戏平台上花了数十万块钱,对于这个平台来说,他们第一直觉是什么?希望把这个玩家留住,多在我的平台上玩一下,就可以多挣钱。所以他们请了一个工程师做成隐形人,只要这个玩家上线了,这个工程师就在他后面帮他砍人,所以他们帮助这个玩家在这个平台上又延续了一个月的生命周期,挣了数十万的费用,大家看看这个方式是不是成功的?结论是一半。
我跟他们聊,我说你们这个是有巨大问题的,你们太短视了,太照顾这个大V了。你想想这个大V在你这玩,他的诉求是什么?我们分析,所有的玩家是991比例的,90%的人在这个平台上是看热闹、娱乐,俗称打酱油的。还有9%是小额付费,有1%是大V,的确是浸入很深的,他们内心的诉求在这个平台上有两种体现,第一种我不停的花钱,带来了一种成就感,在里面等级升得越来越高。但是另外一个是什么呢?我花了很多钱,等级升得越高,有一批打酱油的给我鼓掌,大哥你好厉害啊,好猛啊。这个平台只注重了1%大咖的体验,想把这个钱留下,但是他忽略了这90%和9%玩家的运营。大V是愿意花大钱了,但是喝彩的人少了,没有人鼓掌了,所以他就走了。
所以我就讲运营优化不是简单看数字,我们的产品也是一样,我们产品有一套AARR方法论模型,看到数字背后要理解任何一个用户和玩家在这里面的特征,做有针对性的分析才能够帮助这个平台,或者帮助这个开发者获得成功。
第四运营优化到一定程度,我们的App量大了,大家就有两个诉求,要变现和挣钱了。无论是如何挣钱,在中国的互联网行业无非就三种。第一种,它是作为广告,卖流量的。第二种,是作为电商,要么收一个租金,要么直接去卖货挣钱,第三种,卖一种侵入和快乐感,让你在我这上面玩得很快乐,但是无论是哪一种,背后的逻辑都是要找到针对性,适合流量的人群,适合浸入感的人群,只有找到了,你才能够让你平台的变现效率做得更好,所以我们推出了Smart Data Markte的平台,包括这些企业、平台变现。这是我们以开发生命周期为理念的产品矩阵。六年下来,我们这几个产品累积覆盖,大家在进门大屏上也可以看到,累计覆盖六年,我们覆盖了58亿智终端设备,我们每个月做的越活跃设备已经7.8亿,累计服务应用数量40万,累计服务客户数12万,在这个数量里面,我想分享的是大家只看到很多移动互联网的明星企业,TalkingData看到的是什么?TalkingData看到的是一将功成万骨枯,每一个行业里面出现了一两明星胜出以后,最后倒下的是数以百计,数以千计的企业。
2011年有一大批做工具类的APP和我们合作,2012年,2013年可以称之为中国手游的爆发年,有很多很多手游和我们合作,2014年大家知道的是O2O,万众都做O2O,成百上千,那个时候滴滴、快的和我们合作。2015年很多做母婴群体、海淘,2016年最火的是直播、出海,2017年截至到现在最火的是共享单车。但是这么多年下来,我们看到每个行业都有一些新秀企业,我们更多的看到,每一个行业都倒下了数百的企业,他们的经验,为什么倒下的?我们能从数据上得出来,我们很期望从这些倒下的企业失败的教训里面,把经验分享给明年、后年、大后年兴起的体验,因为互联网运营的本质和方法论是不变的。
这些互联网的行业,无论是什么样的新的行业兴起、衰亡,但是我们发现它的增长曲线和衰落曲线高度的相似性。
举个例子,我们如何帮助这些企业,我们找了一个防作弊,2017年从1月1日到现在,平均每天TalkingData监测异常营销事件是19亿,这是什么概念?就是我们每天能够帮助广告主发现异常的广告激活是26万。在座各位很多是做金融行业的,可能你们一个A的成本非常高,几十块钱,互联网行业有些不是做金融的,是做行业的,一个推广成本也有三五十几块钱,我就简单以12块钱为例,每天我们可以帮助广告主节省费用大概320万,为什么我们能够做到这些,就是基于刚才我说的,这么多年下来我发现,各种互联网的行为、运转规则都是换汤不换药,通过一些数据可以做到客观的分析和呈现的,是能够帮助这些新兴的企业去节约很多的成本,提升他们的效率。
我们也要感谢这些数据合作伙伴,他们和我们一起在这一年来进入到不同的行业去分析,挖掘,找到不同的应用场景,我们共同推出了超过280个数据服务,在过去一年里面,我们为超过500的企业超过了24亿次有效的服务。这个24亿不是查询,是查得,这是24亿次有效服务。
大家会问TalkingData积累了这么多年的数据,拥有了这么多数据,有了分析数据的能力,你们是如何构建你们的数据能力的,能否跟我们分享一下?干货来了,数据治理能力的分享。
第二部分,我们具体看看TalkingData是如何治理数据的?在所有的数据治理之前,我认为数据的组织、规划和计划是最重要的。TalkingData的数据基本上是按照两个维度去组织的。第一,是以人为中心来组织数据,第二,是以行业的需求、痛点为中心组织数据的。但是我这样说,由于很多在座的各位不是一线的具体处理的。可能你们有一个比较模糊的概念,我举个例子,就拿我们每天安装P2P类的,或者互金APP为例,如果我们每天监测一个设备装一两次能用到什么场景?能用到营销场景,因为我装了,我有兴趣,我对理财类的产品有兴趣,装一两次。
如果我的手机上装了很多这样的应用,装了五六个,每个都用两下,这是什么逻辑?你在很多借贷、理财平台做一些操作,意味着什么?你有风险,到处借钱,所以它跟风控场景高度相关。第三,我不单装了很多应用,不但不停的打开还每天卸载,卸载了又装,这个跟什么场景有关,作弊。你跟很多羊毛党高度关联。所以我在讲数据的组织层面分两种逻辑,第一以人本为横轴为组织,第二以行业场景为纵轴组织。在我们组织和计划它的时候,我们内心就应该有一套框架。第二,准备玩之后,你数据的应用场景和数据存储规则的时候你怎么去做?简单来讲,你需要有一套很靠谱的原数据管理器和管理平台,把所有的数据都管理起来。我想说的是,大家在做数据存储加工治理的时候,数据不能简单只是数据,数据要有信息,数据要放到场景里面去就意味着数据要有增强。要带出很多不一样的信息进去。
你把这些偏枯燥的,偏单调,格式化,标准化的数据跟你的一些业务结合的时候,实际上是做数据增强,你得有一套数据增强的存储结构,方法论或者模型。所以我们讲智能化的数据处理才是大数据时代的优势,如果你在处理这个数据的时候,没有一套智能化的方法,没有一套基于场景为导向的方法,你的数据仅仅是存储而已,没有灵魂。一旦你做的数据增强之后,数据就会变成灵活的资产存在你这个企业,但是仅此还不够,你要用来支撑你下一步的商业行为,无论是用来做营销,还是做风控,还是做各种放作弊,总之需要有下一步的行动。这个行动取决于场景,这个场景取决于你数据的存储有多么好的灵活性,资产化是否足以支撑你后面的使用。治理结构之后是什么?是在整个治理过程当中有两点理念必须保证,必须让这个参与数据治理过程的所有同事、员工甚至客户都能够理解,都能够做到,第一安全,第二质量,没有质量的数据不叫数据,叫做噪音和垃圾。
TalkingData为了保障数据质量,首先我们公司的数据理念,从上到下贯彻和培训,必须要符合国家政策,必须要符合你所服务的行业规范,但是同时你的数据过程必须要贴近你的用户场景,不仅仅是数据。而且你的数据使用的全过程可以循环评估,因为数据本身是流动的。这次使用不好,不代表永远不好,但是你要有一个循环评估的体系,这次不好可以做到优化,可以做到下次更好,下下次好上更好。
第二,我们有支撑这个理念的质量工具,无论是原数据管理平台,还是我们与各类企业,各类合作伙伴创建的72个标准的样本库,用来校验各种数据和数据服务。我们有对所有数据的交叉模型和监控评估,仅此还不够,没有量化的结果最终还是很难做到客观的评估,我们在质量指标上,我们有社会指标,规范性指标,技术性指标,数据运营指标,基本上每一个都是我们这几年提炼出来的精华。数据质量做到了之后,我们必须要保证数据安全,大数据时代,所有的人对企业,对个人的数据都非常的关注。所以,我们讲,我们有一个三纵四横的安全保障提高,数据的使用必须要符合国家的使用。由于我们是跟2B的客户合作,所有必须要保障你所有的企业客户信息。
第三,在使用具体过程当中,要脱敏掉所有的个体信息。另外一个,是指数据在使用的过程当中,因为数据是流动的。在收集侧,我们有终端加密机制。在手机侧加密,传输过程当中也加密。传输过程当中加密既要符合ATPS的机制,我们还有一个数据包还有合包加密,我们有两重加密。最后我们所有的IT都是TalkingData生成了一个统计学的ID,用来统计和分析,给所有的个体脱敏。这是TalkingData数据安全保障体系。
有了我们刚才讲的数据治理和数据工程,我们在做什么呢?其实,可以简单的讲,我们是基于人本数据为中心,把一个设备贴上它的行业属性,结合它的应用场景,或者对性迥场景做深入的挖掘,希望能够预测、支持一些商业的动作,这个动作可能是你的搜索、浏览、收藏。但是我们基于现有数据对你这些人贴上标签,就像上午崔晓波分享的一样,我们学到了七种人,在我们定义前也会像以前传统的行业定义一样,男女、白领,务工人员,但是我们发现这七类人与我们以前的认知都不一样,但是他是社会生活当中我们客观看到的,与我们认知是高度一致的。这种认知怎么来?怎么通过技术来?它有一个基础,需要我们对各种设备贴上标签,需要我们对这些设备出现的场景做场景化分析。通过建模,通过分析我们才能够预测,或者分析它的下一步动作,与我们相关的合作伙伴和企业商业决策提供更好的依据。
所以我们的数据科学是很贴近场景和业务的。大家会说了,说了半天,这些都是你们TalkingData自己的能力,我们如何用?我告诉大家,从去年开始我们有过这样的讨论,我们决定把我们和很多很多合作伙伴,很多企业合作的这些方法论,这些场景,这些数据服务全部开放出来。我们开放所讲的,所应用过的,所提炼的这些数据能力,这就是我们的智能数据服务平台。你们可以在我们的官网看到。在这个平台里面,你们能看到我们有很多不一样的数据合作伙伴,不仅仅是移动端的数据,还有各行各业的专业级数据,你们也会看到有很多的数据服务,可能他们以前只出现在我们的直接客户那里,但是没有关系,现在你们可以直接使用。
这里面基本上我们会覆盖像金融、房产、零售、营销、互联网相关的行业,每一个行业我们都有相应的数据能力的展现,数据服务的输出。期望能通过这种开放,帮助更多的企业在数据的海洋里面提炼价值,包括更多的合作伙伴能和我们一起做深做强,做大客户价值。在这个过程当中我们还发现,很多在一些行业里面积淀很深的企业说,你们的数据能力和服务,总感觉差一点事,总感觉差不多要到了还差一点,我们自己做是不是更好?所以今年我们又有一个新的举措,我们期望能够把我们构建数据能力的数据级开放出来,无论是关系的,还是人本的,还是感知的,还是基于场景的。我们会把这些数据集开放给各种企业,研究机构,个人开发者,我们期望大家通过我们开放的数据集一起探索更好的数据模型,更好的数据场景应用解决方案,为更多的企业提供更好的服务。
这是我今天总体的分享,最后总结一下,我们期望在数据的世界里面,选择开放的态度,和所有的企业合作伙伴共赢,谢谢大家。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。