打开网易新闻 查看更多图片

大数据文摘出品

作者:车品觉

大数据行业已经发展了整整 10 年,而我与大数据的缘分也持续了 10 年。

数据作为数字经济时代的全新生产要素,与数据驱动业务的能力息息相关,这种能力可以被简称为“数据力”。作为大数据行业的先行者之一,我一直在致力于推动数据思维的普及与应用。

从《决战大数据》到《数据的本质》,我希望读者通过这些作品能够切身地理解以下真相:大数据离我们并不远,它正在快速并深刻地改变着我们的社会、环境、经济,乃至我们每个人的生活。

最近几年, 我一直在各地政府机构及众多企业中担任顾问,协助它们真正落实大数据项目。在这个过程中,我以数据思维为基础,将过去的经验升华成了实践的方法论。

现在,是时候把我多年的数据心得提炼出来,一方面公诸同好,另一方面抛砖引玉。也希望生活在这个时代的每一个人都能更加切实地理解大数据如何落地,以及如何为我们的城市、企业做好数字化转型,以建立更美好、可持续发展的世界。

数据,是每个国家、企业的必争之地

用好大数据的前提是“先假设数据都可以获取,而不要被数据的多少限制了想法”,这句话我一直铭记于心。身处大数据时代,我们确实需要一种全新的思维方式,而且这远比数据资源及任何算法都更重要。我认为,我们距离人工智能统治世界的日子还很遥远,但无论何时,赢家永远是也应该是对“数据驱动”有信仰的人, 因为他们坚信:科技的目的是让人们的生活更美好、更幸福。

回顾过往 20 年,让我感到幸运的是,能够在微软、eBay 等数据驱动先锋企业中工作;更让人感到兴奋的是,有幸加入了阿里巴巴这样一家举世瞩目的数据公司。所以对于我来说,不是“万一可以”,而是真的实现了我关于大数据的梦想。

使命完成之后,我于 2016 年离开了阿里巴巴,加入红杉资本担任专家合伙人,我的初衷是,广泛、深入地了解数字生态中不同角色遇到的困难与机遇。意外的惊喜是,这一时期正值京津冀、长三角及粤港澳大湾区加速推动区域数字经济之时,所以,我得以为一些拥有大量数据的互联网企业做数据战略及治理策划。

在担任北京市及上海市政府咨询专家的同时,我也受国务院港澳事务办公室下属的全国港澳研究会的委托,完成了《以数据驱动粤港澳大湾区创新发展规划研究报告》;而且,我还作为北京市大数据推动小组的咨询专家,撰写了《大数据与城市精准治理报告》。

10 年来的所见所闻渐渐让我觉得,有必要为数字化变革提出一个从战略思考到真正落地的顶层设计。从 2014 年出版的《决战大数据》到 2017 年出版的《数据的本质》,我始终相信:数据是未来商业及社会进化的重要资源,其变革的道路上急需一套适用于新时代的顶层设计、技术与业务相互结合的实践方法。

我希望以前两本书为基础,将“以用促通—以通促用”的闭环思想深化到众多政府机构及企业中去,借此加速数字化转型的步伐,同时反过来助推企业组织架构在科技创新的过程中做出改变。数据驱动的思维逻辑正不断冲击着传统的学习方式、组织架构模式、商业运作的底层逻辑结构等,所以,有的企业把这种变革比作“开着飞机换引擎”。我觉得这个比喻绝不为过,而且这种变革的影响可能远远超出我们所想,如果企业的组织架构没有顺利完成变革,甚至可能令整个组织失控。

表面上看,随着无人驾驶、机器人、人工智能等技术的发展, 科技已经成为很多公司的创新手段,但事实上,人们自行安装的各种超级应用,如电子地图、线上零售应用、搜索引擎、个性化新闻推荐应用、打车应用、手机支付应用、政务服务应用、信用评级相关应用等,企业都能够借此积累大量数据资源,并在无形之中影响及掌控着人们的各种生活场景。最近有很多不明所以的动荡正在预示着新时代的到来,我们正处于新旧时代的临界点,没有人能告诉我们未来将会如何,但数据化应用肯定是其中一个重大的影响因素。

我曾经在《决战大数据》中预言,在未来,数据将会成为国家、企业的必争之地,而且从 2016 年到 2019 年各国出台的跨境数据管理法案来看,其重要性和紧迫性已是不言而喻。

5 大阶段,做好数字化变革的重要前提

我想结合我在阿里巴巴的 6 年经历以及近年在京东数科的顾问经验,用 5 个阶段为大家描绘数据驱动的内涵。

阶段 1:将数据作为决策的瞄准器

我们首先希望将数据作为瞄准器,帮助企业了解现状,并为业务发展做出有利的决策,这些决策包括对项目的资源投放、产品开发、营销策划、风险管理、人才培养等。但是,正如我在《数据的本质》中所说,从企业分析的层面看,数据与决策之间并不容易形成闭环,所以数据的稀缺(多盲点)会导致无法真实还原“决策— 行动—结果”这一过程。更关键的是:我们建立的数据指标体系是否足以帮助我们发现问题、找出原因,然后制定出解决方案?

在这一阶段,我们通过数据分析来辅助人类单凭直觉来进行感知这一弱点(基于经验的假设)做决策,然后作为优化手段,再用数据去衡量之前的假设是否成立。这样一来,我们就有了一个模糊的决策闭环。但问题是,答案越模糊,优化行动的迭代时间可能会越漫长。为了积累经验及让联系不够紧密的决策闭环之间的联系可被追溯,更主动地补充还未收集或利用的数据去加强关联指标体系、建立事件跟踪线索及可视化系统则至关重要。在这个层级的管理者需要以身作则,让不同层级的决策者更关注数据化决策意识与能力的提高。

在京东数科的月度经营会议中,常常会见到业务主管被 CEO 问及数据指标的细节及其所表示的现象,只有在这种务实的环境中,分析师、业务人员、产品经理才能发挥出“指哪儿打哪儿”的作用。一个以数据为驱动的月度经营会议,应该像战争中的沙盘推演一样才对。所以,我在此奉劝大家不要迷恋数据大屏幕, 好看的“仪表盘”不一定能发挥出好的作用。

阶段 2:将数据分析嵌入工作流

我相信,只有当数据能力泛化到企业的“神经末梢”上时,数据驱动才算起了作用,因为仅让员工拥有好的数据分析工具及意识无异于隔靴搔痒,得想办法把分析工具应用于更接近工作流的决策环节之中。

举一个典型的例子,在节日促销期间,当需要为促销页面选择商品或者合适的供应商时,类目主管可以在相关系统及工作流中使用契合场景的分析工具。此举能提高分析的便捷性及价值点,数据能力泛化是落地的必要手段,这是一个数据化分析的普及过程,也是产业数据化的里程碑。另一个典型的案例是在产品运营工作中,必须在产品设计的同时就想好其需要收集的数据资料,并配备相关的数据分析功能,否则业务数据的趋势很难被呈现出来。

阶段 3:数据治理让内外资源无缝配合

阿里金融是阿里巴巴的第一个数据创新业务,为中小企业提供信贷服务,其数据来源最初主要是淘宝及天猫上的交易数据,可用于评估借贷风险及还款周期等。作为集团内当时的新业务部门,汇聚其他多源头的跨公司数据并在此基础上保持良好的数据质量,是阿里金融所面临的最大考验。数据治理一般都牵涉内外部资源的配合,例如,最大限度地减少数据收集点的噪声及加入对数据质量的稳定性考虑,都是数据共享过程中无法绕开的部分,跨度越大,困难就越大。

由此可见,为什么城市大数据的数据融合会旷日持久, 但是一旦实现互通,其所带来的价值便会激增。在我参与过的数据治理顾问工作中,这个阶段的成功与否,直接影响到阶段 4 的成功概率。

阶段 4:抓准时机,消灭数据孤岛

每家企业都有自己的核心业务,特别是数据公司更容易找到以数据驱动为核心的系统,如淘宝的商品推荐系统、银行的风控系统、城市的智能运行中心(IOC)等。几乎所有较大的互联网企业都存在算法、分析、人工智能团队在不同业务线中各自为政的问题,也由于这些团队一般各自拥有自己的数据平台,因而数据孤岛的现象很普遍。很多企业都是因为数据委员会的成立,数据孤岛间的障碍才开始得以破除,数据才得以融合。

我当年也是凭借阿里“铁木真”(陆兆禧,阿里巴巴首任 CEO)对公司数字化转型的决心,最终成功组建了阿里巴巴的数据委员会。可能也是因为阿里巴巴数字化转型的成功,“如何建立一个有效的数据委员会”已经成了我被追问最多的问题。这个问题的答案因为企业在数据化的成熟度方面的不同而不尽相同。

在很多企业中,要消灭数据孤岛其实也要把握时机,举例来说,美团和大众点评在合并时如果没有顺势进行数据整合治理,日后处理起来难度将会倍增。但话虽如此,数据孤岛必须被完全消灭吗?我们在后面的章节还会继续探讨这个问题。

阶段 5:运营导向,以数据驱动为核心(智能化)

马云曾在阿里巴巴的一次总裁会议上提出了一个问题:淘宝和天猫的客户都是 24 小时惠顾的,那么为什么高管在半夜和周末都不用上班?从这个问题出发,后来演变成了聚划算商品团的运营自动化,乃至后来诱发无人超市、智能客服等的出现。我作为第一个带领团队开发商品团自动化项目的拓荒者,在这个过程中感受到的数据治理的力度、算法的精准度都要比前述 4 个阶段高几个档次。关键是,你会发现有些数据资源,之前根本没有考虑过要收集,你还会发现很多人们习以为常的决定其实是欠缺依据的。

最有趣的是,在自动化的过程中,业务、技术、产品及数据部门都在强调, 他们才是运营自动化的核心部门并希望成为主导者,所以,要推动运营自动化项目,首先要搞定的是人心。

以上 5 个阶段不一定会依次发生在公司的数字化变革过程中, 而且企业业务性质的差异在不同的企业中呈现出的问题也不一样。但有一个共通之处是:大家最容易犯的错误是过于追求短期效率, 而忽视长远的战略需要。在数字时代,数据治理是一个长期能力的积累过程,在我见过的很多企业中,这一点很容易被忽略。

因此我提议大家关注以下 3 个关键问题:

  • 问题 1:管理层中是否有人专职负责制定数据战略?

  • 问题 2:数据治理的范围是否已经根据数据战略做出调整及计划,且兼顾了长、中、短期的优先顺序?

  • 问题 3:技术如何在此过程中协助减少人力,使人力资本不再成为数据治理的瓶颈,包括使用自动化的手段去提高数据的生产力及使用效率?在此要注意,不同的战略阶段应使用合适的治理方法及技术力度。

我之所以要强调以上不同阶段的区别,是因为我发现:很多企业容易着眼于短期解决方案而忽略在数据治理上存在的系统性问题,一旦发展到数据变得繁杂但业务又需要快速发展的阶段,一切便会陷入纯粹以需求驱动,基础的平台建设必然滞后。随着时间的推移,这些需要大量内部协调的工作会变得越来越困难,直至耗尽组织内部的资源,从而使组织失去长期发展的信心。

想要改善这一问题,企业可以从以下 3 个方面入手:

  • 首先,尝试对过去 12 ~ 24 个月内企业中与数据有关的开发项目进行初步盘点。如果发现因短期利益而得到优先资源投入的项目占比超过 70% 以上,就要警惕了,因为这很可能说明企业内部没有重视长期数据治理。

  • 其次,审视数据在企业内部共享的情况。如果你发现完全相同的数据居然在被重复储存,这意味着数据使用的乱象已然发酵。

  • 最后,许多企业在数据治理和业务优先方面存在矛盾,在BATJA 等大型企业中,有些甚至拥有 3 个以上数据平台, 这种现象屡见不鲜,企业应该思考如何处理这种矛盾。

假如你对以上描述似曾相识,也因此遭受到阻力,无法正常开展相关业务,那么我对你的忠告是:加强数据治理已迫在眉睫。

本文摘自湛庐文化《数循环》。

点「在看」的人都变好看了哦!