您当前位置:首页 > 国研视点 > 媒体访谈 > 正文
李广乾:数据中台建设将把数字中国推向纵深
2020-02-07 00:00

听说过“数据中台”吗?知道数据中台的作用吗?搞数字化转型,当下如果不谈数据中台,你好意思张口吗?

总结过去的一年,说“2019年是数据中台热”,业内恐无人反驳。这样的说法之所以成立,主要基于两个“热”:数据中台建设是业内关注的热点,数据中台融资是行业投资的热点。

有人说,2019是数据中台元年。这样的说法不能说不对,但至少不确切。事实上,早在2015年马云带队参访芬兰著名移动游戏公司Supercell时,就已提出数据中台一词。此后,根据马云的架构思想,阿里推出了基于“大中台+小前台”运营模式的竞争战略,继而通过贯彻这一战略,集团不仅较好地避免了以体制僵化为主要特征的“大企业病”,而且随着企业规模的迅速扩大,其营收增速却并未下降,始终保持在40%以上。

2019年天猫双十一购物节落幕,最终成交额定格在2684亿元,再次刷新了互联网电商平台交易记录,成为中国新消费的又一个里程碑。值得注意的是,在收获双十一战果的同时,阿里内部的“中台战略”也愈发引人关注。如今包括阿里饿了么在内的互联网团餐电商领域,也有平台级玩家在试水数据中台模式。

以数据中台推动数字化转型,阿里不仅是这一战略的践行者,也是这一理念的推动者。一个明显的佐证是,当下提供数据中台综合解决方案的主要企业,大多与“阿里系”相关。

2019年,数据中台建设仿佛一夜之间成为业内最为关注的热点:国家电网正在建设数据中台,青岛政务数据中台建设启动,字节跳动数据中台建设成效显著,网易零售数据中台对外开放,360金融数据中台建设起航,科大讯飞数据中台赋能智能营销,贝因美携手阿里云打造数据中台,袋鼠云、奇点云、数澜科技打造一站式数据中台……从年初开始,不仅有行业内对数据中台定义的百家争鸣,有各行各业对数据中台建设的抢先投入,更有华为、腾讯、万科、京东等诸多行业头部企业带动起来的对数据中台落地实践的探索热潮。

在2019年数字化转型舞台上,数据中台稳居核心位置。以数澜科技为例,2016年到2017年,这家主打数据中台服务的企业只有3家客户;2018年,新增客户达到10余家;2019年前三季度,新增客户数十家,且代表客户是来自各行业的头部企业,如万科地产、方太集团、雪松控股、中信云网、兴业银行、时尚集团、视源电子、喜茶等。

服务业绩的高速增长,自然引发行业投资的追逐热潮,即便是在资本寒冬的背景下,以建设数据中台为核心业务的创业型服务商,也频频受到资本的青睐。2019年,包括袋鼠云、奇点云、数澜科技、才云科技、熵简科技等在内的多家相关企业,成功获得新一轮的战略投资。

然而令人尴尬的是,在回答“什么是数据中台”“数据中台的业务模块应包含哪些”“数据中台当如何建设”这些问题时,一百个人又有一百个以上的说法。针对这一现状,《中国发展观察》杂志记者日前对国务院发展研究中心研究员李广乾博士进行了专访。

不要低估科学理论的价值

记者:在最近半年多的时间,您发表了多篇有关政府数据开放与整合政策研究等内容的论文,文章中出现了一些新的提法,比如国家主数据、轻装信息化、数据中台建设等。论文还对这些新的提法在概念解析、应用前景分析、相关政策建议等方面,做了深入的研究。事后,这些论文又被收入您的新著《政府数据整合政策研究》。与如火如荼的大数据发展及其财富实践相比,这些理论上的探索,价值何在?

李广乾:我们国家在数据开发和互联网商业平台应用等方面,确实取得了令世人瞩目的成就。在某些方面,我们甚至已经遥遥领先,比如平台电商、短视频传播、移动支付等。但在科学理论的研究和创新方面,不尽如人意。与成功的应用实践相比,逐步深入的理论研究,其价值在哪里,我想这两者的关系与哲学上“理论与实践的关系”一致,即理论对实践有能动的反作用,理论可以成为实践的先导,且可以指明实践的正确方向。我认为,由系列的概念、判断和推理所组成的科学理论,必将对实践起到重大的指导作用。

理论研究的价值,首先是理论可以而且应该走在实践的前头,指导实践的进程;其次,科学理论能预见未来,端正实践的方向;再次,科学理论作为一种精神力量,能推动人们在实践中不断创新。因此,不要低估科学理论的价值,更不要低估科学理论研究给国家的文化自信带来的潜在影响力。

记者:最近一两年,在互联网领域,没有哪一个概念能像“数据中台”这么火热的了;同样是在互联网领域,近年来出现的诸多新概念中,再也没有像“数据中台”这样让人搞不懂的了……问题到底出在哪里?

李广乾:一方面,一本正经地讨论数据中台的文章越来越多,有的文章甚至是将其吹破天,认为是一项重大的科学技术创新;另一方面,在这些文章所构建的所谓数据中台的理论架构中,我们却看不出有任何创新的概念、理念或技术,特别是看不出其与现有的有关信息架构设计或前台—后台架构设计有什么本质的区别。这导致人们对数据中台的认识,感到有些模糊。

记者:的确如此,有时候同一个公司的两位高管,对数据中台的表述都不相同。当前,围绕数据中台的概念,人们又发展出了业务中台、技术中台、组织中台等诸多概念。不过在这些概念中,我们看到“数据中台”仍是其核心。对于“中台”问题的研究,当下存在着哪些模糊不清的问题?

李广乾:首先是定义不清。从我接触到的文章来看,大家似乎都对别人的中台定义不满意,都想“亲自”去为其再定义一次。再看我整理出来的8个有代表性的中台定义,显然业内专业人士对中台的解释也很不一致,有的定义甚至还谈不上是严格的定义,充其量只能说是对中台某方面属性的简单描述。

其次是缺乏明确的架构模型。当前人们在讨论中台的信息化架构时,大多使用阿里巴巴业务架构中的“共享业务事业部”概念。事实上,这只能展示阿里业务系统的基本情况,说明“共享业务事业部”对于阿里巴巴各业务系统之间的前后台关系和相互联系,但其中并没有具体描述各模块间的数据流转关系;而且从逻辑上讲,这一事业部中的8大模块,即“用户中心”“商品中心”“交易中心”“评价中心”“店铺中心”“搜索中心”“数据服务中心”“营销中心”,数据颗粒度并不一致。

我们再拿OPPO和袋鼠云(袋鼠云自称是阿里云数据平台金牌合作伙伴)两家公司的数据中台架构开发方案,与阿里的业务架构做比较,发现三家企业对于数据中台的认识和架构也存在着很大的不同,中台含义仍然模糊。

第三是无法区别“中台”与平台、前台—后台、大数据等概念之间的相互关系。中台实践,首先是以阿里“大中台、小前台”战略的面目出现的,在这个战略里面缺少“前台—后台”关系以及平台的功能和地位问题。实际上,从某种意义上讲,如果能够科学合理地设计后台并能有效地处理业务和数据之间的衔接关系,也就不存在所谓的中台了。因此,所谓的中台战略,必须说清楚中台是如何从后台分离出来的,以及分离之后的中台与后台的联系和关系。然而从目前众多的文章来看,我们无法得到满意的答案。

此外,现在众多中台的定义与大数据关联不够。当前人们将“中台”划分为业务中台、技术中台、组织中台和数据中台等几类,并从模块化、组件化、通用性等几个核心特征去界定其各自属性。然而事实上,光有这几个核心特征是不够的,特别是无法深入地分析数据中台的独特性及其专业属性。所谓的“数据中台”与“业务中台”有着本质的不同,不应该简单地以模块化、组件化、通用性去模糊、掩盖其相互间的巨大差别。数据中台的这种独特性,只有从大数据中去寻找。

科学界定数据中台需遵循三个原则

记者:数据中台被誉为大数据的下一站,由阿里提出,其核心思想是数据共享。2018年,藉由“腾讯数据中台论”,这一包含着产业和投资双重热点的概念,再度成为业界谈论的焦点。既然现有文献有关“中台”的理论,难以担负起指导实践的重任,那么正确的研究路径该如何选择?

李广乾:为了克服当前有关中台理论构建及其信息化架构的诸多不足,有必要明确和理解三个原则问题。首先是要遵循数据管理科学发展的基本规律。

最近十年来,数据资源管理科学正在不断出现新的技术与理论。这个问题可以从两个角度来认识和理解。一是主数据正在成为数据资源整合的一个崭新工具和手段,从近年来企业信息化和数据库建设实践来看,主数据及主数据管理已经成为人们建设基础数据库的基本方法。这些发展趋势表明,作为数据分离趋势中的主要内容形式的元数据、主数据,应该成为数据中台的核心内容。

二是这种技术与理论创新,来自于企业(信息)架构的不断深化。上世纪80年代出现的Zachmann模型,有力地推动了企业架构技术的发展,并带动了企业信息架构技术的进步与繁荣。特别是在美国一些政府机构的作用下,企业信息架构标准化取得了很大进展,并成为国际标准化组织的规范来源。当前,企业信息化建设不仅需要构建技术架构、业务架构,也要构建数据架构。

记者:对于业务、技术和数据,企业必须分别构建各自的业务参考模型。这是否意味着,企业以前的业务架构,无法等同于以后的中台架构?

李广乾:没错。不应该简单地以所谓的模块化、组件化、通用性去抹平不同类型中台的独特性,特别是不能将所谓的业务中台的属性等同于“数据中台”属性。

FEA(Federal Enterprise Architecture,即美国实施的联邦政府组织架构)是2000年前后发展起来的,当时尚未出现大数据的技术和方法,数据管理知识体系尚未完备地建立起来,因而无法发展出“数据构件”的工具和方法。尽管如此,但从FEA的整个架构及其逻辑关系来看,数据参考模型及应该补充上的“数据构件参考模型”(也就是数据中台),毫无疑问将构成整个信息化架构设计及业务数字化的基础,而仅就中台来看,数据中台将构成业务中台及其他中台的基础。数据中台是中台思维的核心,这是我要明确的第二个原则。

记者:第三个原则是?

李广乾:合理地借鉴现有创新。从以上的分析来看,政府的电子政务架构其实早已发展出当前所谓的“中台”思维了。这是一个合乎逻辑的过程,因为在电子政务发展到一定阶段之后,自然就会面临着一个加强系统整合、克服重复建设的问题,因此在2000年之后,无论是美国还是其他国家,都开始对各自的电子政务建设进行顶层架构设计,在这个过程中自然地就会衍生出前述所谓的“业务中台”来。我国在2006年出台的《国家电子政务总体框架》,也是试图通过借鉴国际上的“业务中台”理念,来克服数据重复建设的难题。

记者:既然电子政务比电子商务更早地发展出了中台思维,那为什么鲜有电子政务领域的“中台”技术得以推广?而且当前互联网企业开展的电子商务所倡导的中台战略,与电子政务也没有传承关系,都是企业独立自主发现并发展起来的。

李广乾:的确如此。不过事实是,我国电子商务企业发展出的中台战略,要比电子政务的中台做法晚得多。出现这种情况,是多种因素相互作用的结果。首先,政府是一个持续存在的组织机构,对于信息化业务系统的发展,很容易进行长期性的战略规划,因而容易发展出合理的架构并找到中台的技术方法;而企业是一种一直置身于市场化竞争中不断演进的存在,自身的生存受到诸多因素的影响,因而对于信息化业务架构的需求,不像政府机构那么强烈。而且,只有等企业发展到相当规模、企业信息化业务系统达到相当复杂的程度、企业相对成熟之后,才能考虑信息化总体规划设计的问题。这也是美国跨国企业的信息化架构相对比较发达的原因。

其次,我国工业企业在发展信息化架构方面的能力和动力均严重不足。改革开放四十年来,我国工业企业主要是做OEM、靠承接外国的业务订单发展起来的,产业链、价值链、供应链都相对单一,在这种情况下是无法发展出合理的信息化架构的,因为信息化架构需要全产业链的系统支撑。而我国的电子商务企业最初大都实力很弱,以复制、模仿外国模式为主,至少在平台发展的前十年,电商是以业务拓展、市场扩张为主。在这一过程中,平台发展出了众多的业务条线及信息系统,这些系统各自独立且互不兼容,给企业的发展壮大带来了很大障碍。近年来随着这些互联网企业的日益成熟,构建科学合理高效的业务信息系统,成为企业的自然选择。与此相得益彰的是,近年来我国BAT类企业的业务规模都已经足够大,有的已经成功晋级世界500强,这给企业实施信息化升级提供了物质基础。这就是互联网企业近期开始热衷于开展所谓数据中台战略的根本原因。

记者:除了为打赢商战,电商企业热衷于发展数据中台战略,对于整个行业来说还有哪些意义?

李广乾:这表明,我国互联网企业已经走出“复制模仿”的阶段,开始独立思考自己的业务系统规划了。而商业上的巨大成功,为创新提供了最好的土壤,不仅为我国开发自己的信息化解决方案、设计自己的数据库产品提供了优越的条件,还有力地促进了我国软件产业的创新发展。从软件发展历史来看,信息架构理论的进步与软件产业的发展如影随行、相互促进又彼此提升,因此数据中台的建设将有力地推进我国软件产业的发展。

小数据是理解数据中台的关键

记者:在您发表的文章中,强调过这样的逻辑,正确构建数据中台的关键,是如何认识和理解大数据的管理属性,而这其中的关键,是如何认识小数据。什么是小数据?

李广乾:对于小数据,互联网研究员吕兰涛给出这样的定义,小数据是指需要新的应用方式才能体现出具有高价值的个体的、高效率的、个性化的信息资产。

事实上,对于小数据的认识和理解,跟“中台”概念一样,也是很不一致的。我理解的小数据,在发表的文章中有专门的论述,这里只提及一些关键的逻辑。

第一,小数据有五个基本属性:与数据容量无关;自身应该包含特定意义,特别是能够反映大数据的某种基本属性;应该是一种结构化数据;应该是对大数据的数据之间关系的宏观描述;与大数据形影相随,其属性相对稳定,且价值要比大数据大得多、明确得多。

第二,根据上述界定,我们给出的定义是,小数据就是描述并管理大数据的数据属性的数据。我们认为,小数据本身并不是什么新创的数据类型,而应该是对于大数据中一些特定数据的概括、总结和归类;这些特定的小数据类型都可以应用现有的专业数据语言(例如元数据、主数据等)去表述。

第三,就常规的大数据信息系统建设而言,小数据为我们认识大数据的核心属性提供了一种有效手段。虽然大数据容量可能很大,但经过初步分析,我们仍然可以从中挖掘、提炼出相关的小数据(元数据、主数据)来。反过来说,小数据虽然数据容量较小,但人们却可以通过小数据去认识大数据系统中的海量数据的基本特征。

记者:那么小数据的治理机制,是如何构成数据中台核心内涵的?

李广乾:当前很多人在讨论数据中台时,都把它看作是一个完整的企业数据系统解决方案,这显然是不合适的。我认为,数据中台应该是企业数据系统解决方案中的那些可共享、可通用的数据业务内容。这意味着,数据中台与数据参考模型是紧密联系在一起的。

我们以电子政务为例,政府职能业务是各自独立的,但每个职能部门处理行政业务的很多流程和程序是类似的,内部管理工作也是类似的;而且这些类似的流程、程序和事务性内部管理工作,与政府职能业务可以没有任何关系,因而可以将其独立出来。当然,就实际情况来看,这种“独立”并非真的要从每个政府职能机构中分离出来,这同行政协调成本和业务时间与机构精简之间的权衡有着密切关系。

不过,服务构件参考模型(业务中台)相对于业务参考模型的这种独立性,在数据参考模型与数据构件参考模型(数据中台)之间并不显著。造成这种差异的原因,在于数据自身的完整性要求。这种完整性,来自业务与数据之间的动态关联性。一个由几类数据综合起来构成一条“信息”的完整过程,作为小数据核心的元数据、主数据也都在其中,如影随行。与业务中台的独立性相比,数据中台的独立性是相对的;脱离大数据管理系统,数据中台就没有价值。因此,数据中台的小数据治理是非常重要的,需要在建立完善相关技术标准和管理规范的条件下,明确各方面职责和业务分工,统筹协调。

我们以法人库的主数据管理为例,来说明数据中台的治理情况。作为国家电子政务四大基础数据库之一,我们不能仅仅将法人主数据管理看作是微观层面的纯技术问题,而必须从国家治理层面去理解和认识。这包括三个方面:首先,从建设来看,法人主数据管理涉及法人的所有注册登记部门和业务主管机关;其次,从应用来看,法人主数据涉及所有的政府业务处理部门以及银行、保险、征信、民生服务等诸多行业和企业;第三,从信息更新来看,法人主数据管理还涉及各行各业,与其应用过程相配套。总之,一方面,法人主数据管理直接服务于各行各业的业务处理过程;另一方面,法人主数据管理必须从国家宏观层面进行建设、管理和维护,统筹考虑各方面的关系,从国家电子政务顶层设计的高度去规划建设。

记者:在厘清了数据中台定义的基础上,如何具体构建数据中台呢?

李广乾:建设数据中台的注意事项和方法,主要体现在这几个方面,一是选择有效的构建方法。目前所见的多数讨论中台问题的材料,大多缺乏合理的架构建构方法,随意性较大。就中台的架构建构方法来看,FEA是很不错的选择。尽管这是规划电子政务的,但对于互联网企业的轻装信息化规划建设,仍然具有理论指导意义。

二是综合规划业务中台和数据中台。当前很多有关中台问题的材料,都是孤立地讨论数据中台或业务中台的建设,从上述分析来看,这显然是不够的。为此,我们借鉴FEA的方法论,在构建业务参考模型的基础上,构建业务中台(服务构件参考模型);在构建数据参考模型的基础上,构建数据中台(数据构件参考模型)。这应该是我们在讨论中台战略时,应该具备的思维路径和技术方法。

需要强调的是,无论是一个国家还是一个企业,都必须基于自身的行业发展特性和具体业务性质,进行深入研究和规划,继而建设与自身发展相匹配的业务中台和数据中台。

三是基于小数据理念构建数据中台。当大多数人将数据中台看作是包罗万象的企业全部的数据解决方案时,会让数据中台失去其时代性、科学性和理论创新价值,尤其是抹杀了我国互联网企业在企业信息化架构建设方面的探索价值、创新意义。

将小数据看作是数据中台建设的核心,并不会降低数据中台建设的地位和作用。事实上,基于前述分析,小数据系统建设仍然是一个非常复杂的工作,是一项系统工程,几乎涵盖企业信息化建设的各个方面,需要各方面的协同配合。

记者:相关研究表明,中国目前有超过80%的企业,仍处于较为初级的数字化转型阶段。社会管理的数字化转型,也处于相同阶段。未来的时代,大数据和人工智能将成为推动发展的两大核心动能,而数据中台的建设,会成为中国数字化转型的新动能吗?

李广乾:习近平总书记指出,“加快数字中国建设,就是要适应我国发展新的历史方位,全面贯彻新发展理念,以信息化培育新动能,用新动能推动新发展,以新发展创造新辉煌。”近年来,“数字中国”高歌猛进,国家积极推进数字产业化、产业数字化,引导数字经济和实体经济深度融合,推动经济高质量发展。

而近十五年以来,信息化对于我国国民经济和社会发展的各个方面都发挥了极大的促进作用。无论是国家的网民规模,还是电子商务交易额、移动支付规模等,中国都已经走在了世界前列。尽管我们的IT技术主要来源于美国,但毫无疑问,在这些年的快速发展过程中,我们仍然遇到了众多的技术和管理问题,我们也很快地解决了这些问题。发现提炼这些问题、总结提高这些问题,都具有特别的意义,不仅表明我们对互联网经济的业务创新、技术进步和理论认识达到了一个新的高度,更是对我们亲历的这段伟大历史进程的最好诠释和纪念。

小数据系统建设是信息化建设的基础性工作,而基于小数据治理机制推动的数据中台建设,在对海量数据进行采集、计算、存储、加工的同时,统一了数据的标准和口径,克服了此前的功利性和赚快钱思维,必将把数字中国建设推向纵深。

(实习生耿瑞蝶对本文亦有贡献)

作者:记者 刘长杰 来源:《中国发展观察》2020年第1-2期 
【关闭窗口】