随着大数据时代的到来,人们已经认识到数据是一种无形的宝贵资产,谷歌、Facebook、阿里巴巴、腾讯等企业市值高达数千亿美元,不仅在于其独特的商业模式和市场垄断地位,更多的估值是给予了其拥有的海量用户数据里所蕴含的巨大价值。对于数据的拥有者和管理者来说,通过对数据的合理管理和有效应用,能盘活并充分释放数据的巨大价值。但如果数据的拥有者和管理者缺乏对数据的有效管理,数据就用不起来,或者即便用起来也用不好,在这种情况下,堆积如山的无序数据给企业带来的是高额的成本,数据成为一项棘手的“负债”。从这个角度来说,数据资产的管理能力,已经成为衡量一家企业能否成功的重要因素。
在讲数据资产管理之前,首先需要厘清数据资产和数据资产管理的概念,区分数据和数据资产的区别。
中国信通院联合多家企业于2019年6月发布了《数据资产管理实践白皮书4.0》,其中将数据资产定义为:由企业拥有或控制的、能够为企业带来未来经济利益的、以物理或者电子方式记录的数据资源,如文件资料、电子数据等。
从这个定义可以看出,数据资产的三个特征为:
1)“企业拥有或控制”:这个特征指明了数据是有其主体的,同时也说明了数据资源可能来源于企业内部的信息系统或者日常经营活动的沉淀,同时也有可能是企业通过外部的交换、购买等手段获取到的。
2)“能带来未来经济利益”:这个特征清楚地表明了在企业中,并非所有的数据都构成数据资产,数据资产是能够为企业产生价值的数据资源。
3)“数据资源”:这个特征表明了数据资产的存在形态,是以物理或者电子方式记录下来的数据。
《数据资产管理实践白皮书4.0》中对数据资产管理的定义为:规划、控制和提供数据及信息资产的一组业务职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、交付和提高数据资产的价值。
从这个定义可以看出,数据资产管理的目的是通过一系列手段,以控制、保护、交付和提高数据资产的价值。
数据资产管理的现状和挑战
在过去,国内大部分领先企业都陆续建设了ERP系统、人力资源系统、供应链管理系统、物流系统、电子商务系统、集成门户、协同办公、决策支持系统等各类信息化系统,这些系统在支撑企业经营活动的同时,也带来了数据量的高速膨胀。随着数据积累逐渐增多,大部分企业在数据管理方面遇到了诸多挑战:
缺乏统一的数据视图:数据资源分布在企业的多个业务系统中,分布在线上线下,甚至企业的内外部,由于缺乏统一的数据视图,数据的管理人员和使用人员无法准确快速地找到自己需要的数据。数据管理人员也无法从宏观层面掌握自己拥有哪些数据资产,拥有多少数据资产,这些数据资产分布在哪里,变化情况怎么样。
数据基础薄弱:大部分企业的数据基础还很薄弱,存在数据标准混乱、数据质量参差不齐、各业务系统之间数据孤岛化严重、没有进行数据资产的萃取等现象,阻碍了数据的有效应用。
数据应用不足:受限于数据基础薄弱和应用能力不足,多数企业的数据应用刚刚起步,主要在精准营销、舆情感知和风险控制等有限场景中进行了一些探索,数据应用的深度不够,应用空间亟待开拓。
数据价值难估:企业难以对数据给业务的贡献进行评估,从而难以像运营有形资产一样运营数据。产生这个问题的原因有两个:一是没有建立起合理的数据价值评估模型;二是数据价值跟企业的商业模式密不可分,在不同应用场景下,同一项数据资产的价值可能截然不同。
缺乏安全的数据环境:随着数据的价值越来越得到全社会的广泛认可,针对数据的犯罪活动日渐猖獗,数据泄露、个人隐私受到伤害等现象层出不穷。很多数据犯罪是因为安全管理制度不完善、缺乏相应的数据安全管控措施导致的。
数据管理浮于表面:没有建立一套符合数据驱动的组织管理制度和流程,没有建设先进的数据管理平台工具,导致数据管理工作很难落地。这些问题已经严重影响到数据价值的发挥,导致企业的数据越积越多,却逐渐成为企业的负担,大数据管理部门也成为企业的成本中心,而不是创新中心和利润部门。
数据资产管理的四个目标
数据资产管理是数据中台面向企业提供数据能力的一个窗口,数据资产中心将企业的数据资产统一管理起来,实现数据资产的可见、可懂、可用、可运营。
可见:通过对数据资产的全面盘点,形成数据资产地图。从数据生产者、管理者、使用者等不同的角度,用数据资产目录的方式共享数据资产,用户可以快速、精确地查找到自己关心的数据资产。
可懂:通过元数据管理,完善对数据资产的描述。同时在数据资产的建设过程中,注重数据资产业务含义的提炼,将数据加工和组织成人人可懂的、无歧义的数据资产。具体来说,在数据中台之上,需要将数据资产进行标签化,标签是面向业务视角的数据组织方式。
可用:通过统一数据标准、提升数据质量和数据安全性等措施,增强数据的可信度,让数据科学家和数据分析人员没有后顾之忧,放心地使用数据资产,降低因为数据不可用、不可信而导致的沟通成本和管理成本。
可运营:数据资产运营的最终目的是让数据价值越滚越大,因此数据资产运营要始终围绕资产价值来开展。通过建立一套符合数据驱动的组织管理制度流程和价值评估体系,促进数据资产建设过程的不断改进,提升数据资产管理的水平,提升数据资产的价值。数据资产管理与数据治理的关系
DAMA和DCMM对数据治理的定义都是:数据治理(Data Governance,DG)是指对数据资产管理行使权力和控制的活动集合(规划、监督和执行)。传统的数据治理内容通常包含:数据标准管理、元数据管理、数据质量管理、数据安全管理、数据生命周期管理等内容。
本文沿用的中国信通院对数据资产管理的定义是:规划、控制和提供数据及信息资产的一组业务职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、交付和提高数据资产的价值。
从上面两段描述看出,数据治理和数据资产管理的定义有异曲同工之处,它们围绕的对象都是数据资产。而中国信通院在《数据资产管理实践白皮书4.0》中阐述的数据资产管理八大职能中,诸如数据标准管理、元数据管理、数据质量管理、数据安全管理等,同时也属于传统数据治理的必要工作内容。数据资产管理在传统数据治理的基础上,加入了数据价值管理、数据共享管理等内容。
近些年的发展来看,数据治理的目标正从“以质量管理为主”,过渡到“质量管理与服务并重”。基于上面的论述,作者认为,数据资产管理就是传统的数据治理的升级版,可以认为是数据治理2.0。
在本文中,不再另外阐述数据治理的内容。
数据资产门户
数据资产地图:数据资产地图为用户提供多层次、多视角的数据资产图形化呈现形式。数据资产地图让用户用最直观的方式,掌握数据资产的概况,如数据总量、每日数据增量、数据资产质量的整体状况、数据资产的分类情况、数据资产的分布情况、数据资产的冷热度排名、各个业务域及系统之间的数据流动关系等。
数据资产目录:数据资产目录通过对数据资产良好地组织,为用户带来直观的体验,可以使用户花较少的时间查找到自己关心的数据资产。
数据资产目录的组织方式灵活多样,常见的有按业务域组织、按数据来源组织、按数据类型组织。
根据用户角色的不同,数据资产目录有多种展现视角,概括来讲,有这三类用户角色:数据资产开发者、数据资产管理者、数据资产使用者。
数据资产开发者关注当前开发的数据资产是否有重复,是否有准确的定义,通过数据资产目录,数据资产开发者可以将自己负责开发的数据资产发布到合理的资产目录下。
数据资产管理者必须掌握数据资产的全局情况,包括拥有哪些数据资产、数据资产分布在哪里、数据资产的质量情况、数据资产的使用情况等。数据资产管理者通过对数据资产的合理授权,控制数据资产的使用。
数据资产使用者关心数据是什么、数据在哪里、如何获取到数据。通过数据资产目录和获取到的合理授权,数据资产使用者能快速定位到自己需要的数据资产,掌握数据资产的存在形式是什么(结构化还是半结构化),如何获取到自己想要的数据,评估现有的数据资产能否满足所建应用的需要。
数据资产检索:数据资产检索服务为用户提供一键式资产检索服务,通过对关键字的匹配,数据资产门户检索出相关的数据资产集,用户可以根据所需,找到相关数据资产,可以查看数据资产的名称、创建者、业务语义、加工过程等详情,帮助其理解和使用数据。