我国最早意识到数据治理重要性的行业是金融行业,金融行业对数据的依赖性很强,而数据治理是数据平台建设的主要限制因素。
数据治理平台是以元数据为基础,实现数据的产生、存储、迁移、使用、归档、销毁等环节的数据生命周期管理。实现数据从源到数据中心再到应用端的全过程管理,为用户提供了准确便捷的企业资产信息。数据治理平台也包括数据标准,数据质量。
数据治理分为四个阶段
第一阶段,梳理企业信息,构建企业的数据资产库。首先要清楚企业的数据模型、数据关系,对企业资产形成业务视图、技术视图等针对不同用户视角的展示。
第二阶段,建立管理流程,落地数据标准,提升数据质量。从企业角度梳理质量问题,紧抓标准落地。
第三阶段,直接为用户提供价值。本阶段依赖于前两个阶段的建设,为用户提供方便的获取数据的途径。
第四阶段,为企业提供数据价值。通过多种手段对多种来源的数据进行分析,形成企业知识图谱,体现数据的深层价值。
通过这4个阶段的建设,建立起全企业的数据质量管控平台,以用户为中心,由用户使用数据并通过用户的使用优化数据质量,既达到了数据治理的目标,也最大限度的发挥了数据的价值。
大数据时代,企业急需建立以用户为中心的自服务大数据治理,信息梳理、数据管控、连接用户、智能化是实现自服务大数据治理的四个主要阶段,掌握一系列关键技术和技术原则,是实现自服务大数据治理的重要基础。