一、总体原则
(一)公司重视、认识统一
数据治理是一项系统性工程,想把这件事情做好,首先要公司重视,所有的团队要达到认识上的统一。这并非形式主义,恰恰非常重要,体现了数据治理的态度和决心。如果认识和态度上不能达成一致,就不会有足够的动力和决心把事情做好。
公司重视是具体的、可见的,要有公司领导全程参与,定期听取数据治理的阶段性计划和工作进展。如果公司上下都重视,大家能够达成一致意见,就会劲往一处使,拧成一股绳。
(二)职责清晰、目标明确
关于职责清晰。公司层面重视,相当于确立了公司层面的KPI,然后需要向下作层层分解,这就涉及到各个部门和业务条线的职责划分,形成清晰的职责分工。就数据而言,企业数据源自两个方面,一是内部产生的,包括各个业务系统运行中产生的;二是外部获取的,包括一些资讯数据供应商提供的,以及通过网络爬虫等技术手段获取的外部公开数据、非结构化数据。作为内部产生的数据,谁产生谁负责、谁使用谁监督,这是比较清晰的、理想的状态,但实践中经常会出现一些“三不管”场景,需要事先做好规则的明确和职责的划分。
关于目标明确。数据作为一种重要资产,需要被充分使用。如果想把数据用好,就要了解数据是被如何使用的?被哪些人使用?在什么时间点使用?这涉及到数据的维度、粒度、层级、时效以及关联关系。以数据使用对象为例,目前数据使用主要包括两个方面,一是外部使用,需要将数据统计汇总后,定期向监管机构和基础设施报送;二是内部使用,用在绩效评估、风险分析、投研分析以及客户服务等方面,几乎涵盖了各个业务职能板块。在明确了使用对象后,我们才能明确数据治理的目标或者方向。举个例子,在做绩效考核的时候,既包括集团公司对资管子公司的考核,还包括公司对下属部门的考核,也包括公司对投资经理的考核,对投资组合或某个产品的业绩归因考核。每个使用对象的需求各不相同,如果不加以明确,数据治理就会南辕北辙。
(三)执行到位、定时检视
再好的战略战术,没有执行也是一句空话。数据治理说到底就是一个执行,就是要执行到位,时间上、质量上达到公司的目标要求,这也要求目标的传导和培训、配套机制的激励和刺激。
执行过程中还要定期进行检视,一是对数据自身的检视,数据质量改变如何,数据应用效果如何。二是对数据治理工作的检视,治理成果如何,有何经验教训,这都需要定期的回顾和分析,以及时校正方向。
二、四大策略
(一)有章可循
公司应成立由高管参与的数据治理领导组织,制定数据治理原则,明确各部门职责分工,包括数据生产者和消费者职责,尽量避免一事一议的低效沟通。因为数据治理涉及到多个部门,如果遇到任何一个问题,都要组织比较多的员工参与,讨论谁来做、谁负责,站在一家公司的角度来看,是价值的极大浪费。
(二)有典可依
需要制定一套比较完备的数据标准及指标字典,能够精简指标数量,同时明确使用场景,这样就可以统一数据口径,明确数据指标内涵,做到概念的清晰和理解的一致。如果指标不统一,口径不清晰,那么在每一个指标上都要作大量的备注或解释,导致大家不断的去核对和讨论。只有使用一套通用语言,车同轨,书同文,才能降低沟通成本,提升工作效率。
(三)有质可保
在数据生产环节,尽量做到每日数据日清日结,在数据经过下一环节加工处理之前,即完成基础数据的准备和核验,避免后续的回溯和返工。究其本质,是一个尽早介入的问题,有点类似我们现在疫情防控,比如说早筛查、早管控等。常规的数据生产环节会产生大量基础数据,基于这些基础数据,会派生出大量数据项或者指标,一旦基础数据有纰漏,就会导致缺陷数据扩散。事后再修复、回溯、刷新,会费时、费力、费神。
(四)有据可查
这里是指数据流应保证系统间的无缝流转衔接,日志及时间戳记录完整,便于数据的排查和追踪,以便于定位最终源头,寻找解决方案。
三、系统支撑
无论是数据治理总体原则,还是“四有”具体策略,要落地形成数据治理最终成果,还需要依靠于流程再造和系统改造。如果数据治理最终只产生一堆文档,而没有在系统层面加以落实的话,数据治理就是低效的,甚至是失败的。因为无论是现在提高数据的准确性、时效性,还是未来为人工智能等新技术应用奠定基础,最终都需要依靠信息系统的支撑。总体原则是纲领,具体策略是方法,系统支撑是基础。