当前位置:首页 > 公司动态
关于数据治理,你想知道的都在这里
  • 发表时间:2020-07-03 点击数:259
  • 来源:未知

 如今,我们正处于一个全新的时代,数据正成为改变世界、改变未来的重要力量。同时,互联网不断延伸,云规模无限扩大,5G技术即将到来,人工智能快速增长,所有这些都将产生大量的数据。

这种转变产生了一个重要的主题——数据治理(Data Governance)。

一、数据治理是什么?

数据治理是目前一个比较新兴的、正在发展的学科,目前业界对它的定义还不完全一样。

Dataversity称数据治理是“有助于确保组织内数据资产正式管理的实践和流程”,包括数据架构组织、数据模型、数据标准、数据质量、数据监控以及帮助组织确保数据安全和数据的正确使用等。

近年来,随着越来越多的企业重视大数据和商务智能,数据治理的重要性也凸显出来。通过准确的数据治理,复杂的数据可以被管理和监控,有效防止数据泄露。

二、数据治理为什么重要?

随着社会的发展,信息化程度不断提高,由此产生了大量敏感数据。由于大量数据关乎个人隐私、商业机密、国家安全,因此数据安全是一个非常重要的问题。

现实生活中的数据泄露比比皆是,这些数据的滥用有可能对个人、企业造成巨大的财产甚至危害国家利益,数据安全是整个数据产业正在面临的重大问题。

保障数据安全需要对敏感数据实际控制者的行为要严加管束,做到合法合规。要避免因为数据的错误使用、泄露,给任何相关方造成不必要的损失。

因此,相关的数据治理非常重要,应该对数据从产生、使用到消亡的整个链条进行严格治理,具体内容包括但不局限于:存储安全管理、访问权限管理、数据防泄露等。

三、数据治理有哪些好处?

实施有效的数据治理可以为企业带来众多好处,包括:

确保企业数据符合重要的数据法规,例如GDPR等;通过清晰的数据梳理,实现数据系统、政策、程序的标准化;降低数据使用的成本,提高运营效率;形成数据谱系,提高数据活动的透明度;减少错误率,增加总收益。

四、数据治理与GDPR有什么关系?

数据治理曾经被认为是某些行业合规性的必要条件,例如金融和保险。

现在,这一条件适用到了更广泛的领域,欧盟在去年5月颁布实施了新的GDPR(通用数据保护条例)。

数据治理可以成为实现GDPR合规的有效手段,它可以清楚地解答以下问题:

企业为客户和员工收集并保留了哪些数据?企业从哪里获得这些数据?谁可以拥有或使用这些数据?如何保障用户的隐私信息不被泄露?数据使用的法律依据是什么?

五、数据治理的核心是什么?

数据治理的核心是数据模型、数据质量、数据标准、主数据管理、数据生命周期、元数据管理和数据安全。

1. 数据模型——做建模

首先,需要由业务人员提出业务需求,并描述业务需求所需的数据内容。

其次,通过业务人员及技术人员合作,根据业务对象抽象出数据概念,定义其描述、分类与关系。

然后,技术人员根据数据概念描述、分类,抽取出数据实体,并利用ER图描述其关系。

最后,技术人员针对数据库特性将数据实体物化为数据库表,支撑实际应用。

2. 数据质量——做清洗

由于互联网及通信技术的飞速发展以及数据量的爆发式增长,各类数据也大规模增长,然而,其中无效数据同样也将大幅度增多,这就要求企业需要对数据质量进行限制。

依据相关规范对数据质量即数据的及时性、完整性以及准确性进行限制,详细地通过事前防范、事中监控、事后管控3个时间段进行监督。

3. 数据标准——做统一

根据已确定的企业核心逻辑数据模型,将模型中的数据项抽取出来。

然后根据预定的业务数据项筛选方法,筛选出需要进行业务定义的数据项。

再根据业务对所筛选出的业务数据项进行分类,产生用于通用数据标准及公共代码定义的数据标准项清单。

而具体的通用数据标准的制定包括定义工作目标、流程、及模版,其分类标准则根据数据在业务中的使用频度和业务需求,参考业界模型,通过汇总分析,对通用数据进行分类,形成统一的数据标准在数据层面的定义,并以数据项自然分类为基础,对数据进行分类。

4. 主数据清理——做编码

主数据是描述核心业务实体的数据,是企业内跨业务重复使用的数据,存在于多个异构的应用系统中,是关键数据,而不是全部数据;是操作性数据,动态参与业务流程,而不是静态数据。

在企业中主数据是全员共享,全员服务的重要数据,与其他数据分离,作为单独的部分进行管理。

5. 数据生命周期——做管理

数据的生命周期包括数据创建、数据使用、数据归档、数据销毁4个阶段。

而数据在生命周期内有效则可以满足业务操作和管理分析的需要;满足对历史数据查询相关政策和管理制度的要求;满足审计管理要求;减少数据冗余,提高数据一致性;减少存储、硬件、运维等方面基础设施投入;提升应用系统性能,提高响应速度。因此,数据生命周期的管理必不可少。

首先,在数据创建阶段,要求利用数据模型保证数据完整;执行数据标准保证数据准确;加入数据质量检查创建准确;保证数据在合理的系统生成。

其次,在数据使用阶段,要求利用元数据监控数据使用;利用数据标准保证数据准确;利用数据质量检查加工准确;确保数据在合理的系统使用;控制数据的派生。

然后,在数据归档阶段,要求利用评估手段保证归档时机;分数据类型归档数据。

最后,在数据销毁阶段,要求利用评估手段保证销毁时机;分数据类型销毁数据。

6. 元数据清理——做规格

元数据是数据仓库的灵魂,它不仅提供了数据仓库中数据结构的逻辑层,也提供了数据仓库的构建和使用规则。

为了使数据仓库中各个软件能够无缝地合作,必须在元数据层进行有效的集成。所以,研究元数据的作用与意义相当重要。

元数据是关于数据的数据,即是对数据资源的描述,按其描述对象的不同可以分3大类:技术元数据、业务元数据和管理元数据。

7. 数据安全——做防范

数据治理的一个重要作用是保障数据的安全。应该从企业级、体系化视角开展数据安全管理顶层设计。

数据统一分类分级后,通过数据鉴权来控制某一类数据可以被哪些系统调取,可以被哪些人员查看,可以被哪些部门共享,对不符合权限的对象进行限制,有效的防止数据泄露风险。

(“数据治理的核心是什么”部分内容参考搜狐号“IT常青树”《中国建行数据治理最佳实践之方法篇》)

世平信息通过对相关法规标准的梳理,结合用户业务场景,对用户信息系统中的数据进行安全性分类分级,制定相应的分类分级防护策略、数据安全架构及组织制度保障,形成对数据全生命周期的安全管控,对管控效果定期检查、审计、评估,并将各项安全策略与架构落实到全套安全技术手段和安全服务措施中,从而实现对敏感信息的细粒度、全方位靶向监控,建立有效的数据安全防护体系。

1. 数据安全分类分级

依据相关法规标准、结合行业业务场景对用户信息系统中的资产和数据进行梳理,在业务系统、流程、事项等业务维度及数据重要性、敏感性、风险性等安全维度上对资产和数据进行分类分级,形成有效的分类分级判定规则,并在安全防护实践中不断迭代优化判定规则。

2. 敏感数据管控策略

对分类分级后的敏感数据按类别级别分别设置相应的归口审批机制、身份权限管控机制、分类分级保护机制和泄露风险管控机制等防护策略。

3. 数据全生命周期管理

将各项敏感数据控制策略落实到针对数据采集、存储、使用、分享、流转、销毁等各节点上的落地防护措施中,实现对数据全生命周期中各类敏感数据的全面管控、防泄露。

4. 检查监控、审计评估

有效的数据安全保障不仅要部署防护措施,还需要配合对防护效果的持续性检查、监控、审计、评估,包括定期执行的安全合规性检查、威胁与脆弱性风险评估、安全巡查值守和安全审计分析,实时了解敏感数据的分布与泄露状况,及时发现安全隐患。

5. 安全架构、组织制度与安全服务

有效的数据安全防护还需要组织机构与制度保障,需要建立并不断优化安全体系架构、安全组织机构、安全管理制度、安全人员培训,且确保提供及时有效的安全服务。