中国中铁股份有限公司(China Railway Group Limited,CREC)是集基建建设、勘察设计与咨询服务、工程设备和零部件制造、房地产开发、铁路和公路投资及运营、矿产资源开发、物资贸易等业务于一体的多功能、特大型企业集团,也是中国和亚洲最大的多功能综合型建设集团。
中国中铁股份有限公司前身是成立于1950年3月的中华人民共和国铁道部工程总局和设计总局,2007年9月整体重组为中国中铁。2005年、2006年,中国中铁股份有限公司分别位列全球第四、第三大建筑工程承包商;2014年,中国中铁股份有限公司在世界企业500强中排名第86位,在世界品牌500强中排名第417位。2015年,中国中铁股份有限公司位列2015年中国500强排行榜第7位。2015年9月,中国中铁发布公告,将与中铁二局资产整合。
经过多年的信息化进程,软件与业务的贴合度愈发提高,为业务及业务人员都提供了一定的支持,但是随着各业务系统的不断使用和迭代更新,某些数据的问题也渐渐地暴露出来,我们总结了这几个方面:
1、不一致,即不同分支机构对物资划分归类不一致,集团层面不能良好的归类管理、分析。
2、不规范,即存在同一字段多种填写方式的情况,例如:规格型号有写长180cm宽50cm高50cm和180*50*50。
3、不完善,即存在业务系统对录入数据校验不严谨的情况,存在应为必填项但没有该方面内容校验的情况。
4、有冗余,即存在单系统内的重复数据以及多系统间共有数据不能重用的问题。
随着这些问题的出现,我司也明确的认识到,产业信息化不再仅仅是有系统可用,还要对系统维修保养,需要对数据归类治理。至此,我们准备从两个角度去整理维护和明确规范现有及以后会产生的数据。为此,我们制定了数据治理两步走的计划。
第一步:制定数据整个生命周期制度
以“明确目标、界定范围、合理规划、高效实施”为总体思路。
结合中翰软件10多年来数据治理的经验,且参照了国家信息化相关标准体系、相关行业的标准体系以及针对中国中铁各业务部门的现状、需求的整理分析、汇总从而进行专项整治。
制定《数据管理标准化管理体系集册》,包含:《数据管理制度、流程、组织、考核机制文件分册》、《数据验证体系分册》、《数据质量管理体系分册》、《数据安全管理体系分册》、《数据交换管理规范分册》、《数据编码及模型定稿》(即《编码手册》)。
第二步:针对历史数据进行数据清洗
总体思路为根据时间节点划分数据,针对不同阶段数据进行清洗。
不影响原有数据的准确性,制定数据模型时要达到清晰易懂,按照先进性、可靠性、一致性、通用性进行设计,行业内成熟的企业数据标准体系,形成中国中铁特色的数据模型基础。并且保证数据模型的相对稳定,支持数据模型的扩展与优化,进而保证企业信息资源的可持续利用。治理过程中,类别体系和信息模型体系的并行确立,避免类别体系和信息模型串行建立过程中相互调整造成的项目周期的不可控。
数据类型包括:人员数据、部门数据、科目数据物资数据、设备数据、物资类别、设备类别等,这些数据的特点是模型单一,数据清洗较简单。具体操作为先查重再完善方式,即为先查找重复项,然后进行数据信息的自动和手段完善。查重的方式是根据相似度进行模糊匹配和完全匹配等,信息完善是通过系统自动和手动进行的。排重分为三个部分,排重规则,排重结果,排重详情。任务:分为单独、合并两种模式。编码:分为单独、合并两种模式。追加映射:选中未清洗数据,选择一条已经清洗的数据作为主任务单,将未清洗数据追加到已经清洗的数据上。
在上述理论与实际落实后,我司基本达到了以下成果:落地了数据治理平台。建立全集团设备物资数据模型10052个,确立科学规范的大类65个,种类352个,小类10052个,数据清洗23万条。制定了《数据编码手册》,《数据管理制度手册》,《数据管理流程手册》,数据治理效果明显。