案例名称
工商银行数据治理数字化转型项目
案例简介
数字化时代,数据作为生产要素成为推动经济社会发展及转型的新动能。工商银行践行大行职责,积极探索监管报送等创新治理新模式,实现数据治理体系不断迭代提升;运用大数据、人工智能等技术,提升数据治理效率,满足监管机构数据报送要求及业务用数需求。通过实施数据治理数字化转型项目等措施,数据治理能力不断提升,工商银行在2021年成为国内首家获得DCMM5级认证的银行,并在银保监会对银行信息科技监管评级中连续八年同业排名第一。
创新技术/模式应用
本项目通过构建监管报送能力成熟度评估创新机制,基于数据中台实现数据治理成果共享复用的创新模式,运用大数据、人工智能等技术提升数据治理效率,实现数据治理体系不断迭代提升。
创新模式:
一是根据各类监管报送流程总结提炼了监管报送标准报送流程,实现对各类监管报送流程进行标准化数据治理。事前阶段由业务部门解读政策、形成业务需求,再由科技部门进行需求分析及研发;事中阶段进行数据加工、校验、出口规则确认及数据报送。在报送前进行报送出口确认,确认不通过则由业务补录/订正重报。事后阶段,对监管提出的问题进行数据治理。同时构建监管报送能力成熟度评估机制,制定评估指标检查各类监管报送存在的问题和风险,实现监管报送数据质量长效治理。
二是基于数据中台进行明细交易对手信息自动补齐等基础数据治理,实现数据治理成果共享复用,避免重复加工,并通过交易对手白名单方式实现增量管控,提升监管报送数据质量。
三是通过构建企业级数据资产管理平台,实现全行数据资产统一管理和可视化展现,并支持数据血缘分析等,提升数据资产管理及治理能力。
创新技术:
一是广泛应用OCR文字识别等技术到数据采集环节提升源头数据采集质量。如应用OCR文字识别技术实现银行账户户名、账号等凭证要素智能识别和采集,大幅提升数据采集质量和效率。
二是应用深度学习、自然语言处理、知识图谱等技术推动数据治理工作的智能化、自动化。例如对于“企业归属行业”数据,通过构建企业客户行业归属精准分类模型,大幅提升数据质量。
三是应用自然语言处理技术助力数据标准贯标。构建了表字段标准贯标智能推荐模型、数据字典智能维护识别模型,解决了系统研发过程人为判断贯标工作量大、不够精准问题,降低了表字段数据字典维护遗漏情况。
四是通过大数据技术构建企业级数据质量管理平台,支撑上游应用、数据湖、下游应用基于数据湖在线部署检查规则,自动发现数据质量问题,实现线上闭环管理治理流程。
项目效果评估
创新模式效果:
随着大数据、人工智能等监管科技的发展,金融监管呈现出全面监管、实时监管、自动监管、穿透监管、精准监管等特征,对金融机构数据质量治理能力与数字化转型能力的考验。本项目通过构建监管报送能力成熟度评估创新机制,基于数据中台实现数据治理成果共享复用的创新模式,推动治理全行各项监管报送流程200多个问题,减少约1000多名外包人员重复加工工作量。有效管控监管报送系统风险,实现监管报送数据治理体系不断迭代提升。为银行业满足监管数据报送提供了一套可借鉴可复制的创新模式,促进银行业实现数字化转型。
创新技术效果:
一是在凭证信息集中处理场景中,运用OCR、机器学习等技术,实现户名、账号等凭证要素智能识别。目前机器月均处理凭证1700余万笔,准确率98%,凭证处理智能技术替代率达到49%,相当于减少约700名外包人员的工作量。
二是在数据治理工作的智能化、自动化方面,对于“企业归属行业”数据,通过构建企业客户行业归属精准分类模型,准确率达96%,大幅提升数据质量。
三是应用自然语言处理技术助力数据标准贯标方面,通过构建了表字段标准贯标智能推荐模型、数据字典智能维护识别模型,字典识别模型准确率达91%,解决了系统研发过程人为判断贯标工作量大、不够精准问题,降低了表字段数据字典维护遗漏情况。
四是通过企业级数据质量管理平台从多个维度部署了8万余条数据质量规则,守护3万多张业务表的数据质量,累计发现并治理了8000多个数据质量问题。