u8,u8国际,u8国际官方网站,u8国际网站,u8国际网址,u8国际链接,u8体育,u8体育官网,u8体育网址,u8注册,u8体育网址,u8官方网站,u8体育APP,u8体育登录,u8体育入口随着数字经济的发展,数字经济与实体经济快速融合,数字经济正成为国家经济、社会进步、企业发展的新引擎,发展数字经济是企业数字化转型的必由之路。银行数字化是促进经济体系产融结合,助力银行经营降本增效的核心战略规划。在数字经济背景下,银行内部审计工作要实现高质量发展也迫切需要推进数字化转型升级,关键是要加强基础数据源头治理。本文以A城市商业银行(以下简称A银行)为例,浅析如何在审计视角下开展数据治理以提升数据质量,并结合实际案例阐述数据治理工作对内部审计数字化转型的重要意义及实现路径。
![]()
随着信息技术的飞速发展,审计工作方法和管理模式也发生了变化。实践证明,“数字赋能”对内部审计转型和发展具有重要意义,能够有效提升审计质量和监督效能,促进企业提高风险防控水平。根据中国人民银行印发的《金融科技发展规划(2022-2025)》和原中国银保监会发布的《关于银行业保险业数字化转型的指导意见》等文件的要求,A银行审计部(以下简称审计部)在总行党委指导下,结合内部审计工作实际积极谋划,重点围绕“数据+技术+平台”夯实基础数据平台建设,提升数据治理能力,落地数据治理成果,实现数据资产化和数据价值变现,推动由碎片化的程序型审计向系统深入的研究型审计转变,不断提升内部审计增加价值能力。
近年来,审计部多次组织业务骨干前往中信、浦发、兴业、广发等股份制银行进行数字化转型先进经验调研。调研发现,数据是内部审计数字化转型的基础,也是数字化转型的难点问题。一是商业银行内部系统之间的“孤岛”现象成为数字化建设的软肋,缺少统一的数据标准或数据标准难以落地,突出表现为数据来源多头、定义不一致、格式不统一、交换困难。二是历史数据遗留问题突出,数据错误、冗余、缺失等质量问题已成为行业通病,严重影响大数据审计、大模型生态的发展。
![]()
![]()
数据治理是一项系统长期工作,并非通过单一项目即可完成。按照审计数据治理框架,审计部确定了“审计数据治理一期工程”的工作重点。一是数据的标准化处理,对已接入审计系统的业务数据进行过滤清洗,并完成码值转换;统一数据表结构,规范数据表、字段标准,实现数据准确表达及提取。二是数据的验证与应用,梳理A银行业务条线数据结构,编制源系统数据字典,确定数据表存储内容和数据表之间的逻辑关系;根据审计工作需要,借助审计工具构建大数据监测模型。具体实施步骤可细分为四个阶段。
针对审计接入数据来源多、格式不统一、定义不一致等数据规范问题,工作组对审计系统已接入的数据表进行了梳理。一是甄别数据表内容。工作组通过与行内数据仓库、上游业务系统等联络人沟通交流,对审计接入数据表进行逐表分析,确保数据表命名能够准确表达其业务含义。二是规范数据表命名。根据审计工作需要,对数据表名、字段名进行了重新定义,剔除了元数据表中的特殊字符,将数据表名及其字段全部转换为中文,降低了审计人员数据应用的难度。三是分类展示数据。审计系统按照“业务数据/源系统简称/数据表名”三级目录进行数据表展示;同时,在同一系统中,针对不同业务属性的数据表进行了分类展示处理,提升了审计人员查找效率。
数据清洗与转换是数据治理工作的难点,针对失效、冗余等数据质量问题,工作组对审计系统已接入的数据进行了过滤清洗。一是确保数据完整性。使用脚本比对审计数据集市与行内数据仓库,对每张数据表的记录数、字段个数、字段排序、空值等指标进行比对,验证数据接入的完整性,并补齐缺失的记录和字段。二是确保数据唯一性。通过表结构主键或唯一标识符,检查数据表中是否存在重复记录,删除失效、冗余的数据记录。三是确保数据有效性。通过数据类型特征,对日期类、数值类、字符类等数据进行特征值分析,检查数据是否满足用户定义条件、是否在一定值域内,修正存在明显错误和域外的数据。
针对接入数据转码错误、无效转码、码值不全等转码问题,工作组对审计系统已接入的数据进行了码值转换。一是确保码值完整性。通过行内数据仓库推送数据比对和源业务系统调研,获取关键字段的中文注释,完成对审计系统已接入数据关键字段码值转换。二是确保码值唯一性。通过脚本去重判断关键字段的码值是否唯一,避免出现一对多的问题。三是确保码值有效性。根据审计工作需要,对需要转码的关键字段能转尽转,剔除释义表达错误的码值,为审计人员准确获取每个字段的含义奠定基础。
为充分验证审计数据治理成果,工作组在数据治理过程中编制了数据字典,并将数据字典转发至各审计团队,各审计团队对审计数据治理成果进行了验证和应用。一是验证数据要素与业务含义表达是否准确一致。二是验证码值转换情况。是否按照前期各审计团队提出的转码需求完成关键字段能转尽转,并对转码结果进行验证。三是推动审计数据应用。以“培训+测试”的形式鼓励审计人员通过“模型分析”工具完成数据分析,进一步强化大数据审计应用。
![]()
![]()
商业银行审计系统数据多来自行内数据仓库,工作组调研发现,部分商业银行审计系统接入的数据中,字符类型占比较高,失去了原有日期类型、数值类型、布尔类型等数据类型的约束,致使数据采集过程中产生了大量的空格、斜杠、回车、换行等特殊字符,在未清洗的情况下,审计人员在进行数据分析时很难精准找到数据。因此,应开展数据源头治理,规范源系统业务数据类型,并在源系统数据入仓时,增加数据清洗和数据转换步骤,以减少下游系统使用数据的难度,进而提升数据整体质量和应用水平。
数据字典是数据分析人员不可或缺的工具,工作组调研发现,部分商业银行业务系统存在数据字典缺失或不完整的情况,许多带有重要含义码值字段的中文注释缺乏系统性,审计人员进行数据分析时,无法快捷、清楚了解每一个字段所代表的真实含义。应由源系统的管理部门牵头,将数据字典纳入本行资产管理,在新建系统时同步完成数据字典的编写工作;对于存量系统,应组织相关人员重新编制数据字典,规范数据标准,以提高数据质量,推动数据精准反哺业务。
工作组经统计发现,很多单个元数据表结构中虽然字段要素较多,但审计人员关注的真正具有业务含义的字段要素,如客户类、交易类、日期类、状态类等,占比不足50%,其余字段要素均为数据关联、数据转换等元数据管理而设置,这对于非科技背景的审计人员来说,理解起来比较困难。应通过采取中间表的形式,对元数据进行数据清洗、转换、汇总计算,生成中间业务表后加载到审计数据集市,以降低审计人员数据理解难度,提升数据分析效率。
审计系统可开拓多种数据结构、多种数据接入方式,加强半结构化、非结构化数据的获取,以拓展审计范围及深度。除了获取常规业务系统数据,还应确保Excel报表数据的无缝接入;利用Python、NLP、RPA语言实现网络爬虫数据的获取和处理,借助OCR、ASR、Hadoop工具实现音视频、图像等非结构化数据的获取和处理;建立标准的数据ETL机制,清洗错误、冗余的垃圾数据,补全缺少的数据元素,做好码值转换,最后分类存储、归集到不同的标准数据库中(见图2)。通过以上措施,努力实现“三个提升”,即大幅提升海量数据的分析效率,提升非结构化数据的处理和分析能力,提升多角度、深层次挖掘问题的能力。
![]()
数据治理只是数字化转型的基础,数据赋能才是数字化转型的目标。随着内部审计数字化转型的不断深入,商业银行内部审计面临的最大挑战是数字化人才的短缺。商业银行迫切需要结合本行实际情况,组建一支攻坚克难“突击队”来引领数字化转型。一是通过以干促学、以考促训等方式,营造良好的“学科技、用科技、谋科技、推科技”工作氛围。二是充分发挥人才第一资源效能,通过自主分析、模型构建等方法,依托SQL编辑器、模型分析、数据挖掘等工具开展大数据审计,助力审计项目疑点分析,持续扩展内部审计的能力边界
@HASHKFK