商业银行非结构化数据治理方法初探.docx
《商业银行非结构化数据治理方法初探.docx》由会员分享,可在线阅读,更多相关《商业银行非结构化数据治理方法初探.docx(5页珍藏版)》请在第一文库网上搜索。
1、当前,浦发银行正全面推进数字化转型,构建数据驱动的经营体系。数据驱动能力提升对数据治理提出了更高的要求。良好的数据治理能够打通企业内部数据壁垒,全面提升数据质量,支撑业务创新发展,加速数据价值释放。随着大数据技术在商业银行的广泛应用,数据作为基础性战略资源的地位日益凸显,但大数据的“4V”特性(巨量性、多样性、快速性、低密性)给传统的数据治理带来挑战,催生出大数据治理,而大数据治理的难点在于非结构化数据的治理。商业银行非结构化数据主要来源于日常与客户相关的经营活动,如客户在办理业务时产生的身份核查信息和业务凭证影像;客户在购买理财产品、远程开户时按监管要求进行“双录”产生的音频和视频;以及银行
2、系统内记录的日志文件和市场调查等非结构化数据。随着数字化转型战略的实施,客户旅程分析、数据驱动网点重构、智能风控等举措相继落地,需要使用情绪识别、生物识别、OCR、智能语音等A1技术对客户的生物特征、影像资料、语音等非结构化数据进行加工处理,实现“千人千面”客户营销、智能的投资顾问、基于知识图谱的风险共同体识别等应用,这在客观上也对非结构化数据治理提出要求。2018年5月,银保监会发布了银行业金融机构数据治理指引,不仅强调数据质量与安全等方面的治理,而且重视数据应用与数据治理互相促进,通过数据驱动发挥数据价值。本文基于浦发银行现有数据治理成果,探索了非结构化数据治理的方法和实践。一、非结构化数
3、据治理体系非结构化数据与业务流程中产生或使用的结构化数据密切关联,例如,一张业务凭证的影像是非结构化数据,但影像中的具体业务要素,如账号是作为结构化数据存储在关系型数据库中的,因此非结构化数据治理与结构化数据治理密切相关,是建立在传统的数据治理基础之上的;从非结构化数据生命周期来看,非结构化数据的产生、应用是与特定的业务场景相关联的,如一段客服中心的音频数据可以从投诉、咨询、电话营销等业务场景中产生,因此非结构化数据治理应该是业务驱动的,即采取业务驱动的数据治理方法。非结构化数据治理框架如图1所示。经过十余年的持续建设,浦发银行已建立较为完善的数据治理体系,包括明确数据治理组织架构、开展十大领
4、域数据管理、发布各项规章制度和管理流程以及优化数据治理支撑工具,同时将现有的数据治理模式延伸并覆盖到非结构化数据。业务驱动是推进非结构化数据治理的关键,具体内容包括:以业务流程为主线,根据业务场景开展非结构化数据治理;发挥现有的集中作业优势,使用先进技术手段将非结构化数据转换为结构化数据,重点解决业务主数据的一致性问题;设计非结构化元数据模型,创新应用人工智能的信息提取技术,解析不确定、不易获取(如影音、视频)的非结构化数据内容;建立非结构化数据资产目录,形成业务人员能看懂的数据地图,实现非结构化数据资产业务价值。二、非结构化数据治理方法非结构化数据的格式非常多样,标准也是多样的,而且在技术上
5、非结构化信息比结构化信息更难标准化和被理解。例如,一张汇款凭证影像作为非结构化数据存在两类数据标准:一类是影像本身的标准,必须达到200DP1以上(业内实践标准),否则无法进行自动验印;另一类是凭证承载的业务要素,如账号、金额等也必须遵从数据标准。同时,非结构化数据治理是基于SCheII1aonRead的模式,即在采集各类非结构化数据时不需要定义各种数据库对象。这就导致非结构化数据在“本体”描述方面,即数据本身的定义和格式上无法清晰描述,因此需要为非结构化数据提供分类、语义支持。目前,业内权威的数据管理理论模型在具体到非结构化数据治理的实践方面,仅具有一般性的指导意义,距离治理的落地实施还有一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 商业银行 结构 数据 治理 方法 初探