企业级一站式大数据开发平台理论及实践.docx
《企业级一站式大数据开发平台理论及实践.docx》由会员分享,可在线阅读,更多相关《企业级一站式大数据开发平台理论及实践.docx(12页珍藏版)》请在第一文库网上搜索。
1、企业级一站式大数据开发平台理论及实践导读:本文是个人在从零搭建部门数据及运营平台的过程中的笔记。随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化、半结构化、非结构化数据的产生,越来越多的企业开始在大数据平台下进行数据处理。B l G, DATA本文借鉴了众多网络上公开的案例和实践。旨在为大家提供建设一站式的数据平台的思路。一站式大数据平台,应该提供数据抽取、数据清洗、数据存储、数据分析、数据共享一站式全流程数据治理,以及数据安全、运维监控等管理。使用户能够更有效地利用数据构建核心系统,加速业务创新。我们期待的一站式数据平台应该包含:一站式数据治理:提供数据仓库的构建,多样化抽取任务调
2、度配置,实现业务数据/实时数据抽取清洗,并入库到数据仓库。同时,提供数据仓库数据高效的检索,满足数据的多样化查询需求。数据血缘分析:数据血缘分析是保证数据融合(聚合)质量的关键环节,通过血缘分析实现数据融合处理的可追溯。同时,可分析数据的数据价值。智慧数据目录:数据资产目录提供自定义目录编目、标签系统、资产快速检索,同时支持用户搭建全局知识库,沉淀业务理解。数据可视化:产品将图形语法产品化,用户无需掌握编程,简单拖拉拽即可进行可视化分析数据隐私:针对些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护我们用网易易数官网的典型架构图进行说明:数据服务中心API申请API测试离线开发中
3、心离线开发自助分析可视化调度数据服务数仓设计中心数仓设计指标设计模型设计实时开发中心实时计算资源管理版本管理API管理API发布数据治理中心元数据管理数据质量数据资产数据地图运维中心任务运维集群运维关系型数据库储存和计算中心离线计算引擎 实时计算引擎 OLAP引擎机器学习引擎数据库中间件图中从数据采集、存储、开发和业务支持提供了一站式的服务。并且在此之上支持了以下的数据产品:数据产品中心数据大屏 , 有数报告 自助取数 , 经杂式报表 , 有效移动景, 记晨借号数据睁)Jb I砒幅JF面是几个典型的一站式数据平台的实施方案。微众银行一站式大数据平台解决方案微众银行基于海量数据、数据孤岛等痛点,
4、微众银行的业务模式要求大数据平台解决方案必须:支持海量数据一站式的数据存储和用户体验符合金融级别的可靠性、安全性的要求自主可控低成本在明确大数据平台的目标和要求之后,微众银行形成了一个基于大数据生态的套件平台 WeDataSphere ,整体架构图如下:PortaUQ平台门户通过隔离基础的存储计算引擎和应用客户端,统解决了每个客户端和应用都要HeData phereDataQphere Studio 探索开发应s:SchptiVisuatiScheduUMLLabi。QuickML 数揖应用开发致受可祝化工作流费度矶因学习应用开及酮化机器学习开发;安全管控Exchange Transports
5、 QuaUtiQ Mask/0数匿?拴秀hadoop4解沏步鼓电质星校物效揖投融DatamapLinkiQ 计Hadoop Spark Hbase Kafka Prophed华彳金,当bqo” “ . t SlttW批量计算交互式计算流式计算7?翻S审:J rn P 一次甥航刁在方案中,所有的计算和存储引擎进行了统一,上层的应用开发工具,微众银行全部进行了自主研发。首先解决了存储的统一;其次面对众多计算的客户端,在解决计算的统一入口和调度上,银行自研了大数据领域的计算中间件Linkiso面临的问题,包括权限管控,多租户隔离,多引擎支持,以及计算资源的弹性扩缩容。并且,进一步通过Linkis中间
6、件,把不同客户端之间的数据交互和批量依赖打通,真正能够给业务用户一站式的大数据应用的服务,所有的工具都可以连接起来,并且共享用户权限,用户定义的变量,用户定义的函数,大大提高了数据应用的开发效率,和运维效率。整个平台的运维和管理是集成在Managis这个组件中的,在这个组件里面完成了所有底层、工具和自研组件的运维工作,同时,汇总了监控信息,集成了集群的部署和扩缩容,以及自动化的故障处置。微众银行的大数据平台支撑的银行业务场景包括:*:小额咪户交泉明比查询tW 量制:小/发款白名单查询BDPI靖业管偈:资产明阳互为交互6B/SporkSQL年杂Ten sorFI cm/ SpMi Mib离线流式
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 企业级 一站式大 数据 开发 平台 理论 实践