大数据平台描述.docx
《大数据平台描述.docx》由会员分享,可在线阅读,更多相关《大数据平台描述.docx(14页珍藏版)》请在第一文库网上搜索。
1、大数据平台在系统结构上包括数据采集系统、数据库管理系统、数据融合系统、资源服务管理系统、平台管理系统、任务调度管理系统、数据分析系统、数据可视化系统,如图所示:图:大数据平台系统结构1.1.1.1数据采集系统1)系统概述数据采集子系统通过多种方式和途径,把政府和企业各个部门的数据、物联网的数据、互联网的数据汇聚到大数据中心。基于大容量、消息和事件的数据导入,面向不同格式的结构化、非结构化和流形式的城市数据,提供易于运营的多种数据源管理和格式转换以及原始数据的临时存储。2)系统结构数据采集子系统通过丰富多样可供选择的采集方式,包括系统直采填写、数据导入、数据交换、网络抓取、API接口调用、感知设
2、备对接等多种方式把政府和企业各个部门的数据汇聚到数据服务中心。数据格式包括传统的结构化数据,或视频、录音、图片、文本等非结构化的数据,并可实现采集自动归类和预处理。其基本原理如下图所示:图:数据采集总体架构数据采集子系统通过不同数据节点,通过数据的推拉,将政府和企业各部门的数据汇聚到数据服务中心,形成数据服务中心的基础数据资源库。3)系统功能数据采集系统的功能包括数据源管理、指标项管理、集群管理、流程管理、流程日志、服务日志、插件管理。(1)数据源管理:数据源管理主要解决政府各个部门、互联网爬取站点和物联网设备的数据源注册和管理,目前系统支持数据源包括:MySQL数据库、Oracle数据库、H
3、base、Hive、NoSQL数据、云数据库、大文件系统、小文件系统等各种关系性数据库和非关系数据库。数据源中存储了所有建立数据库连接的信息,就象通过指定文件名可以在文件系统中找到文件一样,通过提供正确的数据源名称,用户可以找到相应的数据库连接;能够实现多类型数据源的注册、查询和管理等功能。(2)指标项注册:包括采集指标项注册,下发指标项注册,对需要做共享交换的数据进行登记,配置好交换数据的源和目标,这个功能就是对所有指标项做统一的管理。(3)集群管理:集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务
4、器;集群配置是用于提高可用性和可缩放性;集群管理就是对所有的节点机的管理,包括节点机的激活,禁用,并对激活的节点机进行监控。(4)流程管理:包括规则定制,流程定制,任务定制,流程监听和任务监听等模块。流程管理是在多个参与者之间按照某种预定义的规则流程传递信息,或让任务的过程自动进行,从而实现预期的业务目标实现。流程管理是业务整合的关键控制链,是业务协同处理的中心集成者和管理者。规则定制解决交换过程中库之间格式不能正常交换等问题,在流程定制时根据需求选择规则来定制流程;流程定制完全是拖拽方式,可定制化流程配置即可实现数据传输;添加,启动任务调度流程运行,可设置任务执行的生效时间,频率;可分别对流
5、程和任务做监听。(5)监控管理:主要是对各种不同的数据源采集过程进行监控,能监控到每一批数据采集的结果,能统计到每天数据采集的结果,通过监控管理能很清楚的了解数据汇聚的全部情况,为数据采集提供了良好的运维支撑。(6)日志管理:包括,流程日志和服务日志,流程日志用于流程运行监控;服务日志,用于系统运行监控。(7)插件管理:包括基础插件、数据库插件、本地文件、FTPServer、Windows远程共享、Linux远程共享目录、Cloud File。1.1.1.2数据库管理系统1)系统概述数据库管理子系统为城市数据采集的结构化数据、非结构化数据的提供云存储和管理服务,存储和丰富日常操作数据的数据库系
6、统和集中整合不同行业的历史和当前数据的数据仓库,实现各类数据按照约束条件进行汇聚,并提供数据访问的安全策略执行,并按照数据安全服务协议提供数据信息服务,实现对城市信息资源的统一汇聚和监控。2)系统结构数据服务中心对采集后的数据进行统一的存储,由计算节点的本地磁盘、存储阵列、分布式文件系统(如HDFS、CFS、GLUSTERFS等)、NAS等组成。具体数据存储包括但不限于分布式文件系统、分布式缓存、分布式数据库和分布式索引等多种方式存储,既实现数据调用的灵活性和及时性,又保证数据的汇聚和融合的高效性。数据库管理子系统根据数据类型和特征采用分层建模,方便数据管理,提高数据查询的速度。数据库管理基本
7、结构如下图所示:图:数据库管理结构模型3)系统功能数据库管理系统的功能包括仪表盘、数据库管理、索引管理、数据导入导出、数据备份管理、文件存储管理、文件导入导出、文件备份管理。(1)仪表盘:数据源表统计;(2)数据库管理:数据存储配置、表管理、数据浏览;(3)索引管理:索引库管理、索引表管理、索引规则定制、索引数据浏览;(4)数据导入导出:数据导入、数据导出;(5)数据备份管理:备份规则、备份任务、备份日志;(6)文件存储管理:文件存储配置、存储路径配置、文件数据浏览;(7)文件导入导出:文件导入、文件导出;(8)文件备份管理:备份规则、备份任务、备份日志。1.1.1.3数据融合系统1)系统概述
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 平台 描述