工业大数据分析HIVE输入与输出教学讲义.docx
《工业大数据分析HIVE输入与输出教学讲义.docx》由会员分享,可在线阅读,更多相关《工业大数据分析HIVE输入与输出教学讲义.docx(8页珍藏版)》请在第一文库网上搜索。
1、任务2.2Hive输入与输出任务概述本任务读取CSV文件数据,并数据存储到大数据平台HIVE数据库中。文本输入节点实现csv文件上传到平台,Hive输出节点通过hive数据源将数据写入大数据平台的hive数据库。本任务中的数据集来源自某台风力电机IOmin间隔SCADA真实运行数据,主要有4个维度信息分别为时间戳(Time)、风速(WindSpeed)功率(Power)和风轮转速(RotorSpeed),包含3426条数据。通过本任务的学习:(1)能够实现HIVE数据源的搭建;(2)能够实现读CSV数据,并写入HIVE数据库。任务实现2.2.1新建hive数据源步骤1:选择算法建模工具中数据管
2、理模块,使用关系数据中创建数据源功能创建hive数据源。图2-2-1为选择创建hive数据源的功能界面。算法建模s*数据源信息道理算法苜页创建经疡5r1痔M数抠状态B38源名稀类型数据分析数据分类1启用SSfiS-tert111MySQ1慢型列表限7z2启用MySQHf1gJfiotacxya1MySQ1平口寄植3启用hive1敢堂蹲Hive制4启用hiveffi-enterprise_history_Hive5 启用案例如酶MySQ16 启用MySQ1KeK-CCitJeachingMySQ1图2-2-1创建hive数据源步骤2:打开图2-2-1中的“创建数据源”的配置界面,输入数据源名称“
3、hive数据源”,在类型中选择“hive”。配置UR1地址,IP为数据源的服务器地址,如10.10.74.134,hive数据库默认端为IOoOO,数据库名enterprisehistorydata(需要在hive数据库服务器预先创建)。输入用户名和密码,单击“测试连接”按钮,连接成功后,显示“数据源测试成功”,单击“完成”保存hive数据源。创建hive数据源的UR1格式:jdbc:hive2:/:1) host:数据库所在服务器的IP地址或主机名2) Port:端口号3) sid:数据库名4) principa1:kerberos身份,可选参数,开启kerberos时需要该参数创建数据源X
4、数据源名梆腿类型HiveV应用于模型数据源UR1jdbchive2z4.1.74.134:10000/enterp&historydata|用户名hive空码|台0t!5画5空闲回收时间5(分钟)asis趣图2-2-2配置hive数据源步骤3:对新建hive数据源分配访问权限。选择“数据管理”中的“数据权限”功能,在“组织机构”中选择一个组织机构,如“常信院演示二班”,在数据源中选择“hive数据源,如图2-2-3所示。步骤4:在图2-2-3中勾选“允许访问整个数据源”,将hive数据源筛选到2.2.2文件输入步骤1:使用“数据分析”界面的“挖掘分析”功能,将“文件输入”节点拉到设计窗口。如图
5、2-2-5所示。2-2-5创建文件输入节点步骤2:配置“文件输入”节点,将存储“风机”数据的CSV数据集上传到大数据平台。如图2-2-6所示。文件法入口文件上传科除全部8H除数据内容数据结构timewindspeedgeneratorspeed2015/11/418X)60.4143105161.2568325752015/11/418:070.7904830791.2501849652015/11/418802999835611.2568325752015/11/418:090.4880698421.2734515992015/11/418:100.7462274831.2568325752
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 工业 数据 分析 HIVE 输入 输出 教学 讲义