Hadoop生态系统及开发实训手册实训12 HiveQL查询操作.docx

资源ID：855024 资源大小：111.62KB 全文页数：7页
资源格式： DOCX 下载积分：3金币

快捷下载

账号登录下载

微信登录下载

三方登录下载：

扫码关注公众号登录

下载资源需要3金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

加入VIP,免费下载

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

Hadoop生态系统及开发实训手册实训12 HiveQL查询操作.docx

实训5.4 HiveQL查询操作L实训I目的通过本实训，理解Hive的查询数据操作。2 .实训内容本实训主要是进行查询数据表的操作。3 .实训要求以小组为单元进行实训，每小组5人，小组自主协商选一位组长，由组长安排和分配实训任务，要求对上一实训都操作正确。4 .准备知识(1) GROUP BY概SELECT coll ,co12 tcount( 1 ),sel_expr (聚合操作)FROM tableWHERE condition>Map 端执行GROUP BYcoll ,col2->Reduce 端执行HAVING->Reduce 端执行GROUPBY,即按照某区学段的值进行分施者相同值放至IFr起。本代码意思为：从表中读取数据，执行Where条件，以Coll列分组，把COIl 列的内容作为Key,其他列值作为VaIUe,上传到reduce,在reduce端执行聚合操作和having过港5 .实训步骤(1)查询表查询那门编号为30的反工信息use test2;select * from emp where deptno=30;操作结果如图5-48所示。hive> select * from emp where deptno=30; OK7499ALLENSALESMAN76981981-2-21600.30.37521WARDSALESMAN76981981-2-221250.0500. 37654MARTINSALESMAN76981981-9-281250.1400. 37844TURNERSALESMAN76981981-9-281500.3Tilne taken: 0.493 seconds. Fetched: 4 row(s)图5-48查询指定部门编号的员工信息查询姓名为SMITH的员工select * from emp where ename='SMITH' 操作结果如图5-49所示。hive> select * from emp where ename,SMITH'OK7369 SMITH CLERK 792198-12-178, 2.0 NULLTime taken: 0.17 seconds, Fetched: 1 row(s)图5-49查询指定姓名的员工信息查询员工编号小于等于7766的员工select * from emp where empno <= 7766; 操作结果如图5-50所示。hive>select *from emp whereempno < 7766;UiX7369SMITHCLERK 792198-12-1780.2.NULL7499ALLENSALESMAN76981981-2-21600. 3,37521WARDSALESMAN76981981-2-221250.0500. 37566JONESMANAGER 78391981-4-22975.2,0NULL7654MARTINSALESMAN76981981-9-281250. 1400. 37698BLAKEMANAGER 78391981-5-12850.3.0NULLTimetaken: ,119 seconds, Fetched: 6 row(s)图5-50按编号范围查询8询员工工资大于IoOO小壬1500的员工select * from emp where sal between 1000 and 1500;操作寤果如图5-51所示。hive> select *from emp wheresal between 100 and 150;Uix7521WARDSALESMAN76981981-2-221250.5,37654MARTINSALESMAN76981981-9-281250.1400.037844TURNERSALESMAN76981981-9-28150.00.037876ADAMSCLERK 77881987-5-2311.2.NULL7934MILLERCLERK 77821982-1-23130.1,0NULLTimetaken: 0.126 seconds, Fetched: 5row(s)图5-51按工资范围查询查询前5条记录select * from emp limit 5;操作结果如图5-52所示。hive> zselect *from emp limit5；U7369SMITHCLERK 7921980-12-1780.2.0NULL7499ALLENSALESMAN76981981-2-201600. 30.37521WARDSALESMAN76981981-2-221250. 5,37566JONESMANAGER 78391981-4-22975.02.0NULL7654MARTINSALESMAN76981981-9-28125,140.3Timetaken: .17 seconds. Fetched: 5 row(s)图5-52按显示记录数量查询查询姓名为SCOTT或MARTIN的员工select * from emp where ename in ('SCOTT','MARTIN'); 操作寤果如图5-53所示。hive> OK 76547788 Timeselect *from emp whereename in(,SC0, 'MARTIN');MARTIN SALESMAN7698SCOTTANALYST 75661987-4taken: .19 seconds, Fetched: 21981-9-281250.0-1930.0 2,0row(s)1400.0NULL3图553多姓名查询查询有津贴的员工select * from emp where COmm is not null; 操作寤果如图5-54所示。hive> select *from emp wherecomm is not null;Uix7369SMITHCLERK 792198-12-178,2.NULL7499ALLENSALESMAN76981981-2-21600.0300.037521WARDSALESMAN76981981-2-221250.0500. 37566JONESMANAGER 78391981-4-22975.2.NULL7654MARTINSALESMAN76981981-9-281250. 1400. 37698BLAKEMANAGER 78391981-5-12850.03.0NULL7782CLARKMANAGER 78391981-6-92450.1.0NULL7788SCOTTANALYST 75661987-4-193.2.NULL7844TURNERSALESMAN76981981-9-28150.037876ADAMSCLERK 77881987-5-23110.020.0NULL79JAMESCLERK 76981981-12-395.3.0NULL792FORDANALYST 75661981-12-330.02,0NULL7934MILLERCLERK 77821982-1-23130.1.0NULLTimetaken: ,118 seconds, Fetched: 13 row(s)图5-54按有无薪资查询hive> select max(sal),min(sal),avg(sal),sum(sal) from emp;Query ID = root_2O22111O113456_f9O516el-adb2-4b60-b6df-a7bl5ff5bbc6Total jobs = 1Launching Job 1 out of 1Number of reduce tasks determined at compile time: 1In order to change the average load for a reducer (in bytes): set hive.exec. reducers.bytes.per.reducer=<number>In order to IiJnit the maximum number of reducers:set hive.exec . reducers.max=<number>In order to set a constant number of reducers:set mapreduce.job.reduces=<number>Starting Job = job l66847592915, Tracking URL = http;/master;8088/proxy/a pplicationl6680475920915Kill Command = optsoftwarehddo叩-3.3.4/bin/m叩red job -kill job l6684759209 1-05Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 1 222-11-1 11:35:05,064 Stage-I map = 0%, reduce = %222-11-10 11:35:10,184 Stage-I map = 10%, reduce = %, Cumulative CPU 1.41 se c2022-11-10 11:35:16,327 Stage-I map = 10%, reduce = 100%, Cumulative CPU 3.52 secMapRed

注意事项

本文（Hadoop生态系统及开发实训手册实训12 HiveQL查询操作.docx）为本站会员（lao****ou）主动上传，第一文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知第一文库网（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。

Hadoop生态系统及开发 实训手册 实训12 HiveQL查询操作.docx

Hadoop生态系统及开发 实训手册 实训12 HiveQL查询操作.docx

Hadoop生态系统及开发实训手册实训12 HiveQL查询操作.docx

Hadoop生态系统及开发实训手册实训12 HiveQL查询操作.docx