欢迎来到第一文库网! | 帮助中心 第一文库网-每个人都是第一
第一文库网
全部分类
  • 研究报告>
  • 学术论文>
  • 全科教育>
  • 应用文档>
  • 行业资料>
  • 企业管理>
  • 技术资料>
  • 生活休闲>
  • ImageVerifierCode 换一换
    首页 第一文库网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    Hadoop生态系统及开发 实训手册 实训12 HiveQL查询操作.docx

    • 资源ID:855024       资源大小:111.62KB        全文页数:7页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: QQ登录 微博登录
    二维码
    扫码关注公众号登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    Hadoop生态系统及开发 实训手册 实训12 HiveQL查询操作.docx

    实训5.4 HiveQL查询操作L实训I目的通过本实训,理解Hive的查询数据操作。2 .实训内容本实训主要是进行查询数据表的操作。3 .实训要求以小组为单元进行实训,每小组5人,小组自主协商选一位组长,由组长安 排和分配实训任务,要求对上一实训都操作正确。4 .准备知识(1) GROUP BY概SELECT coll ,co12 tcount( 1 ),sel_expr (聚合操作)FROM tableWHERE condition>Map 端执行GROUP BYcoll ,col2->Reduce 端执行HAVING->Reduce 端执行GROUPBY,即按照某区学段的值进行分施 者相同值放至IFr起。本代码意思为:从表中读取数据,执行Where条件,以Coll列分组,把COIl 列的内容作为Key,其他列值作为VaIUe,上传到reduce,在reduce端执行聚合 操作和having过港5 .实训步骤(1)查询表查询那门编号为30的反工信息use test2;select * from emp where deptno=30;操作结果如图5-48所示。hive> select * from emp where deptno=30; OK7499ALLENSALESMAN76981981-2-21600.30.37521WARDSALESMAN76981981-2-221250.0500. 37654MARTINSALESMAN76981981-9-281250.1400. 37844TURNERSALESMAN76981981-9-281500.3Tilne taken: 0.493 seconds. Fetched: 4 row(s)图5-48查询指定部门编号的员工信息 查询姓名为SMITH的员工select * from emp where ename='SMITH' 操作结果如图5-49所示。hive> select * from emp where ename,SMITH'OK7369 SMITH CLERK 792198-12-178, 2.0 NULLTime taken: 0.17 seconds, Fetched: 1 row(s)图5-49查询指定姓名的员工信息查询员工编号小于等于7766的员工select * from emp where empno <= 7766; 操作结果如图5-50所示。hive>select *from emp whereempno < 7766;UiX7369SMITHCLERK 792198-12-1780.2.NULL7499ALLENSALESMAN76981981-2-21600. 3,37521WARDSALESMAN76981981-2-221250.0500. 37566JONESMANAGER 78391981-4-22975.2,0NULL7654MARTINSALESMAN76981981-9-281250. 1400. 37698BLAKEMANAGER 78391981-5-12850.3.0NULLTimetaken: ,119 seconds, Fetched: 6 row(s)图5-50按编号范围查询8询员工工资大于IoOO小壬1500的员工select * from emp where sal between 1000 and 1500;操作寤果如图5-51所示。hive> select *from emp wheresal between 100 and 150;Uix7521WARDSALESMAN76981981-2-221250.5,37654MARTINSALESMAN76981981-9-281250.1400.037844TURNERSALESMAN76981981-9-28150.00.037876ADAMSCLERK 77881987-5-2311.2.NULL7934MILLERCLERK 77821982-1-23130.1,0NULLTimetaken: 0.126 seconds, Fetched: 5row(s)图5-51按工资范围查询查询前5条记录select * from emp limit 5;操作结果如图5-52所示。hive> zselect *from emp limit5;U7369SMITHCLERK 7921980-12-1780.2.0NULL7499ALLENSALESMAN76981981-2-201600. 30.37521WARDSALESMAN76981981-2-221250. 5,37566JONESMANAGER 78391981-4-22975.02.0NULL7654MARTINSALESMAN76981981-9-28125,140.3Timetaken: .17 seconds. Fetched: 5 row(s)图5-52按显示记录数量查询查询姓名为SCOTT或MARTIN的员工select * from emp where ename in ('SCOTT','MARTIN'); 操作寤果如图5-53所示。hive> OK 76547788 Timeselect *from emp whereename in(,SC0, 'MARTIN');MARTIN SALESMAN7698SCOTTANALYST 75661987-4taken: .19 seconds, Fetched: 21981-9-281250.0-1930.0 2,0row(s)1400.0NULL3图553多姓名查询查询有津贴的员工select * from emp where COmm is not null; 操作寤果如图5-54所示。hive> select *from emp wherecomm is not null;Uix7369SMITHCLERK 792198-12-178,2.NULL7499ALLENSALESMAN76981981-2-21600.0300.037521WARDSALESMAN76981981-2-221250.0500. 37566JONESMANAGER 78391981-4-22975.2.NULL7654MARTINSALESMAN76981981-9-281250. 1400. 37698BLAKEMANAGER 78391981-5-12850.03.0NULL7782CLARKMANAGER 78391981-6-92450.1.0NULL7788SCOTTANALYST 75661987-4-193.2.NULL7844TURNERSALESMAN76981981-9-28150.037876ADAMSCLERK 77881987-5-23110.020.0NULL79JAMESCLERK 76981981-12-395.3.0NULL792FORDANALYST 75661981-12-330.02,0NULL7934MILLERCLERK 77821982-1-23130.1.0NULLTimetaken: ,118 seconds, Fetched: 13 row(s)图5-54按有无薪资查询hive> select max(sal),min(sal),avg(sal),sum(sal) from emp;Query ID = root_2O22111O113456_f9O516el-adb2-4b60-b6df-a7bl5ff5bbc6Total jobs = 1Launching Job 1 out of 1Number of reduce tasks determined at compile time: 1In order to change the average load for a reducer (in bytes): set hive.exec. reducers.bytes.per.reducer=<number>In order to IiJnit the maximum number of reducers:set hive.exec . reducers.max=<number>In order to set a constant number of reducers:set mapreduce.job.reduces=<number>Starting Job = job l66847592915, Tracking URL = http;/master;8088/proxy/a pplicationl6680475920915Kill Command = optsoftwarehddo叩-3.3.4/bin/m叩red job -kill job l6684759209 1-05Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 1 222-11-1 11:35:05,064 Stage-I map = 0%, reduce = %222-11-10 11:35:10,184 Stage-I map = 10%, reduce = %, Cumulative CPU 1.41 se c2022-11-10 11:35:16,327 Stage-I map = 10%, reduce = 100%, Cumulative CPU 3.52 secMapRed

    注意事项

    本文(Hadoop生态系统及开发 实训手册 实训12 HiveQL查询操作.docx)为本站会员(lao****ou)主动上传,第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知第一文库网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 001doc.com网站版权所有   

    经营许可证编号:宁ICP备2022001085号

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



    收起
    展开