(全国职业技能比赛:高职)GZ033大数据应用开发赛题第08套.docx
《(全国职业技能比赛:高职)GZ033大数据应用开发赛题第08套.docx》由会员分享,可在线阅读,更多相关《(全国职业技能比赛:高职)GZ033大数据应用开发赛题第08套.docx(20页珍藏版)》请在第一文库网上搜索。
1、2023年全国职业院校技能大赛赛题第08套赛项名称:大数据应用开发英文名称:Big Data APPliCatiOn DeVeloPnlent赛项组别:高等职业教育组赛项编号:GZ033背景描述工业互联网是工业全要素、全产业链、全价值链的全面连接,是 人、机、物、工厂互联互通的新型工业生产制造服务体系,是互联网 从消费领域向生产领域、从虚拟经济向实体经济拓展的核心载体,是 建设现代化经济体系、实现高质量发展和塑造全球产业竞争力的关键 支撑,工业大数据则是工业互联网实现工业要素互联之后的核心价值 创造者。随着大数据行业的发展,工业数据收集呈现时间维度不断延 长、数据范围不断扩大、数据粒度不断细化
2、的趋势。以上三个维度的 变化使得企业所积累的数据量以加速度的方式在增加,最终构成了工 业大数据的集合。为完成工业大数据分析工作,你所在的小组将应用大数据技术, 以Scala作为整个项目的基础开发语言,基于大数据平台综合利用 Hive、Spark、Flink、Vue. js等技术,对数据进行处理、分析及可 视化呈现,你们作为该小组的技术人员,请按照下面任务完成本次工 作。任务A:大数据平台搭建(容器环境)(15分)环境说明:服务端登录地址详见各任务服务端说明。补充说明:宿主机及各容器节点可通过Asbru工具或SSH客户端进行SSH访问oMySQL已在容器的MaSter中安装完毕,用户名/密码为r
3、oot/123456子任务一:Hadoop完全分布式安装配置本任务需要使用rt用户完成相关配置,安装HadOOP需要配置前置环境。 命令中要求使用绝对路径,具体要求如下:1、从 宿主机/opt 目 录下 将文件 hadoop-2. 7. 7. tar. gz、 jdk-8u212-1 inu-64. tar. gz 复制到容器 master 中的optsoftware 路径 中(若路径不存在,则需新建),将master节点JDK安装包解压到optmodule 路径中(若路径不存在,则需新建),将JDK解压命令复制并粘贴至客户端桌 面【Release、任务A提交结果.docx】中对应的任务序号下
4、;2、修改容器中etcprofile文件,设置JDK环境变量并使其生效,配置完毕后 在master节点分别执行java -version”和“javac”命令,将命令行执 行结果分别截图并粘贴至客户端桌面【Release任务A提交结果.docx】中 对应的任务序号下;3、请完成host相关配置,将三个节点分别命名为master、SIaVe1、slave2, 并做免密登录,用Scp命令并使用绝对路径从master复制JDK解压后的安 装文件到SlaVe 1、slave2节点(若路径不存在,则需新建),并配置SlaVe 1、 slave2相关环境变量,将全部SCP复制JDK的命令复制并粘贴至客户端
5、桌面【Release任务A提交结果.docx中对应的任务序号下;4、在master将HadooP解压到optmodule (若路径不存在,则需新建)目录下, 并将解压包分发至SIaVe1、SlaVe2中,其中master、slavel SIaVe2节点 均作为datanode,配置好相关环境,初始化HadoOP环境namenode,将初始 化命令及初始化结果截图(截取初始化结果日志最后20行即可)粘贴至客 户端桌面【Release任务A提交结果.docx】中对应的任务序号下;5、启动Hadoop集群(包括hdfs和yarn),使用jps命令查看master节点与 slavel节点的Java进程
6、,将jps命令与结果截图粘贴至客户端桌面【Release任务A提交结果.docx中对应的任务序号下。子任务二:Kafka安装配置本任务需要使用rt用户完成相关配置,已安装HadoOP及需要配置前置环 境,具体要求如下:1、从宿主机/opt 目录下将文件 zookeeper-3.4.6. tar. gz、 kafka 2. 122. 0. 0. tgz 复制到容器 master 中的optsoftware 路径中(若 路径不存在,则需新建),将MaSter节点ZookeePer, Kafka安装包解压到 optmodule目录下,将Kafka解压命令复制并粘贴至客户端桌面【Release 任务A
7、提交结果.docx】中对应的任务序号下;2、配置好zookeeper,其中zookeeper使用集群模式,分别将master slavel、 slave2作为其节点(若zookpeer已安装配置好,则无需再次配置),配置 好 Kafka 的环境变量,使用 kafka-server-start, sh -version 查看 Kafka 的版本内容,并将命令和结果截图粘贴至客户端桌面【Release任务A提交 结果.docx】中对应的任务序号下;3、完善其他配置并分发Kafka文件到SlaVe1、slave2中,并在每个节点启动 Kafka,创建ToPic,其中ToPiC名称为instatopi
8、c,分区数为2,副本数 为2,将创建命令和创建成果截图粘贴至客户端桌面【Release任务A提交 结果.docx】中对应的任务序号下。子任务三:HiVe安装配置本任务需要使用rt用户完成相关配置,已安装HadOOP及需要配置前置环 境,具体要求如下:1、从宿主机/opt 目录下将文件 apache-hive-2. 3. 4-bin. tar. gz、 mysql-connector-java-5. 1. 47. jar 复制至U 容器 master 3 optsoftware 路径中(若路径不存在,则需新建),将容器master节点HiVe安装包解压 到optmodule目录下,将命令复制并粘
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 全国 职业技能 比赛 高职 GZ033 数据 应用 开发 赛题第 08