Hadoop大数据分析课程标准.docx
《Hadoop大数据分析课程标准.docx》由会员分享,可在线阅读,更多相关《Hadoop大数据分析课程标准.docx(6页珍藏版)》请在第一文库网上搜索。
1、Hadoop大数据分析课程标准一、课程概况课程名称Hadoop大数据分析课程代码20116002适用专业信息与计算科学开课学期第6学期课程性质专业任选课程学时/学分51/2预修课程Oava高级编程Python语言程序设计二、课程目标课程目标1:认识Hadp,并了解HadooP的核心组件、生态系统与应用场景。掌握安装及配置虚拟机,掌握安装JDK,学会搭建HadOoP完全分布式集群。课程目标2:学会查看HadOoP集群的基本信息,掌握HDFS的原理和基础操作,掌握MaPRedUCe原理架构、M叩RedUCe程序的编写,能够编写M叩RedUCe程序来处理简单任务。课程目标3:掌握MapReduce框
2、架中的进阶应用,包括自定义键值对、Combiner.Partitioner等,了解KNN算法与案例需求,通过MapReduce实现数据预处理以及KNN算法。三、课程目标与毕业要求的关系1、课程目标与毕业要求的对应关系毕业要求指标点课程目标3.软件开发3.1具有熟练的计算机算法设计与软件开发能力,能够熟练掌握高级程序设计语言的语法,并设计适当的数据结构和算法,编程解决实际问题。课程目标1课程目标24.数据分析4.3具有一定的大数据处理能力,能够在大数据中挖掘有用信息。课程目标2课程目标35.外语体育5.2掌握资料查询、文献检索以及运用现代化技术获取相关信息的基本方法。课程目标32、课程目彳乐与毕
3、业要求的矩阵关系图思想政治数学基础软件开发数据分析外语体育人文发展1.11.21.32.12.22.33.13.23.34.14.24.35.15.25.36.16.26.3课程目标1M课程目标2MH课程目标3HM注:H表示高支撑,M表示中支撑,1表示低支撑。四、课程教学要求与重难点序号课程内容框架教学要求教学重点教学难点1Hadoop介绍了解Hadoop的概念和特点;了解Hadoop的三大核心组件;了解Hadoop的生态系统;7解Hadoop的应用场景CHadoop的特点;Hadoop核心组件HDFS和MapReduce0Hadoop的分布式思想,MapReduce分布式计算框架的运行流程;
4、YARN资源管理器的运行原理。2Hadoop集群的搭建及配置掌握安装配置虚拟机;掌握如何在本地和1inux虚拟机中安装JDK;掌握搭建Hadoop完全分布式集群环境C设置固定IP的方法;Hadoop集群的安装和配置;Hadoop集群的启动和关闭方法。Hadoop集群的安装和配置。3Hadoop集群基础操作掌握查看存储系统的基本信息;掌握查看Hadoop集群的计算资源;掌握HDFS文件系统的基本操作;掌握以hadoopjar方式提交MapReduce任务;能够管理MapReduce多任务。HDFS文件系统操作方法;如何提交MapReduce任务。HDFS基础操作;提交和中断MapReduce任务
5、。4MapReduce入门编程掌握如何搭建MapReduce开发环境;掌握以Ec1ipse创建MapReduce工程;理解MapReduce的基本原理及执行流程;读懂Hadoop官方示例WordCount的源码;掌握MapReduce编程的基本思路;理解map函数与MapReduce处理逻辑和编程;MapReduce程序打包和运行。MapReduce框架的运行流程Z-MapReduce程序的编程逻辑。reduce函数的处理逻辑;能够编写MapReduce程序处理简单任务。5MapReduce进阶编程掌握HadoopJavaAPI的使用;理解Combiner的工作原理;掌握使用Combiner对
6、MapReduce工作流程进行优化;了解Hadoop内置数据类型;掌握编写和使用自定义数据类型;掌握编写和使用Partitioner设置分区;掌握MapReduce参数传递方式;学会使用TooIRunner提交MapReduce任务;掌握使用Ec1ipse提交MapReduce任务。自定义键值对;Combiner和Partitioner的原理和编程,参数传递的方式。自定义键值对类型的方式;Combiner与Partitioner的应用场景和编程逻辑。6项目案例:电影网站用户性别预测理解KNN算法的原理;掌握以MapReduce编程实现KNN算法;掌握以MapReduce编程实现KNN分类器评价
7、。MapReduce实现数据预处理;MapReduce实现KNN算法。MapReduce实现KNN算法的处理逻辑;MapReduce实现分类结果评价;MapReduce实现模型。五、课程教学内容、教学方式、学时分配及对课程目标的支撑情况序号课程内容框架教学内容教学方式学时支撑课程目标1Hadoop介绍1. Hadoop的发展历史2. Hadoop的特点3. Hadoop的核心组件4. Hadoop的生态系统5. Hadoop的应用场景讲授、PPT辅助、课堂讨论、实验4课程目标12Hadoop集群的搭建及配置1 .设置固定IP的方法2 .设置远程连接虚拟机3 .1inux在线安装软件的方法4 .
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Hadoop 数据 分析 课程标准