大数据技术 形考作业.docx
《大数据技术 形考作业.docx》由会员分享,可在线阅读,更多相关《大数据技术 形考作业.docx(5页珍藏版)》请在第一文库网上搜索。
1、1、信息技术为大数据时代提供的技术支撑主要体现在哪些方面?存储设备容量不断增加,CPU处理能力大幅提升,网络带宽不断增加2、人类社会的数据产生方式大致经历了哪些阶段?运营式系统阶段,用户原创内容阶段,感知式系统阶段3、大数据的4V分别指代的是什么?规模性,高速性,多样性,价值性4、大数据技术是什么?大数据技术是指大数据的应用技术,涵盖各类大数据平台、大数据指数体系等大数据应用技术。5、从数据分析全流程的角度,大数据技术主要包括那几个内容。数据的采集与处理,数据的存储和管理,数据处理与分析,数据安全和隐私保护6、大数据计算模式有哪些?批处理计算,流计算,图计算,查询分析计算7、云计算的概念云计算
2、是分布式计算的一种,指的是通过网络云将巨大的数据计算处理程序分解成无数个小程序,然后通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。8、云计算的关键技术云计算平台管理技术,分布式计算的编程模式,分布式海量数据存储,海量数据管理技术,虚拟化技术9、物联网的概念物联网是指通过各种信息传感器,射频识别技术,全球定位系统,红外感应器,激光扫描器等各种装置与技术,实时采集任何需要监控、连接、互动的物体或过程。10、从技术架构上来看,物联网可分为四层,分别是(感知层,网络层,平台层,应用层)?11、物联网的关键技术有哪些?RF1D技术;传感器技术;无线网络技术;人工智能技术;云计算技
3、术12、大数据与云计算、物联网的关系云计算为大数据提供了技术基础,大数据为云计算提供用武之地物联网是大数据的重要来源,大数据技术为物联网数据分析提供支持云计算为物联网提供了海量数据存储能力,物联网为云技术提供了广阔的应用空间13、HadOOP是基于(java)语言开发的。14、HadOOP的核心是(HDFS)15、HadOOP的特性有哪些?1高可靠性:采取冗余数据存储方式。即使一个副本发生故障,其他副本也可以保证正常对外提供服务。2 .高效性:采取分布式存储和分布式处理两大核心技术。能够高效的处理PB级数据。3 .高可扩展性:4 .高容错性:自动保存数据的多个副本,自动将失败的任务重新分配。5
4、 .成本低6 .运行在1inux操作系统上7 .支持多种编程语言16、Hadoop生态系统分别是(HDFS,HAD00PYARN1AmbaritHbase1Hive1Pig1SparkjSqoop)17、HDFS要实现的目标是(兼容廉价的硬件设备,流数据读写,简单的文件模式)18、HDFS的局限性是(不适合低延迟数据访问,无法高效存储大量小文件,不支持多用户写入及任意修改文件)19、HDFS的数据存取策略(冗余数据保存,数据存取策略,数据错误与恢复)20、简述HDFS的数据读写过程。c1ient发起文件上传请求,通过RPC与NameNode建立通讯,NameNode检查目标文件是否已存在,父目
5、录是否存在,返回是否可以上传;c1ient请求第一个b1ock该传输到哪些DataNode服务器上;NameNode根据配置文件中指定的备份数量及副本放置策略进行文件分配,返回可用的DataNode的地址,如:A,B,C;c1ient请求3台DataNode中的一台A上传数据(本质上是一个RPC调用,建立pipe1ine),A收到请求会继续调用B,然后B调用C,将整个pipe1ine建立完成,后逐级返回c1ient;c1ient开始往A上传第一个b1ock(先从磁盘读取数据放到一个本地内存缓存),以packet为单位(默认64K),A收到一个packet就会传给B,B传给C;A每传一个pack
6、et会放入一个应答队列等待应答。数据被分割成一个个packet数据包在pipe1ine上依次传输,在pipe1ine反方向上,逐个发送ack(ack应答机制),最终由PiPe1ine中第一个DataNode节点A将pipe1ineack发送给c1ient;当一个b1ock传输完成之后,c1ient再次请求NameNode上传第二个b1ock到服务器。21、HBaSe是针对谷歌BigTabIe的开源实现,是一个(高可靠、高性能、高向列、可伸缩)的分布式数据库。22、HBaSe的系统架构包括(ZOOkeePer服务器、MaSter主服务器、Region服务器)23、关系型数据库无法满足Web2.0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据技术 形考作业 数据 技术 作业