大数据HCIA模拟考试题(含答案).docx
大数据HC1A模拟考试题(含答案)一、单选题(共40题,每题1分,共40分)1、RDD有Transformation和Action算子,下列属于Action算子的是?A、SaveAsTextFi1eB、PeduceByKeyC、mapD>fi1ter正确答案:A2、下面关于ZooKeePer描述错误的是()A、一条消息被一半以上的SerVer接收,他将写入磁盘B、ZooKeeper的节点数必须是奇数个C、消息更新只有成功和失败,没有中间状态D、客户端发送的更新会按照他们发送的顺序被应用正确答案:B3、在规划Fuskm1nsightHD集群时候,如果客户用于功能测试,对性能没有要求,节约成本的情况下,可以采用管理节点、控制节点、数据节点合一部署,最少需要多少节点?A、2B、3C、4D、5正确答案:B4、FusionInsightHD部署时,同一集群内的F1umeserver节点建议至少部署几个?A、1B、2C、3D、4正确答案:B5、Fusion1nsightHadoop集群中,在某节点上通过df-hT查询,看到的分区包含以下几个:/var/1og/srvBigDatasrvBigDatahadoopdata5srvBigDatasoIr/so1rserver3/srvBigDatadbdataom这些分区所对应磁盘最佳Raid级别的规划组合是?A、RaidORaid1RaidONon-Raid1B、 Raid1Raid1Non-RaidNon-RaidRaid1C、 RaidORaidORaidORaidORaidOD、 Non-RaidNon-RaidNon-RaidNon-RaidRaid1正确答案:B6、FUSiOnInSightHDManager界面HiVe日志收集,那个选项不正确?A、可指定实例进行日志收集,比如指定单独收集MetaStOre的日志B、可指定时间段进行日志收集,比如只收集2016-1-1到2016-1-10的日志C、可指定节点IP进行日志收集,例如仅下载某个IP的日志D、可指定特定用户进行日志收集,例如仅下载USerA用户产生的日志正确答案:D7、关于Kafka磁盘容量不足的告警,对于可能的原因以下分析不正确的是?A、用于存储Kafka数据的磁盘配置(如磁盘数目、大小等),无法满足当前业务数据流量,导致磁盘使用率达到上限B、数据保存时间配置过长,数据累积达到磁盘使用率上限C、业务规划不合理,导致数据分配不均匀,使部分磁盘达到使用率上限D、Broker节点故障导致正确答案:D8、FusionInsightHD系统中,f1ume数据流在节点内不需要经过哪个组件?OA、 sinkB、 topicC、 SourceD>Channe1正确答案:B9、HDFS中的主备仲裁,是由哪个组件控制的?A、 Zoo1eeperFai1overContro11erB、 NodeManagerC、 ResourceManagerD、 HDFSC1ient正确答案:A10、关于HBase中HFi1e的描述不正确的是?A、一个HFi1e属于一个RegionB、一个HFiIe包含多个列族的数据C、一个HFiIe包含多列数据D、一个HFiIe包含多行数据正确答案:B11>FUSiOn1nSightHD中IOader从SFTP服务器导入文件时,不需要做编码转换和数据转换且速度最快的文件类型是以下哪项?OA、 sequence_fi1eB、 text_fi1eC、 binary_fi1eD、 graph_fi1e正确答案:C12、关于FusionInsightHD中1oader作业描述正确的是?A、1oader将作业提交到Yarn执行后,如果此时1oader服务出现异常,则此作业执行失败。B、1oader将作业提交到Yarn执行后,如果某个Mapper任务执行失败,能够自动进行重试。C、1Oader作业执行失败后将会产生垃圾数据,需要用户手动清除。D、1oader将一个作业提交至Yarn执行后,该作业执行完成前,不能再提交其他作业。正确答案:B13、Zookeeper在分布式应用中的主要作用不包括一下哪些选项?A、分配集群资源B、选举MaSter节点C、存储及群中服务器信息D、保证各节点上数据的一致性正确答案:A14、FUSiOn1nSightHD中,如果需要查看当前登录HBaSe的用户和权限组,可以在HBaSeShen中执行什么命令?A、 use_permissionB、 whoamiC、whoD、get_user正确答案:B15、Hadoop系统中关于客户端向HDFS文件系统上传文件说法正确的是?A、客户端的文件数据经过NameNode传递给DataNodeB、客户端将文件划分为多个B1OCk,根据datanode的地址信息,按顺序写入到每一个datanode中C、客户端根据datanode的地址信息,按顺序将整个文件写入每一个datanode中,然后由datanode将文件划分为多个b1ockD、客户端只上传数据到一个datanode,然后由namenode负责b1ock复制正确答案:B16、YARN中默认的资源调度器是?OA、FIFO调度器B、容量调度器C、Fair调度器D、以上全不正确正确答案:B17、关于Fusion1nsightHD中1oader作业描述正确的是?A、1oader将作业提交到Yam执行后,如果此时1oader服务异常,则此作业执行失败。B、1oader将作业提交到Yam执行后,如果某个Mapper任务执行失败,能够自动进行重试C、1Oadet作业执行失败后将会产生垃坝数据,需要用户手动清除D、1Oader将一个作业提交至YanI执行后,该作业执行完成前,不能再提交其他作业正确答案:B18、Hadoop平台中HBase的Region是由哪个服务进程来管理?A、 HMasterB、 DatanodeC、 RegionServerD>Zookeeper正确答案:C19、HBaSe不适合哪些应用场景?()A、高吞吐率应用场景B、要求具有完全ACID特性的应用场景C、半结构化数据应用场景D、海量数据(TB,PB)应用场景正确答案:B20、HDFS的副本放置策略中,同一机架不同的服务器之间的距离是?()A、1B、3C、2D、4正确答案:C21、HBase中一个Region进行Sp1it操作时,将一个HFi1e文件真正分开到两个Region的过程发生在以下什么阶段?A、SP1it过程中B、FIUSh过程中C、ConIPaCtiOn过程中D、HFiIe分开过程中正确答案:C22、关于HIVE的描述不正确的是?A、Hive最佳使用场景是大数据集的批处理作业B、Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在作提交和调度的时候需要大量的开销C、Hive查询操作过程严格遵循HadoopMapReduce的作用执行模型,Hive将用户的HiveQ1语句通过解释器转换为MapReduceHadoop集群上D、HiVe可以实现在大规模数据集上实现低延迟快速的查询正确答案:D23、在YARN的任务调度流程中,下列哪个是App1icationMaster负责的任务?A、申请和领取资源B、启动MaP或RedUCe任务C、为任务设置好运行环境D、 分酉己Container正确答案:A24、FusionInsightHD系统中HDFS的B1ock默认保存几份?A、3份B、2份C、1份D、不确定正确答案:A25、加载数据到HiVe表,哪种方式不正确?A、直接将本地路径的文件IOad到HiVe表中B、将HDFS上的文件Ioad到HiVe表中C、Hive支持insertinto单条记录的方法,所以可以直接在命令行插入单条记录D、将其他表的结果集insertinto到HiVe表正确答案:C26、kafka-cIustermirroring工具可以实现以下那些功能?A、kafka集群数据同步方案B、kafka单集群内数据备份C、kafka单集群内数据恢复D、以全部不对正确答案:A27、Spark组件中哪个选项不属于transformation操作?A、 joinB、 distinctC、 PeduceByKeyD>reduce正确答案:D28、当ZooKeeper集群的节点数为5节点时,请问集群的容灾能力和多少节点是等价的?()A、3B、4C、6D、以上说法都不对正确答案:C29、以下关于Hbase中HregionServer的功能描述哪些是不正确的A、RegionServer一般与HDFS集群的NameNode部署在一起,实现数据的存储功能B、Hbase的数据处理和计算单元C、RegiOnSerVer是HbaSe的数据服务进程,负责处理用户数据的读写请求D、管理所有的Region,Region可以在RegionServer之间迁移正确答案:B30、在有N个节点FusionInsightHD集群中部署HBase时,推荐部署()个HMaSter进程,O个RegiOnSerVer进程?A、2,2B、2,NC、3,ND、N,N正确答案:B31、FusionInsightHD系统中,以下选项哪一个不是HBase写数据流程涉及的角色或服务?A、 ZooKeeperB、 HDFSC、 HMasterD、 RegionServer正确答案:C32、通过FusionInsightManager不能完成以下哪个操作?A、权限管理B、安装部署C、性能监控D、虚拟机分配正确答案:D33、以下哪类数据不属于半结构化数据?A、二维表B、 HTM1C、 JSOND、XM1正确答案:A34、关于HiVe建表基本操作,描述正确的是A、创建外部表时需要制定externa1关键字B、一旦表创建好,不可再修改列名C、一旦表建好,不可再增加新列D、一旦表建好,不可再修改表名正确答案:A35、Hive是基于hadoop的数据仓库软件,可以查询和管理PB级别的分布式数据。以下关于HiVe特性的描述不正确的是?()A、仅支持MapReduce计算引擎B、易用易编程C、可直接访问HDFS文件以及HBaSeD、灵活方便的ET1(extract/transform/1oad)正确答案:A36、HBaSe的主MaSter是如何选举的?A、随机选取B、由RegionServer进行裁决C、通过Zookeeper进行裁决D、HMaster为双主模式,不需要进行裁决正确答案:C37、创建1Oader作业时,可以在以下哪个步骤中设置MaP数?A、转换B、基本信息C、输出D、输入设置正确答案:C38、HBaSe的最小存储单元是什么?A、 RegionB、 Co1umnFami1yC、 Co1umnD、 Ce11正确答案:D39、关于DataSet,下列说法不正确的是?A、DataSet与RDD高度类似,性能比RDD好B、Data