《大数据阿里ACP认证考试练习题及答案4.docx》由会员分享,可在线阅读,更多相关《大数据阿里ACP认证考试练习题及答案4.docx(21页珍藏版)》请在第一文库网上搜索。
1、大数据阿里ACP认证考试练习题及答案41.单选题下面的两张表做连接,用的最好的方式是()。表A:20万条记录表B:30万条记录表A和表B的连接字段上没有合适的索引可用,表A和表B经常会变更A) NESTED1OOPB) HASHJOINC) BITMAPINDEXJOIN答案:B解析:2 .单选题在MySQ1据车中有CUStOmSr杰Sa1CSOrder网35衣数据表,CUStOn1er表中有如下字段:(Customerid.gender),其中CUSton1erid为主键:SaIeSOrdCr表中有如下字段(Orderid,Customerid,amount),其中Orderid为主键,cu
2、stomerid为外键。如果执行下面的查询来列出至少有一笔销售的所有客户:se1ect*fromcustomerwhereCustomeridin(se1ectcustomeridfromsa1esorae),V查询返回结果为A)返回customer表中在sa1esorder中存在购买记录的客户记录B)报错,语法错误,无法执行C)返回符合条件的结果但是有警告信息D)必须加类似于Iin1it100这种返回行数限制的子句才能执行答案:A解析:可以正常查询到所需结果。3 .单选题一个分析师接到了一个饮料企业的广告投放效果的数据分析任务,在数据编程阶段,建立以时间、地域和产品作为维度的数据分析用表,然
3、后编程将销售量、广告投放量等属性聚合进来,在这个过程当中,这个分析用表的行数是如何变化的?A)行数不变B)行数逐渐增加C)行数逐渐减少D)行数可能增加.也可能减少答案:C解析:4 .单选题某数据集中包含了年龄信息(age),现在想从该数据集中抽取样本用于建模,要求样本中的各年龄段的人占的比例与总体中的比例基本一致。比较适合该需求的抽样方法为OA)随机抽样B)分层抽样C)加权抽样D)系统抽样答案:B解析:A、随机抽样法就是调查对象总体中每个部分都有同等被抽中的可能,是一种完全依照机会均等的原则进行的抽样调查,被称为是一种“等概率”。随机抽样有四种基本形式,即简单随机抽样、等距抽样、类型抽样和整群
4、抽样。B、分层抽样法也叫类型抽样法。它是从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法。C、加权采样有两种情况,一种是能够已知全部样本的个数。这需要遍历整个样本,比如说用户标签采样输出,那么每次采样时仍然需要遍历所有的标签,来依次决定每一个标签输出的概率。另一种是不知道总量样本是多大,或者总量很大,以至于你不愿意全部遍历之后再输出采样结果,这样的数据就是数据流,对应的就是流采样。D、系统抽样法又叫做等距抽样法或机械抽样法,是依据一定的抽样距离,从总体中抽取样本。要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先规定的
5、规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法。综上本题选项B符合5 .单选题如果数据分析师希望将数据仓库中";customer";数据表的记录全部删除,但保留数据表结构,以MySQ1为例,可通过一命令实现。A) truncatetab1ecustomerB) insertintotab1ecustomerse1ect*fromCustomerwhere1=2C) de1etefromcustomerwhere1=2D) droptab1ecustomer答案:A解析:6 .单选题某公司承包了一段铁路的维修任务,现在因为进入雨季需要停工三个月。在停工期间如果搬走机械,
6、需搬运费1800元,如果将机械留在原处,一种方案是花500元做防护措施.防止雨水浸泡机械.如不做防护措施,发生雨水浸泡时将损失10000元.如下暴雨发生洪水时,则不管是否有防护措施,施工机械留在原处都将受到60000元的损失.根据资料,该地区夏季高水位的发生率是25%,洪水的发生率是2%。使用决策树分析该公司施工队的最佳处理方案为O0A)不搬走施工机械并作好防护措施B)不搬走施工机械并不作防护措施C)搬走施工机械并不作防护措施D)各种处理措施对最终结果并无明显区别,任意选种即可答案:A解析:7 .单选题Jweb1ogic不支持()组件。A) JDBCB) Serv1etC) JSPD) ODB
7、C答案:D解析:8 .单选题考虑到本省空气质量问题的严重性某省政府决定根据各市空质量问题引发的疾病案例数量发放空气质量治理资金。为了决定治理资金发放的比例,以下哪种图表是最佳选择?A)折线图B)柱状图C)散点圈D)饼图答案:C解析:9 .单选题在大数据计算服务(MaXComPUte,原ODPS)的数据仓库中有两张订单表,机票订单atorder及彩票订单Iottery_order,两张表的结构相同,都有以下三个字段:Orderid、order_datesorderamto机票订单atorder中的数据如下:Orderidorderdateorderamt&;nbsp;OOO12016030
8、1200&;nbsp;0002201603011200彩票订单IOtteryorder中的数据如下:order_idorder_dateorder_amt&;nbsp;OOO120160301200&;nbsp;00022016030110&;nbsp;0003201603012现在需要把这两张表中的数据合并到一个订单表中,运行SQ1语句:&;nbsp;se1ect*from(se1ect*fromat_orderuniona11se1ect*from1otter_order)t1;对运行结果描述正确的是()A)结果中有3条记录B)结果中有4条记录C)结果中有5条
9、记录D)结果中有2条记录答案:C解析:答案C&;nbsp;本题需理解UN1ON和UN1ONA11的区另IJUN1oNA11命令会列出所有的值。不去除重复值UNION命令结果集会去重10 .单选题某房地产公司计划投资某城市的一块住址地皮,两家建筑设计事物所入围提供了户型和设计方案(A设计和B设计).CEO希望了解在这块地皮上哪家的设计方案能够给公司带来良好的回报0分析师小王执行了项目前分析,将周边楼盘的价格情况、最近各种户型和设计的销售情况,以及该城市常住人群的特点等包括在分析报告内。小王在报告中提供了3个主要信息:两种设计方案的市场价格心理接受范围:两种设计方案市场销售的速度,艮四0%的
10、房源在多少天内售罄;两种设计方案的可行性和需要提高的方面。小王的项目前分析报告从完整性角度分析,说法正确的是一0A)完整,CEO希望知道哪种设计方案能够给公司带来良好的回报,分析报告的信息可以满足要求B)不完整,未考虑营销方案对销售的影响,不同的户型和设计针对的人群不同,营销方式也不同C)完整,根据分析报告的信息,CEo结合战略需要可以做出两个设计方案孰优孰劣的判断D)不完整,未计算两种设计方案的建筑成本,无法评估两个设计方案的RO1答案:B解析:题目广义的项目前评估是指在项目前期决策阶阶段,从整个项目全局出发,根据国民经济和组织发展的需要对项目及其被选方案所进行的全面评估,从而辨别项目及其被
11、选方案的可行和优劣,决定取舍。项目前评估也可以根据评估主休的不同而分成项目业主的评估、贷款银行审查贷款项目的评价和承包商投标项目前的评估等。总之,项目前就是在项目的投资决策之前,对项目的必要性和项印备选方案的技术、经济、运行条件和社会与环境影响等方面所进行的全面论证与评估的工作。如上所述,选B11 .单选题数据工场DataWOrkS(原DataIDE)上的数据同步任务报错,错误信息为:“2016-02-2112:21:37.9344055440-0-2-writerERRORStdoutpiuginCo11ector:quot;exception.";INSERT,DE1ETEcomm
12、anddeniedtouser,xxx-user,n.n.n.nfortab1exxx-tab1ev";record":(,byteSizezz8index”“0“rawData”“33801606";type";";1ONG";,以下说法中错误的是()A)该日志说明任务配置目标表为xxxab1e,B)该日志说明目标表xxx_C)任务配置的时候如果把属性“准备语句”设置成为“同步前清空本表部分数据(D)通过错误日志判断,需要找对应的管理员给XXX答案:B解析:此段报错信息为odps的xxx_user用户,n.n.n.n对应odps的IPo12 .
13、单选题需求类问题客服中心需要在()工作日内完成问题登记,在()工作日内完成问题筛选已初步审核。A) 0.5个,1个B) 0.5个,2个O1个,2个D)1个,1个答案:A解析:13 .单选题用户A执行下面的命令删除数据库中的大表:SQ1DROPTAB1Etrans;当删除表操作正在进行时;用户B执行下面的命令在相同的表;SQ1DE1ETEFROMtransWHEREtr.type=S1;()语句是正确的关于DE1ETE命令。A)删除记录失败因为记录被锁处于SHARE模式B)删除行成功因为表被锁处于SHARE模式C)删除记录失败因为表被锁处于EXC1USIVE模式D)删除行成功因为表被锁处于SHA
14、REROWEXe1USIVE模式答案:C解析:14 .单选题MaxconiputeSQ1提供了CASE-WHEN-,可以进行条件判断。表tb1中包含了字段(idbigint,agebigint),目前有三条纪录,分别为(1,20),(2,30),(3,60),执行以下SQ1:se1ectid,casewhenage60thenA,whenage40thenB,whenage20then,C,e1se,D,endfromtb1whereid=3;()是正确的执行结果。A) AB) BC) CD) D答案:B解析:15 .单选题DataWOrkS中对已编写完成任务,进行周期性调度配置,一个当口23
15、:30前配置的调度任务,()可通过调度正确运行。A)当时B)当日C)第二日D)第三日答案:C解析:16 .单选题数据表中通常包含一些脏数据,例如重复记录。假设MySQ1数据库中的StUdent”表中记录了学生信息,分析师想通过Se1eCt语句来查看记录,希望同一记录只出现一次,可以使用语句.实现。A) se1ect*fromstudentgroupby*B) se1ectunique*fromstudentC) se1ectdistinct*fromstudentgroupby*D) se1ectdistinct*fromstudent答案:D解析:17 .单选题下面列出的数据库操作中,可以在RMAN中执行的是()。A)建立表空间B)启动数据库0创建用户D)为用户授权答案:B解析:18 .单选题在数据分析中,粒度是指可以让我们看到的数据细节的水平,粒度越O细节程度越()综合程度越O回答查询的种类就越O0A)大、高、高、少B)小、高、低、多C)大、低、低、少D)小、高、高、多答案:B解析:某书本知识http:/docb1913008afaad