欢迎来到第一文库网! | 帮助中心 第一文库网-每个人都是第一
第一文库网
全部分类
  • 研究报告>
  • 学术论文>
  • 全科教育>
  • 应用文档>
  • 行业资料>
  • 企业管理>
  • 技术资料>
  • 生活休闲>
  • ImageVerifierCode 换一换
    首页 第一文库网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    数据采集1+x初级题库(含答案).docx

    • 资源ID:682687       资源大小:33.91KB        全文页数:17页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: QQ登录 微博登录
    二维码
    扫码关注公众号登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数据采集1+x初级题库(含答案).docx

    数据采集1+初级题库(含答案)一、单选题(共40题,每题1分,共40分)1、以下选项中,不是PythOn语言特点的是A、黏性扩展:PythOn语言能够集成C、C.+等语言编写的代码B、变量声明:PythOn语言具有使用变量需要先定义后使用的特点C、平台无关:Python程序可以在任何安装了解释器的操作系统环境中执行D、强制可读:Python语言通过强制缩进来体现语句间的逻辑关系正确答案:B2、SCraPy中,用于自定义所有SCraPy组件的行为的是()。A、 SpiderB、 ItemC、 pip1ineD、 settings正确答案:D3、以下属于应用层协议的是OA、FTPB、IPC、TCPD、UDP正确答案:A4、下列不是手机操作系统的是?()A、 WindowsVistaBsWindow?Mobi1eC>AndroidD、IOS正确答案:A5、使用scrapy框架编写爬虫,setting,py文件中有些配置项需要修改,比如ROBOTSTXT_OBEY的值一般情况下设置为A、1B、 Fa1seCTrueD、0正确答案:B6、关于Python,算法是指()A、程序设计语言的语句序列B、对问题的精确描述C、数学的计算公式D、解决问题的精确步骤正确答案:D7、服务器端响应状态码中,表示“0K,文档正确返回”的是A、304B、200C、302D、404正确答案:B8、APaChe服务器运行后会生成两个日志文件,访问日志是哪个文件OAerrors_1ogB、 access_1ogC、 error_1ogDaccess_1ogs正确答案:B9、CSS中通过哪个属性设定元素的背景图像OAimageB、background-attachmentC、background-positionDbackground-image正确答案:D10、Python文件的后缀名是()。AgoB、doC、pyDphp正确答案:C11、下列不属于操作系统类型的是()。A、实时系统B、分时系统C、批处理系统D、模拟系统正确答案:D12、python编写爬虫过程中,需要将爬取的网页内容转换为哪种类型的对象才可以使用etree模块的xpath方法()ResponseB、E1ementC、DOMD、HTM1正确答案:B13、以下选项中不是Python对文件的写操作方法的是()Awrite和seekB、 writetextC、 write1inesDswrite正确答案:B14、当前INTERNET上应用最广泛的服务是A、E-Mai1B、WWWC、40个以上D、 3040个正确答案:B15、正则表达式“a-z”表示的含义是()A、取所有小写英文字母以及中的任意一个。B、取所有小写英文字母以及中的任意多个。C、取“a、-、z、中的任意一个。D、取“a、-、z、中的任意多个。正确答案:A16、关于异步请求的说法错误的是A、通常用于获取页面局部的数据,但需要对页面整体进行刷新B、通过XM1HttpRequest对象可以实现与服务器的异步交互C、通常使用JSON格式进行数据的交互,但也有可能是其它格式D、能够提升用户的体验正确答案:A17、以下选项中符合Python语言变量命名规则的是A、AI!B、*iC>3_1D>Temp1ist正确答案:D18、服务器端响应状态码中,表示“NOTFOUND未找到”的是A、304B、302C、404D、200正确答案:C19、Python语言中用来定义函数的关键字是A、 defineB、defC>functionD>return正确答案:B20、网络层以上的中继系统是OA、路由器B、转发器C、网桥D、网关正确答案:D21、使用Xpath获取一篇HTM1文档中所有超链接的href属性,Xpath代码为OoA/hrefB、 ahrefC、 ahrefD/a/href正确答案:D22、以下聚合函数求平均数的是()A、COUNTB、AVGC、MAXD、SUM正确答案:B23、PythOn源程序执行的方式()A、编译执行B、解析执行C、直接执行D、边编译边执行正确答案:B24、数据库结构的描述和定义是DBMS运行的基本依据,它们存储于()A、封锁表B、索引C、日志D、数据字典正确答案:D25、查找表结构用以下哪一项A、 SE1ETEB、 A1TERC、 FINDD、 DESC正确答案:D26、关于数据类型,说法不正确的是OA、结构化数据是指具有固定格式的数据B、非结构化数据的结构不规则或不完整,没有预定义的数据模型C、半结构化数据介于结构化数据和非结构化数据之间D、以上说法都不正确正确答案:D27、()是进行数据清洗的工具。A、 fi1ebeatBsapacheC>tomcatDIogstash正确答案:D28、A即协议主要作用是OA、域名地址到IP地址的解析B、IP地址到域名地址的解析C、物理地址到IP地址的解析D、IP地址到物理地址的解析正确答案:D29、在Internet上浏览时,浏览器和WWW服务器之间传输网页使用的协议是:A、WWWB、 HTTPC、 te1netD、ARP正确答案:B30、在操作系统中,多个进程请求相同资源而引起的无休止的相互等待的过程叫做()A、挂起B、阻塞C、死锁D中断正确答案:C31、分析以下SQ1命令:SE1ECTpriceFROMinventoryWHEREpriceBETWEEN1AND50AND(priceIN(55.30.95);命令执行后的最可能的输出结果是A、30B、55C、95D、51正确答案:A32、”内容为一个UR1,标识用户从该UR1代表的页面出发访问当前请求的页面”以上描述所指的消息头是()。AConnectionB、 User-AgentC、 AcceptDsReferer正确答案:D33、1ogStaSh的数据输出中,标准输出是下列哪个选项A、e1asticsearchB、csvC、 fi1eD、 stdout正确答案:D34、层次型、网状型和关系型数据库划分原则是OA、联系的复杂程度B、文件的大小C、数据之间的联系D、记录长度正确答案:C35、关于Python语言的注释,以下选项中描述错误的是A、Python语言的多行注释以''(三个单引号)开头和结尾B、Python语言有两种注释方式:单行注释和多行注释C、Python语言的单行注释以单引号'开头D、Python语言的单行注释以#开头正确答案:C36、Tomcat容器数据采集中检查JDK的版本命令为()AcheckversionB、javacC>javaversionD、java-version正确答案:D37、FTP主要功能是()A、满足应用B、远程访问C、文件传输D、电子商务正确答案:C38、下列哪些属于()规范数据信息收集的方式与要求A、未经用户同意,电信业务经营者、互联网信息服务提供者不得收集、使用用户个人信息B、自然人的个人信息受法律保护C、网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保护制度D、发现网络运营者收集、存储的其个人信息有错误的,有权要求网络运营者予以更正正确答案:B39、搜索引擎优化和网络营销的缩写分别是()A、SEO和UEOB、UEo和SEMC、SEo和SEMD、SEM和SEO正确答案:C40、PythOn中,以下何者是不合法的布尔表达式?()A、3=aB、 e>5and4=fC、(-6)>5D、Xinrange(6)正确答案:A二、多选题(共20题,每题1分,共20分)1、下列属于1inUX发行版操作系统的是()A、UbuntuBsCentosC、 RedHatD、 So1aris正确答案:ABC2、以下属于jQuery选择器的是()A、过滤选择器Bs.c1ass选择器C、元素选择器D、id选择器正确答案:ABCD3、以下CSS中,属于font属性的是()。Afont-sty1eBsfont-weightC>sizeD、font-size正确答案:ABD4、对于日志类型的数据采集,常用的采集工具有A、 IogstashB、 scrapyCbeautifu1SoupD、fi1ebeat正确答案:AD5、以下哪些是Python的保留字和关键字()。A、DefB、c1assCimportD、G1oba1正确答案:BC6、Beautifu1SoUP支持Python标准库中的HTM1解析器以及一些第三方的解析器,常见的解析器有()。Ahtm151ibB、1xm1HTM1解析器C、Ixm1XM1解析器DPythOn标准库正确答案:ABCD7、数据采集的类型包括OA、结构化数据B、半结构化数据C、非结构化数据D、以上都不属于数据采集的类型正确答案:ABC8、下列哪些概念不是为了提高数据库的访问速度而存在()A、外键B、视图C、关系D、索引正确答案:ABC9、网络爬虫按照系统结构和实现技术,可以有以下类型()。A、通用网络爬虫B、增量式网络爬虫C、深层页面爬虫D、聚焦网络爬虫正确答案:ABCD10、在CSS3里可以使用以下()方法,将样式表的功能加到网页里。A、嵌入外部样式表B、链接外部样式表C定义标记的sty1e属性D、定义内部样式正确答案:ABCD11、以下属于CSS选择器的是OA、类选择器B、ID选择器C、标签选择器D、伪类选择器正确答案:ABCD12、以下对网站排名有较大影响的因素是()A、服务器稳定性B、Tit1e标签C、网站内容D、Keywords标签正确答案:ABC13、正则表达式中表示数量的元字符包括A、*B、,C、+D、?正确答案:ACD14、Urnib的Ur1oPen方法的参数,至少是()或()中的一个。A、ur1B、ReqUeSt对象CheadersD、data正确答案:AB15、关于Se1eCt语句下列说法正确的是Ose1ect(name)fromtab1eperson:所有记录的name字段的值B、 se1ect(name)fromtab1epersonwhereage=12;查找age=12的记录的那个字段的值C、se1ect(name,age)frompersonwhereage=12andname="aa"and并且Dse1ect(name)frompersonwhereage=12orname="aa"or或者正确答案:CD16、以下选项中是操作系统的是()A、

    注意事项

    本文(数据采集1+x初级题库(含答案).docx)为本站会员(lao****ou)主动上传,第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知第一文库网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 001doc.com网站版权所有   

    经营许可证编号:宁ICP备2022001085号

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



    收起
    展开