[南开大学(本部)]《网络爬虫与信息提取》19秋期末考核(答案参考).doc

[南开大学(本部)]《网络爬虫与信息提取》19秋期末考核(答案参考).doc

ID:62304602

大小:59.00 KB

页数:28页

时间:2021-04-26

[南开大学(本部)]《网络爬虫与信息提取》19秋期末考核(答案参考).doc_第1页
[南开大学(本部)]《网络爬虫与信息提取》19秋期末考核(答案参考).doc_第2页
[南开大学(本部)]《网络爬虫与信息提取》19秋期末考核(答案参考).doc_第3页
[南开大学(本部)]《网络爬虫与信息提取》19秋期末考核(答案参考).doc_第4页
[南开大学(本部)]《网络爬虫与信息提取》19秋期末考核(答案参考).doc_第5页
资源描述:

《[南开大学(本部)]《网络爬虫与信息提取》19秋期末考核(答案参考).doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、优选[南开大学(本部)]《网络爬虫与信息提取》19秋期末考核(答案参考)【奥鹏】-[南开大学(本部)]《网络爬虫与信息提取》19秋期末考核试卷总分:100  得分:100第1题,如果很多爬虫同时对一个全速爬取,那么其实就是对进行了()攻击A、XSSB、DOSC、DDOSD、跨域正确答案:第2题,以下哪个HTML标签表示分区或节() 28/28优选A、B、C、D、正确答案:第3题,使用UIAutomator获取屏幕上显示的文本内容的操作是得到相应控件后使用命令()A、contentB、text 28/28优选C、titleD、body正确答案:第4题,Python操作CSV

2、文件可通过()容器的方式操作单元格A、列表B、元组C、字典D、集合正确答案: 28/28优选第5题,Python中Object=(1,2,3,4,5),则Objcet是()A、列表B、元组C、字典D、集合正确答案:第6题,HTTP常用状态码表明服务器正忙的是() 28/28优选A、500B、503C、403D、404正确答案:第7题,使用UIAutomator打开微信的操作是获取相应图标后使用命令()A、touchB、clickC、push 28/28优选D、hover正确答案:第8题,Python中Object={‘obj_1’:’1’,’obj_2’:’2’},则Ob

3、jcet.get(‘boj_1’,’3’)是()A、1B、2C、3D、无输出正确答案: 28/28优选第9题,采用以下()技术可以实现异步加载A、HTMLB、AJAXC、CSSD、HTTP正确答案:第10题,根目录中哪个文件里面的内容会告诉爬虫哪些数据是可以爬取的,哪些数据是不可以爬取的()。 28/28优选A、robot.txtB、robot.htmlC、robots.txtD、robots.html正确答案:第11题,Chrome的开发者工具中哪个选项可以查找到cookiesA、ElementsB、SourcesC、Network 28/28优选D、Peformanc

4、e正确答案:第12题,以下哪个命令是linux下解压缩命令()A、curlB、tar-zxvfC、mkdirD、cp正确答案: 28/28优选第13题,MongoDB中数据存储的形式类似于()A、列表B、元组C、字典D、集合正确答案:第14题,以下哪个HTML标签表示定义列表项目()A、 28/28优选B、C、D、正确答案:第15题,python中可以用来将图片中的文字转换为文本的第三方类库是A、lxmlB、requestsC、beautifulsoupD、pytesseract 28/28优选正确答案:第16题,下列哪项不是HTTP的请求类型()A、GETB、POSTC

5、、PUTD、SET正确答案: 28/28优选第17题,以下哪个HTML标签表示定义HTML表格中的标准单元格()A、B、C、D、正确答案:第18题,当爬虫创建好了之后,可以使用”scrapy()”命令运行爬虫。A、startupB、starwar 28/28优选C、drawlD、crawl正确答案:第19题,参数headers=(),把请求头添加到Scrapy请求中,使爬虫的请求看起来像是从浏览器发起的。A、HEADERB、HEADERSC、HEADD、BODY正确答案: 28/28优选第20题,以下哪个命令是利用URL语法在命令行下工作的文件传输工具()A、curlB、

6、tar-zxvfC、mkdirD、cp正确答案:第21题,MongoDB中获取名字为db的库的语句为() 28/28优选A、client.dbB、client(‘db’)C、client[‘db’]D、client{‘db’}正确答案:,C第22题,以下哪些方法属于Python写CSV文件的方法()A、writeheadersB、writeheaderC、writerrows 28/28优选D、writerow正确答案:,C,D第23题,下载器中间件的作用有哪些?A、更换代理IPB、更换CookiesC、更换User-AgentD、自动重试正确答案:,B,C,D 28/2

7、8优选第24题,如果爬虫爬取的是商业,并且目标使用了反爬虫机制,那么强行突破反爬虫机制可能构成()A、非法侵入计算机系统罪B、非法获取计算机信息系统数据罪C、非法获取计算机数据罪D、非法获取系统罪正确答案:,B第25题,Python中()容器有推导式 28/28优选A、列表B、元组C、字典D、集合正确答案:,C,D第26题,通用网络爬虫通常采用串行工作方式T、对F、错正确答案:F 28/28优选第27题,需要登录的一般通过GET请求就可以实现登录。T、对F、错正确答案:F第28题,代理中间件的可用代理列表一定要写在settin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。