资源描述:
《[南开大学(本部)]《网络爬虫与信息提取》19秋期末考核(答案参考).doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、优选[南开大学(本部)]《网络爬虫与信息提取》19秋期末考核(答案参考)【奥鹏】-[南开大学(本部)]《网络爬虫与信息提取》19秋期末考核试卷总分:100 得分:100第1题,如果很多爬虫同时对一个全速爬取,那么其实就是对进行了()攻击A、XSSB、DOSC、DDOSD、跨域正确答案:第2题,以下哪个HTML标签表示分区或节()
28/28优选A、B、C、D、正确答案:第3题,使用UIAutomator获取屏幕上显示的文本内容的操作是得到相应控件后使用命令()A、contentB、text
28/28优选C、titleD、body正确答案:第4题,Python操作CSV
2、文件可通过()容器的方式操作单元格A、列表B、元组C、字典D、集合正确答案:
28/28优选第5题,Python中Object=(1,2,3,4,5),则Objcet是()A、列表B、元组C、字典D、集合正确答案:第6题,HTTP常用状态码表明服务器正忙的是()
28/28优选A、500B、503C、403D、404正确答案:第7题,使用UIAutomator打开微信的操作是获取相应图标后使用命令()A、touchB、clickC、push
28/28优选D、hover正确答案:第8题,Python中Object={‘obj_1’:’1’,’obj_2’:’2’},则Ob
3、jcet.get(‘boj_1’,’3’)是()A、1B、2C、3D、无输出正确答案:
28/28优选第9题,采用以下()技术可以实现异步加载A、HTMLB、AJAXC、CSSD、HTTP正确答案:第10题,根目录中哪个文件里面的内容会告诉爬虫哪些数据是可以爬取的,哪些数据是不可以爬取的()。
28/28优选A、robot.txtB、robot.htmlC、robots.txtD、robots.html正确答案:第11题,Chrome的开发者工具中哪个选项可以查找到cookiesA、ElementsB、SourcesC、Network
28/28优选D、Peformanc
4、e正确答案:第12题,以下哪个命令是linux下解压缩命令()A、curlB、tar-zxvfC、mkdirD、cp正确答案:
28/28优选第13题,MongoDB中数据存储的形式类似于()A、列表B、元组C、字典D、集合正确答案:第14题,以下哪个HTML标签表示定义列表项目()A、
28/28优选B、C、D、正确答案:第15题,python中可以用来将图片中的文字转换为文本的第三方类库是A、lxmlB、requestsC、beautifulsoupD、pytesseract
28/28优选正确答案:第16题,下列哪项不是HTTP的请求类型()A、GETB、POSTC
5、、PUTD、SET正确答案:
28/28优选第17题,以下哪个HTML标签表示定义HTML表格中的标准单元格()A、B、C、D、正确答案:第18题,当爬虫创建好了之后,可以使用”scrapy()”命令运行爬虫。A、startupB、starwar
28/28优选C、drawlD、crawl正确答案:第19题,参数headers=(),把请求头添加到Scrapy请求中,使爬虫的请求看起来像是从浏览器发起的。A、HEADERB、HEADERSC、HEADD、BODY正确答案:
28/28优选第20题,以下哪个命令是利用URL语法在命令行下工作的文件传输工具()A、curlB、
6、tar-zxvfC、mkdirD、cp正确答案:第21题,MongoDB中获取名字为db的库的语句为()
28/28优选A、client.dbB、client(‘db’)C、client[‘db’]D、client{‘db’}正确答案:,C第22题,以下哪些方法属于Python写CSV文件的方法()A、writeheadersB、writeheaderC、writerrows
28/28优选D、writerow正确答案:,C,D第23题,下载器中间件的作用有哪些?A、更换代理IPB、更换CookiesC、更换User-AgentD、自动重试正确答案:,B,C,D
28/2
7、8优选第24题,如果爬虫爬取的是商业,并且目标使用了反爬虫机制,那么强行突破反爬虫机制可能构成()A、非法侵入计算机系统罪B、非法获取计算机信息系统数据罪C、非法获取计算机数据罪D、非法获取系统罪正确答案:,B第25题,Python中()容器有推导式
28/28优选A、列表B、元组C、字典D、集合正确答案:,C,D第26题,通用网络爬虫通常采用串行工作方式T、对F、错正确答案:F
28/28优选第27题,需要登录的一般通过GET请求就可以实现登录。T、对F、错正确答案:F第28题,代理中间件的可用代理列表一定要写在settin