欢迎来到天天文库
浏览记录
ID:83586890
大小:14.07 KB
页数:13页
时间:2024-09-01
《大数据采集与存储智慧树知到课后章节答案2023年下山东交通学院.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
大数据采集与存储智慧树知到课后章节答案2023年下山东交通学院山东交通学院第一章测试1.关系模式学生信息(学号,姓名,年龄,性别,籍贯),其中的主键是()A:姓名B:性别C:年龄D:学号答案:学号2.Oracle是一个开源、免费的中小型关系型数据库管理系统。()A:错B:对答案:错3.NoSQL的全称是()A:NoSql B:NotSqlC:其余选项都不是D:NotOnlySql答案:NotOnlySql 1.键值数据库,是基于key-value模式,它使用简单的键值方法来存储数据。()A:对B:错答案:对2.()是最原始的SQLOnHadoop的解决方案,它是基于Hadoop实现的分布式数据仓库。A:HadoopB:HiveC:ZooKeeperD:Hbase答案:Hive3.图数据库,以“图”数据结构存储和查询数据,使用节点表示数据模型中的实体,节点之间的边表示实体之间的关系。()A:错B:对答案:对第二章测试4.关于数据模型,下列说法正确的是()。A:数据模型的三要素是数据结构、数据操作和数据完整性约束B:数据操作是对数据库静态特性的描述。C:3种基本数据模型有图形模型、层次模型和关系模型 D:数据模型是对数据库动态特性的描述。答案:数据模型的三要素是数据结构、数据操作和数据完整性约束1.关于学生关系,下列哪一个属性适合作为候选码()。A:学号。B:性别C:班级D:年龄。答案:学号。2.有学生表Student(S#char(8),Snamechar(10),Ssexchar(2),Sageinteger,D#char(2),Sclasschar(6))。要检索学生表中“所有年龄小于等于19岁的学生的年龄及姓名”,SQL语句正确的是()A:SelectSnameFromStudentWhereSage<=19B:Select*FromStudentWhereSage<=19C:SelectSage,SnameFromStudentWhereSage<=19D:SelectSage,SnameFromStudent答案:SelectSage,SnameFromStudentWhereSage<=193.有学生表Student(S#char(8),Snamechar(10),Ssexchar(2),Sageinteger,D#char(2),Sclasschar(6))。若要“检索名字为姓张的所有同学姓名”,SQL语句正确的是()A:SelectSnameFromStudentWhereSnameNotLike‘张__’B:SelectSnameFromStudentWhereSnameLike‘张%’C:SelectSnameFromStudentWhereSnameLike‘张_’ D:SelectSnameFromStudentWhereSnameLike‘张__’答案:SelectSnameFromStudentWhereSnameLike‘张%’1.SQL语言中,删除一个表的命令是()A:DELETEB:CLEARC:DROPD:REMOVE答案:DROP2.在下列关于视图的叙述中,正确的是()A:视图—旦建立,就不能被删除;B:若导出某视图的基本表被删除,该视图将不受任何影响;C:当修改某一视图时,导出该视图的基本表也随之修改。D:当某一视图删除后,由该视图导出的其它视图也将自动删除;答案:当修改某一视图时,导出该视图的基本表也随之修改。3.查询时,若要输出无重复的记录,SELECT子句中使用的保留字是:()A:ALLB:TOPNC:DISTINCTD:TOPNPERCENT答案:DISTINCT 1.查询结果输出时要求按“总评成绩”降序排列,相同者按“性别”升序,正确的子句是()A:ORDERBY总评成绩,性别DESCB:ORDERBY总评成绩DESC,性别DESCC:ORDERBY总评成绩ASC,性别DESCD:ORDERBY总评成绩DESC,性别答案:ORDERBY总评成绩DESC,性别2.参照完整性规则是指表的()必须是另一个表主键的有效值,或者是空值。A:候选键B:主属性C:外键D:主键答案:外键3.下面有关HAVING子句,说法不正确的是()A:使用HAVING子句的作用是过滤掉不满足条件的分组B:HAVING子句必须与GROUPBY子句同时使用,不能单独使用C:使用HAVING子句的同时可以使用WHERE子句D:使用HAVING子句的同时不能使用WHERE子句答案:使用HAVING子句的同时不能使用WHERE子句 第三章测试1.MongoDB是一个开源、高性能、无模式的文档型数据库。()A:对B:错答案:对2.MongoDB通过()来描述和存放数据。A:XMLB:JSONC:BSON答案:BSON3.查看当前正在使用的数据库命令()A:setB:dbC:useD:get答案:db4.MongoDB中,用户可以将_id字段上的索引删除。()A:错B:对答案:错 1.关系型数据库遵循BASE和CAP理论。()A:对B:错答案:错第四章测试2.大数据采集,又称大数据获取,是指从()等获取数据的过程。A:其它智能设备B:社交网络C:企业系统D:传感器答案:其它智能设备;社交网络;企业系统;传感器3.网络爬虫的步骤是1)选取一部分种子URL;2)从待抓取URL队列中取出待抓取的URL,解析DNS,得到主机的IP地址,并将URL对应的网页下载下来,存储到已下载网页库中。此外,将这些URL放进已抓取URL队列;3)将这些URL放到待抓取URL中;4)分析已抓取URL队列中的URL,分析其中的其他URL,并且将这些URL放入待抓取URL队列,从而进入下一个循环。()A:2)4)1)3)B:1)2)3)4)C:2)3)4)1)D:1)3)2)4) 答案:1)3)2)4)1.数据完整性指的是数据具有一个实体描述的所有必需的部分。()A:对B:错答案:对2.在大数据预处理中,需要数据清洗的主要类型包括以下几类()A:缺失值数据B:异常值数据C:重复值数据D:需要标准化的数据答案:缺失值数据;异常值数据;重复值数据3.数据清洗时重复值数据不能够删除。()A:错B:对答案:错4.在数据离散化中,常见的离散化方法有()A:基于卡方分箱的方法B:等频划分C:聚类划分D:基于熵的离散化E:等宽划分 答案:基于卡方分箱的方法;等频划分;聚类划分;基于熵的离散化;等宽划分第五章测试1.爬虫就是能够实现网页数据爬取的程序。()A:错B:对答案:对2.Python中提供的requests库的get()方法能够实现爬取网页信息的功能。()A:对B:错答案:对3.在使用requests库获取网页资源过程中,最重要的两个对象就是Request和Response,()负责将客户端的请求发送给服务器。A:RequestB:Response答案:Request 1.HTML语言使用“标签对”来标记信息。其中,<html>……</html>标记一个HTML文件中标题的开始和结束。()A:对B:错答案:错2.如果有网络爬虫频繁的访问服务器,则容易引发()问题。A:网站的性能下降B:法律风险C:个人隐私问题答案:网站的性能下降3.任何网站都有自己的Robots协议,用来保护网站的信息不会被恶意访问。()A:对B:错答案:错第六章测试4.Kettle是一种常用的ETL工具,它支持图形化的GUI设计界面。()A:对B:错答案:对5.在数据清洗中,“输入”功能主要是实现ETL的数据抽取、加载、格式转换。() A:对B:错答案:错1.Kettle能够支持多种格式的数据输出,但不支持下面()文件格式。A:wordB:excelC:MySql数据库D:txtE:json答案:word2.kettle中的以下组件中,属于基本数据清洗的是()A:数据替换B:数据排序C:删除数据D:连接字段答案:数据替换;数据排序;删除数据;连接字段3.Kettle让我们在可视化的界面中,通过拖拽实现数据处理。无需掌握复杂的编程技术也可以帮助我们完成数据的ETL处理。()A:错B:对答案:对 1.Kettle中的job作业是指定时完成一系列指定的数据转换,并将结果以邮件的方式告知给我们。()A:错B:对答案:对第七章测试2.在本案例中,数据采集是通过()获取。A:社交网络B:传感器数据C:网络爬虫D:企业管理系统答案:网络爬虫3.在数据采集后,python中使用()库把数据存储到csv文件中。A:csv库B:mysql库C:request库D:pandas库答案:csv库4.不同的关系型数据库管理系统,使用的SQL标准不一样。() A:错B:对答案:错1.开发者工具中Network标签包括()A:请求列表B:过滤器C:控制器D:概要E:概览答案:请求列表;过滤器;控制器;概要;概览2.查找集合中的数据,使用()方法。A:find方法B:query方法C:get方法D:select方法答案:find方法
此文档下载收益归作者所有
举报原因
联系方式
详细说明
内容无法转码请点击此处