欢迎来到天天文库
浏览记录
ID:83586885
大小:72.68 KB
页数:21页
时间:2024-09-01
《大数据工具应用智慧树知到课后章节答案2023年下广东金融学院.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
大数据工具应用智慧树知到课后章节答案2023年下广东金融学院广东金融学院第一章测试1.2011年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、管理和( )能力的数据集。A:计算B:应用C:分析D:访问答案:分析2.用4V来概括大数据的特点的话,一般是指:Value、Velocity、Volume和( )。A:ValleyB:VagaryC:VarietyD:Vainly答案:Variety3.大数据分析四个方面的工作主要是:数据分类、( )、关联规则挖掘和时间序列预测。A:数据统计B:数据清洗C:数据计算D:数据聚类 答案:数据聚类1.新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的。A:错B:对答案:错2.目前的大数据处理技术只能处理结构化数据。A:错B:对答案:错第二章测试3.我们常用的微软Office套件中的Access数据库软件的数据库文件格式后缀名是( )。A:dbfB:xlsC:mdfD:mdb答案:mdb 1.大多数日志文件的后缀名是( )。A:txtB:csvC:xmlD:log答案:log2.本课程重点介绍的weka软件的专有文件格式是( )。A:MongoDBB:ARFFC:valueD:keymap答案:ARFF3.数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和( )。A:专业性B:排他性C:共享性D:一致性答案:一致性4.八爪鱼软件的“自定义采集”工作方式下,需要在软件里输入一个( )来作为采集的目标。 A:用户名B:电话号码C:网页地址D:关键词答案:网页地址1.八爪鱼软件的采集规则可以通过文件的形式来导入或者导出,这种文件的后缀名是( )。A:gifB:pngC:otdD:jpg答案:otd2.Excel可以通过“数据有效性”按钮操作来规范数据输入的范围。A:对B:错答案:对3.Excel不能导入txt或csv格式的文件。A:对B:错答案:错 1.八爪鱼软件只能对软件内建了“简易采集”规则的网站采集数据。A:错B:对答案:错2.八爪鱼软件进行自定义采集时,需要了解对网页的页面结构。A:错B:对答案:对第三章测试3.使用DBSCAN算法对鸢尾花数据集(Iris.arff)进行聚类,将epsilon参数设置为0.2,minPoints参数设置为5,忽略class属性,那么将形成( )个簇。 A: 4B: 3C: 1D: 2答案: 24.使用EM算法对天气数据集(weather.numeric.arff)进行聚类,将numClusters设置为4,即簇数为4,其他参数保持默认值,忽略play属性,从结果中可知,下列选项中,( )是错误的。 A: 这组数据用算法迭代15次B: 模型的最大似然估计值是-7.18 C: 第四个簇的实例数为4D: 第四个簇的先验概率是0.14答案: 第四个簇的实例数为41.使用SimpleKMeans算法对天气数据集(weather.numeric.arff)进行聚类,保持默认参数,即3个簇以及欧氏距离。选择play属性为忽略属性,从结果中可知,下列选项中,( )是错误。 A: 产生了三个中心点B: 这组数据用算法迭代四次C: 聚合为3个簇,分别有7,3,4个实例D: 平方和误差为8.928答案: 这组数据用算法迭代四次2.使用线性回归(LinearRegression)分类器和用M5P分类器对cpu.arff分别进行分类,由其输出的误差指标可知( )。A: LinearRegression的标准误差比M5P的标准误差小B: LinearRegression的平均绝对误差比M5P的平均绝对误差小C: LinearRegression的相对误差比M5P的相对误差小D: LinearRegression的平均方根误差比M5P的平均方根误差大答案: LinearRegression的平均方根误差比M5P的平均方根误差大3.删去cpu.arff数据文件中的CACH属性后,使用M5P分类器构建方案,在结果中,到达LM2的实例数有( )个。 A: 21B: 165C: 30D: 23答案: 21 1.根据J48分类器训练weather.nominal.arff所生产的决策树,当outlook=sunny;temperature=cool;humidity=high;windy=TRUE时,分类的结果是( )。 A: YesB: NoC: 无法分类D: 没有结果答案: No2.根据J48分类器训练iris.arff所生产的决策树,当sepallength=4.4;sepalwidth=3.0;petallength=1.3;petalwidth=0.2时,分类的结果是( )。 A: Iris-setosaB: Iris-versicolorC: 无法分类D: Iris-virginica答案: Iris-setosa3.关于Weka离散化说明正确的是( )。 A: 等宽离散化是使实例分布均匀的B: 有监督离散化有两种等宽和等频方法C: 离散化是将数值属性转换为字符串型属性D: 离散化包括无监督离散化和有监督离散化答案: 离散化包括无监督离散化和有监督离散化4.以下( )不是Weka的数据类型。A: nominalB: decimalC: stringD: numeric答案: decimal 1.关于Weka的文件类型描述错误的是( )。 A: arff是ASCII文件,可以用Word等文本编辑器打开查看B: Weka可以打开文件格式有.arff、.csv、.xlsxC: Weka处理的数据集类似于关系数据库横行实例,竖行属性D: @relation定义数据集名称,@data之后呈现实例,每一行就是一个实例答案: Weka可以打开文件格式有.arff、.csv、.xlsx2.以下属于关联分析的是( )。A: CPU性能预测B: 自动判断鸢尾花类别C: 购物篮分析D: 股票趋势建模答案: 购物篮分析3.大数据时代的到来,使我们无法人为地去发现数据中的奥妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下( )算法直接挖掘。 A: K-meansB: BayesNetworkC: C4.5D: Apriori答案: Apriori4.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的( )问题。 A: 聚类B: 分类C: 自然语言处理D: 关联规则发现答案: 关联规则发现 1.在进行自动选择属性时,必须设立两个对象,其中确定使用什么方法为每个属性子集分配一个评估值的对象是下面的( )。A: 搜索方法B: 属性评估器C: 元分类器D: 规则挖掘答案: 属性评估器2.以下属于属性空间的搜索方法的是( )。A: GainRatioAttributeEvalB: SymmetricalUncertAttributeEvalC: PrincipalComponentsD: BestFirst答案: BestFirst3.在weka软件探索者界面中,利用Visualize标签页通过更改各个参数来进行数据集的可视化属性设置后,需要单击以下( )按钮,所有更改才会生效。A: SubSampleB: UpdateC: SelectAttributeD: Fastscrolling答案: Update4.给定关联规则AB,意味着:若A发生,B也会发生。A:错B:对答案:错 1.支持度是衡量关联规则重要性的一个指标。A:错B:对答案:对2.Ranker方法既可以用于单个属性评估器,又可以用于属性子集评估器。A:对B:错答案:错3.利用weka软件进行数据可视化时,用户可以选择类别属性对数据点着色,如果类别属性是标称型,则显示为彩色条。A:对B:错答案:错第四章测试4.贝叶斯网络中的节点代表( )。A:随机变量B:随机函数C:变量D:随机过程答案:随机变量 1.贝叶斯网络中,节点需给出概率分布描述,对于离散型随机变量而言,可以用( )的形式表示。A:条件概率表B: 均匀分布C:条件概率密度函数D:正态分布答案:条件概率表2.贝叶斯网络中节点之间的边代表( )。A:概率因果B:随机结果C:随机关系D:组合关系答案:随机关系3.贝叶斯网络保存的文件格式是( )。A:XMLBIFB:XLSC: TXTD:DOCX答案:XMLBIF4.下面( )不是反向传播神经网络的结构。A:计算层B:输入层C:隐含层D:输出层答案:计算层5.神经网络中的节点代表( )。A:随机变量B:随机函数C:激励变量D:激励函数答案:激励函数 1.下列( )不是常见的激励函数。A:线性函数B:阈值函数C:Sigmoid函数D:正弦函数答案:正弦函数2.在贝叶斯网络编辑界面时,如果节点的名称没法完全显示,需要从( )菜单项进行调整。A:Tools|SetDataB:View|ZoomInC:View|ZoomOutD:Tools|Layout答案:Tools|Layout3.WEKA中选择神经网络分类器操作时,应该选择( )。A:functions条目下的MultilayerPerceptron分类器B:默认的分类器C:functions条目下的SGD分类器D:rules条目下的PART答案:functions条目下的MultilayerPerceptron分类器4.下面关于PackageManager安装后的目录说明不正确的是( )。A:doc子目录存放API文档B:sample-data子目录存放数据集文件C:src子目录存放源代码文件D:lib子目录存放包所需要的说明文件答案:lib子目录存放包所需要的说明文件 第五章测试1.Tableau是一款定位于数据可视化敏捷开发和实现()展现工具。Tableau连续第6年在Gartner分析和商业智能魔力象限中蝉联领导者殊荣。A:商业统计B:商务智能C:商业行为D:商务计算答案:商务智能2.以下()不是Tableau的数据类型?A:BooleanB:StringC:DecimalD:Date答案:Decimal3.Tableau可以用来实现交互的、()的分析和仪表板应用,从而帮助我们快速地认识和理解数据。A:连续性B:可视化C:智能化D:离散性答案:可视化4.下列说法错误的是()。A:Tableau通过内存数据引擎,可以直接查询外部数据库同时动态的从数据仓库抽取实时数据,极大的提高了数据访问和查询效率B:Tableau不提供应用编程接口C:用户仅需要通过轻点鼠标和简单拖放就可以迅速创建出智能、精美、直观和具有强交互性的报表和仪表盘 D:Tableau允许从多个数据源访问数据,包括带分隔符的文本文件、Excel文件、SQL数据库、Oracle数据库和多维数据库等答案:Tableau不提供应用编程接口1.度量往往是()字段,度量是我们的指标。度量常常是连续的,连续的字段在图表中形成轴.将其拖放到功能区时,Tableau默认会进行()。A:分类,混合运算B:数值,聚合运算C:分类,聚合运算D:数值,混合运算答案:数值,聚合运算2.关于数据分层描述错误的是()。A:数据分层的层次结构可以手工调整B:数据分层可以实现向上钻取C:数据分层可以实现向下钻取D:数据分层的层级结构由数据维度的上下顺序决定答案:数据分层可以实现向上钻取3.以下不属于集的创建方式的是()。A:[顶部]创建B:[常规]创建C:[分组]创建D:[条件]创建答案:[分组]创建4.Tableau右边数据目录栏中,不能单击右键创建参数的纬度是()。 A:纬度B:集C:参数D:度量答案:集1.以下不是创建计算字段时的运算逻辑的是()。A:表结构B:数字C:日期D:用户答案:表结构2.仪表板版面大小设计选项,()不属于大小设计选项。A:范围B:固定大小C:自动D:自定义答案:自定义第六章测试3.Logistic函数的定义域是()。A:(-INF,+INF)B:(-INF,1)C:(0,+INF)D:[0,1]答案:(-INF,+INF)4.下列叙述错误的是()。A:逻辑回归采用Sigmoid函数对样本数据进行拟合,以构建回归模型B:逻辑回归预测事件发生的概率并分析导致事件发生的因素 C:逻辑回归主要用于回归分析D:逻辑回归是一种监督机器学习算法答案:逻辑回归主要用于回归分析1.使用IBk分类器和SMO分类器对vote.arff分别进行分类,由其输出的结果可知()。A:IBk正确分类百分比比SMO大B:SMO对democrat的分类正确率比IBk小C:IBk对republican的分类正确率比SMO大D:SMO对democrat和republican的分类正确率都比IBk大答案:SMO对democrat和republican的分类正确率都比IBk大2.A:0或1B:true或falseC:0或-1D:1或-1答案:1或-13.以下描述错误的是()。A:SVM寻找具有最小边缘的超平面,因此经常被称为最小边缘分类器B:SVM对噪声不具备鲁棒性C:k-最近邻算法(K-NN)是一种消极学习器D:聚类分析可以看作是一种非监督的分类答案:SVM寻找具有最小边缘的超平面,因此经常被称为最小边缘分类器 1.线性支持向量机的最大化间隔正确的描述是()。A:B:C:D:答案:2.以下计算距离的公式中,计算欧氏距离的是()。A:B:C: D:答案:第七章测试1.以下数据和信息的说法,不正确的是()。A:数据的形式是多样化的B:信息是客观世界各种事物特征的反映C:数据对用户来说是有价值的D:凡是可以电子化记录下来的都是数据答案:数据对用户来说是有价值的2.以下关于数据分析的方法,正确的是()。A:数据分析是信息到数据的转换过程B:数据分析的目的就是解决我们现实中的某个问题C:所有的分析都是要从“过程”出发,没有结论的数字罗列并不是分析D:分析是一个过程,分析的对象是信息答案:数据分析的目的就是解决我们现实中的某个问题 1.以下不属于数据分析的作用的是()。A:数据分析有助于企业分析目标客户B:数据分析有助于企业绩效分析与管理C:数据分析有助于增加营销开支D:数据分析有助于优化运营前线答案:数据分析有助于增加营销开支2.以下不属于问题的有效性检验的是()。A:复杂性检验B:可行性检验C:有用性检验D:必要性检验答案:必要性检验3.图a到图b的转变,属于数据分析思维中的哪一种思维()。图a图b A:对照B:降维C:拆分D:增维答案:对照1.当我们当前的维度不能很好地解释我们的问题时,我们就需要对数据做一个运算,增加多一个指标。这属于以下哪种思维方式()。A:对照B:拆分C:降维D:增维答案:增维2.对()的理解是数据分析的前提。A:结果B:数据C:业务D:信息答案:业务3.以下不属于初级数据分析方法的是()。A:对比分析法B:回归分析法C:平均分析法D:交叉分析法答案:回归分析法 1.对多种影响因素按其重要程度进行一定组合,先按第一组合选择出较大范围目标对象,再按第二组合对第一组合筛选出来的对象进一步缩小范围,以此类推,得出最终目标对象。该描述是以下哪种数据分析方法的思想()。A:层层筛选法B:回归分析法C:平均分析法D:对比分析法答案:层层筛选法2.一个好的统计图需满足的标准,不包括以下()。A:简洁B:有效C:准确D:清楚答案:清楚
此文档下载收益归作者所有
举报原因
联系方式
详细说明
内容无法转码请点击此处