数据挖掘导论中文答案1.2.3.4.6.8.10章.pdf

数据挖掘导论中文答案1.2.3.4.6.8.10章.pdf

ID:57023000

大小:3.71 MB

页数:49页

时间:2020-07-31

数据挖掘导论中文答案1.2.3.4.6.8.10章.pdf_第1页
数据挖掘导论中文答案1.2.3.4.6.8.10章.pdf_第2页
数据挖掘导论中文答案1.2.3.4.6.8.10章.pdf_第3页
数据挖掘导论中文答案1.2.3.4.6.8.10章.pdf_第4页
数据挖掘导论中文答案1.2.3.4.6.8.10章.pdf_第5页
资源描述:

《数据挖掘导论中文答案1.2.3.4.6.8.10章.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、习题一:1。讨论是否每个以下活动是一个数据挖掘的任务。(a)将公司的客户根据他们的性别。不。这是一个简单的数据库查询。(b)将公司的客户根据他们的盈利能力。不。这是一个会计计算,紧随其后的是应用程序一个阈值。然而,预测的盈利能力客户将数据挖掘。(c)计算一个公司的总销售额。不。再次,这是简单的会计。(d)排序一个学生数据库基于学生身份证号码。不。再一次,这是一个简单的数据库查询。(e)预测结果掷双骰子(公平)。不。因为模具是公平的,这是一个概率计算。如果死是不公平的,我们需要估计的概率每个结果的数据,那么这是更像的问题认为数据挖掘。然而,在这种特定的情况下,解决方案这个问题是由数学

2、家很长时间前,因此,我们不会认为它是数据挖掘。(f)预测未来股价的公司使用历史记录。是的。我们将尝试创建一个模型,该模型可以预测连续价值的股票价格。这是一个的例子数据挖掘领域称为预测模型。我们可以使用回归建模,尽管在许多领域的研究者开发了各种各样的技术来预测时间吗系列。(g)监测病人的心率异常。是的。我们可以建立一个模型,心脏的正常行为率和不同寻常的心行为发生时发出警报。这将涉及到数据挖掘的区域称为异常检测。这也可以被认为是一个分类问题如果我们有正常和异常的心行为的例子。(h)监测地震活动的地震波。是的。在本例中,我们将构建一个不同类型的模型地震波与地震相关的活动和行为提高警报当其

3、中一个不同类型的地震活动被观察到。这是数据挖掘领域的一个例子被称为分类。(i)提取声波的频率。不。这是信号处理。2.假设你被录用,作为一个互联网数据挖掘咨询顾问搜索引擎公司。描述数据挖掘可以帮助公司通过给具体的例子如何技术,如聚类,分类、关联规则挖掘和异常检测可以应用。答:以下是可能的答案的例子。•聚类可以把结果与类似的主题用户在一个更简洁的形式,例如通过报告集群中的十大最频繁的词语。•分类可以将结果分配给预定义的类别等“体育”、“政治”,等等。•顺序关联分析可以发现,某些查询遵循一定的概率高的其他查询,允许更高效的缓存。•异常检测技术可以发现不寻常的模式用户流量。,这一个话题突然

4、变得太多更受欢迎。可以调整广告策略这种发展的优势。3.为每个数据集后,解释是否数据隐私是一个重要的问题。(a)调查1900年至1950年收集的数据。没有(b)的IP地址和访问时间的网络用户访问你的网站。是的(c)从地球轨道卫星图像。没有(d)的人的姓名和住址,电话本。没有(e)的姓名和电子邮件地址从网上收集。没有习题二1。在最初的第二章的例子,统计学家说,“是的,2和字段3基本上是相同的。“你能告诉三行示例数据这是为什么她说吗?字段2场3≈7显示的值。虽然它可能是危险的得出结论从这样一个小样本,似乎两个字段包含本质上相同的信息。2。分类下面的属性作为二进制、离散或连续的。也把它们归

5、入定性(名义或序数)或定量(间隔或率)。某些情况下可能有多个解释,简要说明你的推理,如果你觉得可能会有一些歧义。例如:年龄。答:离散、定量比率(a)时间点或点。二进制、定性顺序(b)亮度测光表来衡量。连续、定量、比(c)亮度以人们的判断。离散的、定性的、序数(d)的角度来衡量在0度◦◦和360。连续、定量、比(e)铜、银和在奥运会上获得金牌。离散,定性,顺序(f)海拔高度。连续、定量、间隔/比率(视情况而定海平面是否被认为是一个任意的起源)(g)在医院的患者数量。离散、量化、比例(h)ISBN编号为书。(在网上查找格式。)离散,定性,名义(ISBN编号有订单信息,虽然)(i)的能力

6、,通过光的以下值:不透明,半透明的,透明的。离散的、定性的,顺序(j)军衔。离散的、定性的,顺序(k)距离校园的中心。连续、定量、间隔/比(取决于)(i)用每立方厘米表示物质的密度。离散量化,比(m)外套核对数目。(当你参加一个活动,你可以经常给反过来,你的外套的人给你一个号码,你可以使用你的外套当你离开)。离散的、定性的,名义上的3。你是接洽当地一家公司的营销总监,他相信他设计了一个简单的方法来衡量客户的满意度。他解释说他的计划如下:“这太简单了,我不能相信之前没有人想到它。我刚跟踪客户的数量每个产品的投诉。在数据挖掘的书我读才是最重要的比属性,因此,我必须比衡量产品的满意度属性

7、。但当我认为基于我的新产品客户满意度测量和显示给我的老板,他告诉我,我忽略了显而易见的,我的措施是一文不值。我认为他只是疯了因为我们的畅销产品以来最严重的满意度最抱怨。你能帮我让他认识到错误?”(a)是正确的,营销总监还是老板?如果你回答说,他的老板,你会怎么做来修复满意度的测量?答:老板是对的。给出一个更好的衡量满意度(产品)=投诉的产品数量/销售产品的总数。(b)你会说些什么关于原始属性类型的产品满意度属性?答:没有什么是原始测量的属性类型。例如,两个产品相同的客

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。