毕业设计(论文)外文翻译-基于数据挖掘的直销电子商务

毕业设计(论文)外文翻译-基于数据挖掘的直销电子商务

ID:45591649

大小:174.02 KB

页数:23页

时间:2019-11-15

毕业设计(论文)外文翻译-基于数据挖掘的直销电子商务_第1页
毕业设计(论文)外文翻译-基于数据挖掘的直销电子商务_第2页
毕业设计(论文)外文翻译-基于数据挖掘的直销电子商务_第3页
毕业设计(论文)外文翻译-基于数据挖掘的直销电子商务_第4页
毕业设计(论文)外文翻译-基于数据挖掘的直销电子商务_第5页
资源描述:

《毕业设计(论文)外文翻译-基于数据挖掘的直销电子商务》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、ft)及門塑,弟俛《798A罗XIAMENUNIVERSITYOFTECHNOLOGY毕业设计(论文)外文资料翻译系部:计算机科学与技术系专业:计算机科学与技术姓名:洪维坤学号:0807012215夕卜文出处:ProceedingofWorkshoponthe(用外文写)ofArtificialHualien,TaiWan,2005指导老师评语:签名:年月Fl不确定性数据挖掘:一种新的研究方向MichaelChaul,ReynoldCheng2,andBenKao31:商学院,香港大学,薄扶林,香港2:计算机系,香港理工大学九龙湖校区,香港3:计算机科学系,香

2、港大学,薄扶林,香港摘要由于不精确测量、过时的来源或抽样误斧等原因,数据不确定性常常出现在真实世界应用中。目前,在数据库数据不确定性处理领域中,很多研究结果已经被发表。我们认为,当不确沱性数据被执行数据挖掘时,数据不确定性不得不被考虑在内,才能获得高质量的数据挖掘结果。我们称之为“不确定性数据挖掘”问题。在本文中,我们为这个领域可能的研究方向提出一个框架。同时,我们以UK-means聚类算法为例来阐明传统K-means算法怎么被改进来处理数据挖掘屮的数据不确定性。1.引言由于测量不精确、抽样误差、过时数据來源或其他等原因,数据往往带有不确定性性质。特别在需要与

3、物理环境交互的应用中,女口:移动定位服务[15]和传感器监测[3]。例如:在追踪移动目标(如车辆或人)的情境中,数据库是不可能完全追踪到所有目标在所有瞬间的准确位置。因此,每个目标的位置的变化过程是伴有不确定性的。为了提供准确地查询和挖掘结果,这些导致数据不确定性的多方面来源不得不被考虑。在最近几年里,已有在数据库中不确定性数据管理方面的大量研究,女ri:数据库中不确定性的表现和不确定性数据查询。然而,很少有研究成果能够解决不确定性数据挖掘的问题。我们注意到,不确定性使数据值不再具有原子性。对于使用传统数据挖掘技术,不确定性数据不得不被归纳为原子性数值。再以追

4、踪移动H标应用为例,一个目标的位置可以通过它最后的记录位置或通过一个预期位置(如果这个目标位置概率分布被考虑到)归纳得到。不幸地是,归纳得到的记录与真实记录之间的误差可能会严重也影响挖掘结果。图1阐明了当一种聚类算法被应用追踪带有不确定性位置的移动冃标时所发生的问题。图1(a)表示一组冃标的真实数据,而图1(b)则表示记录的已过时的这些冃标的位置。如果这些实际位置是有效的话,那么它们与那些从过时数据值屮得到的数据集群有明显差界。如果我们仅仅依靠记录的数据值,那么将会很多的H标可能被置于错误的数据集群中。更糟糕地是,一个群中的每一个成员都有可能改变群的质心,因此

5、导致更多的错误。1(a)真实世畀数据(b)记录数据(C)不确定性数据2图1数据图图1.(a)表示真实数据划分成的三个集群(a、b、c)o(b)表示的有些目标(隐藏的)的记录位置与它们真实的数据不一样,因此形成集群『、bc,和c”。注意到H集群屮比a集群少了一个忖标,而b'集群中比b集群多一个t(标。同时,c也误拆分会为c,和c”。(c)表示方向不确定性被考虑来推测出集群V和c。这种聚类产生的结果比(b)结果更加接近(a)。我们建议将不确定性数据的概率密度函数等不确定性信息与现有的数据挖掘方法结合,这样在实际数据可利用于数据挖掘的情况下会使得挖掘结果更接近从真

6、实数据中获得的结果。本文研究了不确定性怎么通过把数据聚类当成一种激励范例使用使得不确定性因素与数据挖掘和结合。我们称之为不确定性数据挖掘问题。在本文中,我们为这个领域可能的研究方向提出一个框架。文章接下来的结构如下。第二章是有关工作综述。在第三章中,我们定义了不确定性数据聚类问题和介绍我们提议的算法。第四章将星现我们算法在移动口标数据库的应用。详细地的实习结果将在第五章解释。最后在第六章总结论文并捉出可能的研究方向。1.研究背景近年來,人们对数据不确定性管理有明显的研究兴趣。数据不确定性被为两类,即已存在的不确定生和数值不确定性。在第一•种类型屮,不管H标或数

7、据元组存在是否,数据本身就已经存在不确定性了。例如,关系数据库中的元组可能与能表现它存在信任度的一个概率值相关联[1,2]。在数据不确定性类型中,一个数据项作为一个封闭的区域,与其值的概率密度函数(PDF)限定了其可能的值[3,4,12,15]。这个模型可以被应用于量化在不断变化的环境下的位置或传感器数据的不精密度。在这个领域里,大量的工作都致力于不精确查找。例如,在[5]中,解决不确定性数据范围查询的索引方案已经被提出。在[4]中,同一作者提出了解决邻近等查询的方案。注意到,所有工作已经把不确定性数据管理的研究结果应用于简化数据库查询中,而不是应用于相对复杂

8、的数据分析和挖掘问题中。在数据挖掘研究

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。