中期检查——基于加权向量提升的多尺度聚类数据挖掘

中期检查——基于加权向量提升的多尺度聚类数据挖掘

ID:27747599

大小:77.05 KB

页数:6页

时间:2018-12-05

中期检查——基于加权向量提升的多尺度聚类数据挖掘_第1页
中期检查——基于加权向量提升的多尺度聚类数据挖掘_第2页
中期检查——基于加权向量提升的多尺度聚类数据挖掘_第3页
中期检查——基于加权向量提升的多尺度聚类数据挖掘_第4页
中期检查——基于加权向量提升的多尺度聚类数据挖掘_第5页
资源描述:

《中期检查——基于加权向量提升的多尺度聚类数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文中期检查基于加权向量提升的多尺度聚类数据挖掘名业向师间专方教科究导姓学研指时苏东海计算机应用技术数据挖掘赵书良教授2013-03-27基于加权向量提升的多尺度聚类数据挖掘目录基于加权向量提升的多尺度聚类数据挖掘11.研究H的和意义31.1.聚类挖掘是数据挖掘的一个重要研究方向31.2.多尺度聚类挖掘是聚类挖掘研究的一个新方向31.3.多尺度聚类数据挖掘面临紧迫要求。32.国内外研究现状32.1.多尺度数裾挖掘的三种途径32.2.某于三种途径的多尺度聚类挖掘算法研究43.主要研究内容44.目前己完成情况44.1.基

2、于加权叫撒提升的多尺度聚类挖掘算法44.2.基准尺度的选取准则54.3.加权14量提升的权重的确定方法55.尚未完成的工作66.后期工作安排61.研究目的和意义聚类挖掘是数据挖掘的一个重要研究方向聚类挖掘的R的适将人景的数据对象按其£)身的属性划分成若千类别,以保证同类对象间尽可能相近,而类间对象尽可能相异,从中发现一些对用户有川的信息以指导川户进行更深层次的数据挖掘或分析。因此,有效地进行聚类挖掘至关重要。多尺度聚类挖掘是聚类挖掘研究的一个新方向多尺度聚类挖掘是针对数据的多尺度特性进行的聚类挖掘,g在对数据的不M尺度进行聚

3、类,数裾的多尺度聚类挖掘主要表现在两个方ifti:时间尺度的可仲缩性和空间尺度的可扩展性。使用P在不同的尺度层而对数据进行观察与分析。多尺度聚类数据挖掘面临紧迫要求随着数据挖掘技术的普及和放川,聚类挖掘作为数据挖掘领域屮的重要技术而得到广泛的应用,然而仅从数据的单一尺度进行的聚类挖掘已不能满足用广观察和分析数裾的要求。为适应用户从多个尺度探索数据的紧迫耍求,提Hi了一种基于加权A量提升的多尺度聚类挖掘算法,以实现在多个尺度层沏对数椐进行聚类挖掘。内外研究现状多尺度数据挖掘的三种途径孙庆先,方涛,郭达志等通过对空间数据挖掘屮的

4、尺度转换进行研究将数据的多尺度数据挖掘归结为以卜三个途径:在挖掘前将单一尺度的数据转换为多个尺度的数据,然后对多个尺度的数据分別进行挖掘,即实现数裾的多尺度转换;b)在数据挖掘算法屮增加调负尺度用的操作部件,以控制挖掘出的知识的尺度;c>将挖掘出的单一尺度的知识转换为多个尺度的知识,即实现知识的多尺度转换。基于三种途径的多尺度聚类挖掘算法研究对数裾的多尺度特性进行聚类挖掘算法研究的方法主要集中于前两种途径,即实现数据的多尺度转换。如施培蓓,郭玉堂等2011年通过比较聚类屮心与原点的距离和引入尺度参数来控制数据点与聚类中心的距

5、离的方法提ili了一种改进的K-Means聚类算法实现了多尺度的i普聚类数据挖掘。这种类型的聚类算法需要对数据的每一个尺度应用一次聚类挖掘算法,计算S大。而第三种途径的多尺度聚类挖掘算法研究较少,刚好可以克服前两种途径的缺点。主要研究内容木文研究的核心是通过多尺度数据挖掘的第三种途挽,提出丼实现基于加权14景提升的多尺度聚类数据挖掘算法。算法酋先对选定的基准尺度进行聚类挖掘,再通过加权向量提介的尺度转换方法获取其它尺度上的聚类结果,因此木文的主要研究内容为:D基于加权句量提升的多尺度聚类挖掘算法2)葙准尺度的选取准则3)加权

6、昀景提升的权重的确定万法4)多尺度聚类挖掘结果的评估目前已完成情况4.1.基于加权向量提升的多尺度聚类挖掘算法choosetheBasicScaleof0,BS0obtainclustersof0onthescaleBS0fortheotherscaleSof0,whichisnottheBasicScaleifS<0BS0thenSD(BS0—S)inverseclustersof0onscaleSifS>0BS0thenSU(BS0->tS)inverseclustersof0onscaleSexitwhentherei

7、snoanyscale基准尺度的选取准则1)距离设人准则基准尺度选择时,若所选择的基准尺度使得在所有目标尺度上聚类结果的距离和达到最大,则该某准尺度就是最佳的基准尺度,定义两基准尺度聚类结果作为神经网络输入端,R标尺度聚类结果作为祌经网络输出端,來构建反向传输的两层神经网络来学4加权向量提升中的权重。定义两个基准尺度间的距离度量:sie^BSi其屮f足基准尺度在各个目称尺度上的聚类结果。2)能量最大差异准则对于L个类别,当其屮其有相M的均值或者均值很接近时,其特征向量的平方和即能量便提供Y—种分类信息:若不同类别的特征向fi

8、之间的能S相差越大,则类别的可分性就真好。因此定义如下的能M差异函数,选取某一基准尺度使得以其为参数的能量差异最大,这一基准尺度便足最侏的基准尺度:△£(叫,哗S

9、/(^)2-/fe)2siensrsj^BSi-其中f是葙准尺度在各个目标尺度上的能s。3)相关系数最小准则若所选择的基

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。