一种基于增量式时间序列和最佳任务调度的web数据聚类算法

一种基于增量式时间序列和最佳任务调度的web数据聚类算法

ID:31363467

大小:121.00 KB

页数:12页

时间:2019-01-09

一种基于增量式时间序列和最佳任务调度的web数据聚类算法_第1页
一种基于增量式时间序列和最佳任务调度的web数据聚类算法_第2页
一种基于增量式时间序列和最佳任务调度的web数据聚类算法_第3页
一种基于增量式时间序列和最佳任务调度的web数据聚类算法_第4页
一种基于增量式时间序列和最佳任务调度的web数据聚类算法_第5页
资源描述:

《一种基于增量式时间序列和最佳任务调度的web数据聚类算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、一种基于增量式时间序列和最佳任务调度的Web数据聚类算法  摘要:为了实现Web服务请求数据的快速聚类,并提高聚类的准确率,提出一种基于增量式时间序列和最佳任务调度的Web数据聚类算法。该算法进行了Web数据在时间序列上的聚类定义,并采用增量式时间序列聚类方法。先通过数据压缩形式降低Web数据的复杂性,再进行基于服务时间相似性的时间序列数据聚类;最后针对Web集群服务的最佳服务任务调度问题,通过以服务器执行能力为标准来分配服务任务。仿真实验结果表明,相比基于网格的高维数据层次聚类算法和基于增量学习的多目标模糊聚

2、类算法,该文的算法在聚类时间、聚类精度、服务执行成功率、聚类失真度上均获得了更好的性能。  关键词:Web数据聚类;增量式时间序列;数据压缩;最佳任务调度  中图分类号:TN911?34;TP393文献标识码:A文章编号:1004?373X(2016)14?0004?05  AWebdataclusteringalgorithmbasedonincrementaltimeseriesand  optimaltaskscheduling  CHENKe,KEWende,XUbo  (DepartmentofCom

3、puterScienceandTechnology,Guangdong12UniversityofPetrochemicalTechnology,Maoming525000,China)  Abstract:InordertoachievefastclusteringofWebservicerequestdataandimproveaccuracyoftheclustering,aWebdataclusteringalgorithmbasedonincrementaltimeseriesandoptimalta

4、skschedulingisproposedinthispaper.TheWebdataclusteringdefinitioninthetimesequenceandtimeseriesincrementalclusteringmethodareadoptedinthealgorithm.ThecomplexityofWebdataisreducedfirstindatacompressionform,andthenthetimeseriesdataclusteringbasedonservicetimesi

5、milarityisconducted.Finally,fortheproblemofthebestservicetaskschedulinginWebclusterservices,theexecutivecapacityoftheserveristakenasastandardtodispatchtheservicetasks.Thesimulationresultsshowthatincomparisonwithhigh?dimensionaldatagrid?basedhierarchicalclust

6、eringalgorithmandmulti?objectivefuzzyclusteringalgorithmbasedonincrementallearning,thealgorithmproposedinthispaperhasobtainedbetterresultsintheaspectsoftimeclustering,clusteringaccuracy,successrateofallserviceexecutionanddistortiondegree.  Keywords:Webdatacl

7、ustering;incrementaltimeseries;datacompression;optimaltaskscheduling  0引言12  随着互联网技术的发展,Web服务数量的增长速度不断加快,对于越来越多的Web服务请求,如何保障用户所需要响应速度以及查询准确度来说是个巨大的挑战[1?2]。网络系统在保障用户的Web服务请求时,通常采用数据挖掘的方法处理大规模的Web服务请求数据[3]。  聚类算法是数据挖掘领域的一个重要研究内容,通过多个作为聚类中心的数据样本与其他数据样本之间的相似性程度,

8、使数据样本向聚类中心靠拢,从而形成多个簇结构[4]。现有的经典聚类算法有K?means,QIDBSCAN,PAM,AP等聚类算法[5?8]。以上一些方法没有利用本体等技术从语义层次进行匹配计算来实现服务聚类,影响了服务聚类的准确性;另外一些方法在利用传统的聚类方法实施服务聚类时,计算服务间的相似度所耗时间比较长,影响了服务聚类的效率。综上,这些算法应用为搜索引擎时,存在着精确度不高、召

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。