WEB日志和子空间聚类挖掘算法研究

WEB日志和子空间聚类挖掘算法研究

ID:36431762

大小:3.80 MB

页数:109页

时间:2019-05-10

WEB日志和子空间聚类挖掘算法研究_第1页
WEB日志和子空间聚类挖掘算法研究_第2页
WEB日志和子空间聚类挖掘算法研究_第3页
WEB日志和子空间聚类挖掘算法研究_第4页
WEB日志和子空间聚类挖掘算法研究_第5页
资源描述:

《WEB日志和子空间聚类挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、华中科技大学博士学位论文WEB日志和子空间聚类挖掘算法研究姓名:胡蓉申请学位级别:博士专业:计算机软件与理论指导教师:卢炎生20080601华中科技大学博士学位论文查询的结果,增加结果集的可控性,提高用户的决策效率。在分析高维数据空间的子空间Skyline查询存在的困难的基础上,设计一种新颖而紧凑的结构—子空间Skyline簇,通过在Skyline查询中引入聚类算法,巧妙地结合子空间Skyline查询的优点和聚类技术各自的优点。在一般的Skyline查询算法中有几点要求,即渐进性、正确性、高效性、公正性、用户友好性和可扩展性。基于排序的子空间Skyl

2、ine聚类算法SSSCM和基于阈值的子空间Skyline聚类算法TSSCM利用最近邻居点以及排序对Skyline查询的作用,并且受到top-k查询算法的启发,满足Skyline查询的这几点要求。在两个真实数据集和两个模拟数据集上进行实验,结果表明这两种算法能够高效地返回结果,TSSCM算法的性能更优。关键词:WEB日志挖掘,查询词翻译,子空间聚类,样式相似性,Skyline查询,子空间Skyline簇II华中科技大学博士学位论文AbstractDataminingistoidentifyvalid,novel,potentiallyusefuland

3、ultimatelyunderstandablepatternsindata.Withtherapiddevelopmentofinformationtechnologies,datagainedfrommanyfieldsaregrowingexponentiallyeveryday.Especially,largescaleandcomplexdataaregeneratedinmanyapplications,suchaswebapplications,naturalscience,andelectronicbusinessetc.Howtoh

4、elpusersextractknowlegefromthesedataeffectivelyisanurgentproblemthatshouldbesolved.Thus,ithasveryimportanttheoreticalandpracticalsignificancetoconsidertheneedofapplicationsandthedatacharacteristicsofdifferentfieldstodesigneffectiveminingalgorithmsforsuchlargescaleandhighdimensi

5、onaldata.Fortheproblemofminingtranslationsofwebqueriesfromwebclick-throughdata,theframeworkMTQCleveragesweblogsasaneffectivecorpustominewebquerytranslations.Basedontheanalysisofweblogswhicharecollectedfromtheinteractioninformationbetweenwebusersandsearchengines,MTQCfullyleverag

6、esthebilingualURLpairsandqueriesrelatedtotheseURLs.Itisatwo-stepminingprocess.First,itidentifiesbilingualURLpairs,thenitmatchesquerytranslationpairs.TwoalgorithmsnamedMTQC-1andMTQC-2arebasedontheframework.Theythushavemanygoodproperties,suchasrequirenocrawlingorwordssegmentation

7、,cancapturepopulartranslations,canextractsemanticallyrelevanttranslationstoimproveCross-LingualInformationRetrieval.Theexperimentsconductedinthelargescaleandrealclick-throughdatashowthatcomparedtothestate-of-the-arttranslationalogirthms,theproposedalgorithmsareeffectiveintransl

8、atingoutofvocabularyqueriesandpopularqueries.Forthepro

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。