基于粗糙集和模糊聚类的web日志增量式挖掘研究

基于粗糙集和模糊聚类的web日志增量式挖掘研究

ID:32974854

大小:3.27 MB

页数:58页

时间:2019-02-18

基于粗糙集和模糊聚类的web日志增量式挖掘研究_第1页
基于粗糙集和模糊聚类的web日志增量式挖掘研究_第2页
基于粗糙集和模糊聚类的web日志增量式挖掘研究_第3页
基于粗糙集和模糊聚类的web日志增量式挖掘研究_第4页
基于粗糙集和模糊聚类的web日志增量式挖掘研究_第5页
资源描述:

《基于粗糙集和模糊聚类的web日志增量式挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学位论文独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得亩昌盔堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名(手写):本矽鱼缸签字日期:1一f弓年e月;日学位论文版权使用授权书本学位论文作者完全了解直昌太堂有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权直昌太堂可以将学位论文的全部或

2、部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编本学位论文。同时授权中国科学技术信息研究所和中国学术期刊(光盘版)电子杂志社将本学位论文收录到《中国学位论文全文数据库》和《中国优秀博硕士学位论文全文数据库》中全文发表,并通过网络向社会公众提供信息服务。(保密的学位论文在解密后适用本授权书)学位论文作者签名(手写):杳矽托导师签名(手写):可土『)咚雩趴签字日期:乙a廖年6月5日签字日期:1。f;年6月箩日摘要目前随着互联网的蓬勃发展,尤其是电子商务的发展为越来越多的用户提供了Web服务。网民的选择增多,对网络服务的需求趋于理性和多样化,这为Web挖掘

3、的发展提供了现实基础。对客户的群体行为进行分析,以获取在用户行为中反映出来的用户兴趣。对用户兴趣进行分析,改进Web站点结构,在竞争中占据有利地位,成为众多Web服务供应商急需解决的问题。所谓W曲日志挖掘,是从存储在W

4、eb服务器中的日志数据中发现人们感兴趣的知识的过程。目前许多研究都集中在Web使用模式的挖掘上,旨在通过分析Web用户的行为模式,来发现用户的兴趣度,从而通过改进站点结构的方法来提高站点的吸引力。这种挖掘模式具有模糊性,传统的数学理论不足以完成这一任务,因此采用了模糊聚类和粗糙集的相关知识。本文将基于密度的DBSCAN算法与传统的SOFM网络相结合,提出了一种基

5、于SOFM网络的增量式聚类算法。SOFM网络的特点就是适用于高维数据的聚类、自组织学习和训练能力强等,非常适合用于W曲日志的挖掘。然而由于W曲站点的访问需要表现出用户的多兴趣,而且随着用户兴趣的漂移,理应对聚类结果做出相应的改变,这一点是传统的SOFM网络无法解决的。针对这些问题,把DBSCAN算法与SOFM网络相结合,DBSCAN算法的特点在于可以用于发现任何形状的簇,对聚类的变化敏感,因此随着数据集规模的增量变化,这种算法可以发现用户兴趣的漂移。通过大量的样本数据对改进后的SOFM网络进行训练,使得参数和权值趋于稳定,为网络应用阶段做好准备。在网络应用阶段,把各参数和输出神

6、经元的权值设置为训练之后的值,不再变化。对输入模式进行聚类,然后通过隶属函数更新输入模式的隶属度。对于大于隶属度阈值的神经元,进行输出。最后,本文设计了仿真实验。对某新闻网站的服务器日志数据进行了聚类,并进行了分析。这个模型与传统的聚类方法不同,具有增量式聚类的能力。首先用样本数据进行网络的训练,然后再对测试数据进行聚类。最后的实验结果从训练误差和聚类结果两方面进行了对比,实验结果表明本文所提出的算法在增量变化的数据集的聚类方面不管在效率还是准确性上都比传统的聚类算法优越,而且反映出了用户在Web访问上的多兴趣。关键词:Web挖掘;隶属度;SOFM网络;模糊聚类ABSTRACT

7、withthevigorousdevelopmentofIntemetatpresent,especiallytheprogressofeJec仃omccommerceprovidesWebserviceformoreandmorellSers.TheincreaSeofnetlzen78opnollsandtherationalanddiversifieddemandforwebservicelaythere砒1stlcbaslSforthedevelopmentofWebmining.Analyzingtheuser,sgroupben神10。toobraintheirin

8、terestsaswellasimprovingWebsites廿u咖rethrou商the锄【ly818ofuser'smtereststooccupytheadvantageouspositioninthecompefitionnaVebecometheurgentissuestobesettledfornumerousWebse州ceproviderS.WebJogmnllngISaprocessofexcavationofknowledgeinwhichDeopleareIntere

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。