欢迎来到天天文库
浏览记录
ID:33103153
大小:3.03 MB
页数:77页
时间:2019-02-20
《基于用户访问矩阵的网页推荐模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、江苏大学硕士学位论文基于用户访问矩阵的网页推荐模型研究姓名:李柯申请学位级别:硕士专业:计算机应用技术指导教师:许晓东20100611江苏大学硕士学位论文摘要Web挖掘是将传统数据挖掘与Web结合起来的技术,其中Web使用挖掘的挖掘对象是用户和网络交互过程中抽取的Web日志数据。对这些数据挖掘可以帮助理解用户的行为,从而改进站点的结构,或为来访者提供网页推荐服务。当前基于使用挖掘的推荐模型中,通过关联规则来预测用户浏览模式在网页推荐领域引起了很多关注,但许多关联规则算法本身存在的缺陷,再加上预测的结果和用户实际浏览行为之间的匹配率较低,推荐算法执行结果必然难以让用户满意
2、。因此本文的工作主要围绕以上存在的问题展开,主要分为以下几个方面。首先,Web日志数据预处理。本文将粗糙集理论中属性信息量的概念引入到预处理阶段,给出了属性重要性量化值的概念,提出了一种基于属性重要性的数据预处理方式,该方法有效地剔除了噪音数据,从而为后期处理提供了规模更小的数据集,减小了日志数据挖掘的复杂度。接着,本文对可重复连续频繁访问路径挖掘算法进行了研究。首先介绍了最具代表性的两种频繁访问路径挖掘算法,接着文章对可重复连续频繁访问路径挖掘算法进行了详细地分析,提出了一种CA.Mining算法,并通过实验验证了该算法的有效性和正确性。最后在第五章网页推荐部分,采用
3、CA.Mining算法进行可重复连续频繁访问路径的挖掘。其次,分析了矩阵聚类的方法。文章在宋擒豹等学者提出的矩阵聚类的基础上进行了改进,将页面访问顺序引入到向量相似性计算中来,给出了一种改进的向量相似性计算方法,提高了矩阵聚类的精度。最后,对网页推荐模型进行了探讨。在分析当前网页推荐领域常用方法的基础上,本文将CA.Mining算法与矩阵聚类方法相结合,给出了一种改进的网页推荐模型,由于在实际访问过程中,重复浏览页面是很普遍的现象,所以再挖掘频繁访问模式时,我们采用CA.Mining算法。实验表明,该推荐模型有效提高了推荐的准确率和覆盖率。关键词:Web挖掘,日志数据预
4、处理,CA-Mining算法,矩阵聚类,网页推荐模型江苏大学硕士学位论文ALBSTRACTTheWebminingisakindoftechniquewhichcombiningtraditionaldataminingandWeb.ObjectoftheWebusageminingistheWeblogdatafromtheprocesswhichtheuserusetheInternet.Byminingthesedata,itcanhelpUSunderstandthebehaviorofuser,thusimprovethestructureofWebsites
5、orprovidetheWebpagerecommendationtothevisitors.NowInthefieldoftherecommendationmodelbasedonWebusagemining,bytheassociationrulestopredicttheuseraccesspatternshaveattractedmuchattention,butmanyassociationrulesalgorithmshavesomedrawbackSOthatithaslowefficiency,plusithaslowmatchratebetweenpr
6、edictableresultanduseractualaccessbehavior,therefore,visitorcouldbedissatisfiedwiththerunresultofrecommendationalgorithm.Thepaperworkisaroundtheissueexistedabove,itmainlyincludesseveralaspects.Firstly,Weblogsdatapreprocessing.TheinformationofattributefromtheroughsettheoryWasappliedtothep
7、haseofdatapreprocessing,theconceptofquantifyvalueofimportanceofpropertywasproposed,anewdatapreprocessedmethodbasedonimportanceofpropertyWasproposed.ThemethodcouldfilteroutthenoiseandredundantpageSOastoprovidesmaller-scaledatasetsforthelateprocessing.ItCanreducethecomplexi
此文档下载收益归作者所有