基于web数据挖掘的网站个性化服务研究

基于web数据挖掘的网站个性化服务研究

ID:33164912

大小:1.27 MB

页数:53页

时间:2019-02-21

基于web数据挖掘的网站个性化服务研究_第1页
基于web数据挖掘的网站个性化服务研究_第2页
基于web数据挖掘的网站个性化服务研究_第3页
基于web数据挖掘的网站个性化服务研究_第4页
基于web数据挖掘的网站个性化服务研究_第5页
资源描述:

《基于web数据挖掘的网站个性化服务研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、密级鬲』仑行箍史学硕士学位论文基于Web数据挖掘的网站个性化服务研究张国权导师姓名职称:至鲨垒到垒丝专业名称:一盐簋丝且垫盎研究方向:熬垫生垫盎垄超旦论文答辩日期:2壁垒2生三旦学位授予时间:2垒Q2生§旦答辩委员会主席:评阅人:二oo七年五月摘要随着Intemet的飞速发展。Web服务器上的网页数量正在呈指数地增长。Web已经成为人们获取各种信息服务的不可或缺的重要途径,然而Web海量的网页在为人们提供丰富的信息资源的同时,也向人们提出了如何快速准确地从中获得其所需信息的挑战。目前web服务主要采取的是被动的、单一的信息服务方式,站点向所有用户发布相同的信息,

2、然而,用户的需求是千差万别的,现有的信息服务系统主要存在以下几个缺陷:由于海量信息的存在,大量网页链接容易使浏览者在的复杂信息空间中迷失航向,即所谓“信息迷航”;网页中提供的绝大多数链接对于特定用户来说都是多余的,而潜在地为用户所感兴趣的内容往往隐藏在众多无用链接之中:信息服务提供的界面往往单一而呆板的,对所有用户都是同一种面孔;目前的信息服务对服务器来说,主要还是一种被动的信息提供方式,不能够主动感知用户需求,实现对浏览者的主动信息服务。个性化信息服务能够通过收集和分析用户信息来学习用户的兴趣和行为,从而实现信息主动推荐的目的,把Web服务由以网站为中心转变为

3、以用户为中心,把服务方式由‘一对多’转变为’一对一’,从而使网站能更好的为用户提供服务,针对用户个人特征并向其提供准确恰当信息的个性化信息服务技术正成为目前的一个研究热点。本文针对以上需求和现有个性化服务中存在的不足,提出一种基于遗传算法事务聚类的双窗口主动个性化推荐服务系统(PersonalizedActiveInformationServiceSystemBasedonGeneticAlgorithmsTransactionCluster,以下简称GA.PALS),该系统中用遗传算法实现事务聚类,克服了以往个性化推荐算法中聚类算法复杂度过高、对噪声数据敏感等

4、缺陷,通过实验表明,该算法在事务聚类效率上有较大的提高;在网页推荐系数的计算上,综合考虑影响推荐准确性的匹配因子和距离因子,提出一种基于双窗口匹配因子计算方法,解决了现有推荐算法中推荐因子单一、忽视访问页面顺序对推荐系数影响等问题。关键词数据挖掘;遗传算法:个性化服务;聚类;匹配因子;距离因子ⅡAbstractWiththerapiddevelopmentofInternet,thenumberofwebpagesonwebserversisgrowingexponentially.Webhasalreadybecomeanecessaryandimportan

5、twaybywhichpeopleobtainvariousinformation.Howeverwiththemuchofwebpagesprovidingabundantinformationresourcestopeople,italsobringanewchallengethathowtoacquireinformationneededfromwebquicklyandaccurately.Atpresent,theservicemethodadoptedbywebispassiveandsingle.Differentusersonthes8lnewe

6、bsiteobtainthesameinformation。buttheneedofusersisverydifferent.Theexistinginformationservicesystemmainlyexiststhefollowing1imitation:browsersmaybelostthemselvesinthecomplicatedinformationspacebecauseofexistenceofthebigquantityofwebpagesandthehyperlinksbetweenthem.ThisiScalled“getlost

7、ininformation'’.Thegreatnumberofhyperlinkwhichprovidedbywebpagesareuselessforparticularuserandtheusefulcontentisconcealedinnumeroususeless1inks.Theinterfacethattheinformationserversprovidesusuallysingleandboringandittakeonthesamefacetoa11.Currentinformationservicearestillakindofpassi

8、veinformatio

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。