基于web使用挖掘自适应网站的研究

基于web使用挖掘自适应网站的研究

ID:33411405

大小:510.52 KB

页数:78页

时间:2019-02-25

基于web使用挖掘自适应网站的研究_第1页
基于web使用挖掘自适应网站的研究_第2页
基于web使用挖掘自适应网站的研究_第3页
基于web使用挖掘自适应网站的研究_第4页
基于web使用挖掘自适应网站的研究_第5页
资源描述:

《基于web使用挖掘自适应网站的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、华东交通大学硕士学位论文基于Web使用挖掘自适应网站的研究姓名:刘邦桂申请学位级别:硕士专业:计算机应用技术指导教师:李正凡20080418独创性声明本人郑重声明:所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表和撰写的研究成果,也不包含为获得华东交通大学或其他教育机构的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。本人签名_______________日期____________关于论文使用授权的说明本人完全了解华东交

2、通大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅。学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。保密的论文在解密后遵守此规定,本论文无保密内容。本人签名____________导师签名__________日期___________第一章绪论第一章绪论1.1引言Web是一个动态性极强的信息源。Web不仅以极快的速度增长,而且其信息还在不断发生着更新。新闻、股票市场、公司广告和Web服务中心都在不断更新各自的页面。链接信息和访问记录也在频繁地更新之中。Web面对的是一个广泛的、形形色色的用户群体。目前,

3、我国Web用户群仍在不断扩张中,各个用户具有不同的背景、兴趣和使用目的。大部分用户并不了解信息网络结构,不清楚搜索的高昂代价,极容易在“黑暗”的网络中迷失方向,也极容易在“跳跃式”访问中烦乱不已,或者在等待一段信息中失去耐心。Web上的信息对用户而言,只有很小的一部分是相关的或有用的。据说99%的Web信息对于99%的用户是无用的。虽然这看起来不是很明显,但一个人只是关心Web上非常小的一部分信息确是事实,Web所包含的其余信息对用户来说是不感兴趣的,而且会淹没所希望得到的搜索结果。Web页面的复杂性远比任何传统的文本文档复杂得多。Web页面缺乏统一的结构,它包含了远比

4、任何一组书籍或其它文本文档多得多的风格和内容。Web可以看作是一个巨大的数字图书馆,然而,这一图书馆中的大量文档并不根据任何有关排列次序加以组织。它没有分类索引,更没有建立按标题、作者、封面页、目次等索引。在这样一个“图书馆”中搜索希望得到信息是极具挑战性的。这些挑战推动了如何高效且实际地发现和利用因特网上资源的研究工作。因此,基于Web使用挖掘自适应网站的研究也就成为数据挖掘领域一个新的研究方向。1.2自适应网站研究概述1.2.1自适应与可适应(1)自适应的定义自适应网站是Web数据挖掘不断发展出现的一个新概念。自适应网站能够根据对网站的用户访问模式的学习,自动调整网

5、站结构和表现形式,从而以用户最喜好的方式表现网站。目前这方面的网站比较少,http://www.amazon.com就是一个例子。(2)可适应的定义可适应是在客户端,通过用户对网页的操作,然后在服务器端保存用户对网页的操作,下次访问的时候就是用户修改后的网页。当然一般可适应是针对注册用户来说的,比如,搜狐的博客就是一个典型的可适应网站例子,http://goodluckpig.blog.sohu.com。1第一章绪论可适应前图1-1没调整前的界面Fig1-1HomepageBeforeAdjusting可适应后图1-2调整保存的页面Fig1-2HomepageVisit

6、edbyRegistedUser2第一章绪论(3)自适应和可适应的区别两者都是为了让网页按照用户喜好的方式显示出来,但是它们的区别是明显的:1)自适应网站可以有注册和非注册用户,只不过是对注册用户来说,用户的识别要简单容易,非注册用户需要通过结合用户访问日志和网站的拓补结构来确定;可适应网站一般来说是针对注册用户来设计的,比如说上面的例子。2)自适应网站的建立,要用到用户的访问日志,然后对日志进行挖掘;可适应网站只要在设计网页的时候使用特定的控件就可以了,比如用ASP.NET设计的时候就有专门的这种控件。3)早期的一些自适应系统需要一些用户的交互,比如:提交一些自己感兴

7、趣的内容,系统再给用户推荐,达到自适应的目的,随着研究的不断深入,目前通过学习用户所浏览的网页,就能够实现自适应的目的,而大大减少了用户在访问的时候提交信息;可适应一定要用户和网页进行交互。1.2.2自适应网站研究的现状以及主要进展基于Web数据挖掘的自适应网站研究主要包括两个分支:一是基于用户访问模式的研究,在用户访问记录基础上发掘用户访问模式进而向用户推荐兴趣页面实现自适应目的;另外一个是Web内容挖掘的自适应网站研究,主要根据页面的结构和链接信息寻找相似页面,增加或者减少链接。WWW诞生以后,人工智能、信息检索、数据库等不同领域的研

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。