Web数据挖掘在个性化搜索技术上的分析

Web数据挖掘在个性化搜索技术上的分析

ID:39111495

大小:1.96 MB

页数:46页

时间:2019-06-25

Web数据挖掘在个性化搜索技术上的分析_第1页
Web数据挖掘在个性化搜索技术上的分析_第2页
Web数据挖掘在个性化搜索技术上的分析_第3页
Web数据挖掘在个性化搜索技术上的分析_第4页
Web数据挖掘在个性化搜索技术上的分析_第5页
资源描述:

《Web数据挖掘在个性化搜索技术上的分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、大连交通大学学位论文独创性l声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢及参考文献的地方外,论文中不包含他人或集体已经发表或撰写过的研究成果,也不包含为获得太整塞通太堂或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。本人完全意识到本声明的法律效力,申请学位论文与资料若有不实之处,由本人承担一切相关责任。学位论文作者签名:王f1『3日期:∥驴7f年p月厂垆日大连交通大学学位论文版权使用授权书本学位论文作

2、者完全了解太董塞通太堂有关保护知识产权及保留、使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属太整塞通太堂,本人保证毕业离校后,发表或使用论文工作成果时署名单位仍然为太整塞通太堂。学校有权保留并向国家有关部门或机构送交论文的复印件及其电子文档,允许论文被查阅和借阅。本人授权太整塞通太堂可以将学位论文的全部或部分内容编入中国科学技术信息研究所《中国学位论文全文数据库》等相关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论、叉。(保密的学位论文在解密后应遵守此规定)学位论文作者签名:王丽日期:∥一年p月,

3、'够日学位论文作者毕业后去向:工作单位:通讯地址:电子信箱:导师签名:\殇.雾趣日期:加97年,z月一日电话:邮编:绪论绪论1课题研究背景计算机技术和网络技术的发展与普及,为人们自由获取全球范围内的信息提供了条件,但同时也导致网上信息的爆炸式增长。因特网从产生至今不过20多年的时间,但目前因特网上的信息量相当于人类过去100年产生的信息总量。由于网上信息浩繁纷杂,良莠不齐,信息的价值正在被创造海量信息的网络所削减。搜索引擎的出现暂时缓解了这一矛盾。当前人们主要是借助搜索引擎来进行信息查找和定位,它通过自动浏览程序对Web站点进行自动搜索,对

4、文档信息进行分类索引建立索引数据库,然后再根据用户提交的关键词来检索,将匹配站点的URL返回给用户,用户再选择链接,完成信息的搜索过程。据中国互联网络信息中一I)(CNNIC)2003年1月发布的中国互联网络发展状况统计报告统计,国内用户最常使用的网络服务依次为:电子邮箱(92.6%)、搜索引擎(68.3%)、网上聊天(聊天室、ICQ、QQ等45.4%)、软件上传或下载服务(43.9%)、各类信息查询(42.2%)等。可见,搜索引擎在我国已成为Internet的第二大网络应用,它在定位网络资源、搜索Internet信息的功能越发突出。伴随着

5、信息媒体层出不穷以及当前用户需要不”断提高,单单依靠传统搜索引擎已经无法满足人们的需求,传统搜索引擎缺乏个性化的局限性日益突出,具体表现在:(1)网络信息覆盖面广,形式各异,而传统搜索引擎对所有用户提供相同的界面和服务,并且检索的结果成千上万、良莠不齐,用户为找到真正感兴趣的信息,往往要耗费大量的时间和精力。(2)人们由于年龄、性别、职业、学历、爱好等不同,各自感兴趣的领域也随之不同,各自对词义的理解也不尽相同,不同的用户对同一检索请求得到的检索结果常常有不同的评价,而目前传统搜索引擎不能体现用户的信息需求个性,即传统搜索引擎提供的服务是“

6、面向检索",而不是“面向用户"的。(3)用户在不同时期或阶段对同一检索请求,所得到的仍是完全相同的检索结果,对用户不具有自适应能力。(4)用户使用搜索引擎时带有一定的目的性,但由于领域知识的不足和搜索引擎的查询接口的局限性而无法明确表达自己的搜索意图I¨。造成上述信息检索困难的实质在于传统搜索引擎对于所要检索的信息仅仅采用机械的关键词匹配,不是从用户输入关键词的语义、语境上的匹配,不能对关键词进行词人连交通人,≯I:学硕十学位论文意分析和词意扩展,缺乏知识处理能力和理解能力,也就是浼搜索引擎无法处理在用户看来是非常普通的常识性知识,更不能处

7、理随用户不同而变化的个性化知识,随地域不同而变化的区域性知识以及随领域不同而变化的专业性知识等。因此,用户期盼更完美的搜索技术的出现。用户需要搜索服务提供者研制更优秀的搜索技术,以满足更快、更准、更方便的查询需要。为此,作为第三代搜索引擎的个性化搜索引擎的研究及其实现成为必然。在当前主流的搜索引擎和未来一代搜索引擎的设计中,信息检索的个性化是下一代搜索引擎的重要特刎引。个性化搜索引擎不仅可以提高搜索引擎的检索效率,而且能提高搜索引擎相关参数以及实现结果的个性化。个性化搜索引擎作为个性化信息服务的组成部分,为更好地满足人们需求,首先需要建立对

8、用户的科学描述,然后才能针对不同的用户提供不同的个性化服务。作为个性化服务的基础和核心,用户模型的质量直接关系到个性化信息服务的质量。只有当用户的兴趣、偏好和访问模式可以很好地被

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。