基于CSCW的站内搜索引擎的应用研究

基于CSCW的站内搜索引擎的应用研究

ID:36820111

大小:4.99 MB

页数:60页

时间:2019-05-16

基于CSCW的站内搜索引擎的应用研究_第1页
基于CSCW的站内搜索引擎的应用研究_第2页
基于CSCW的站内搜索引擎的应用研究_第3页
基于CSCW的站内搜索引擎的应用研究_第4页
基于CSCW的站内搜索引擎的应用研究_第5页
资源描述:

《基于CSCW的站内搜索引擎的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要摘要在互联网蓬勃发展的过程中,为了帮助用户快速定位感兴趣的网络资源,出现了例如:Google、Baidu、Yahoo!等这些通用的搜索引擎网站。而随着现在网站提供的内容越来越丰富,如何有效地帮助用户查找需要的站内资源,以及把站内的资源推荐给用户,留住用户,提升用户回头率,减少用户流失机会成为各网站关心的问题。因此,站内搜索应运而生。目前的站内搜索主要有两种实现形式。一种是利用现成的传统互联网搜索引擎网站提供的站内搜索代码,以嵌入网页代码的方式保持与搜索引擎机器人的沟通引导其对网站内的信息进行爬取。这种方式虽然可以快速地低成本地部署,但是却不能及时、完整抓取网站最新页面内容

2、和不可以按照用户业务需要去排序、过滤和展示搜索结果。另一种方式就是建立自己的站内搜索引擎。这种方式有利于网站摆脱对专业搜索引擎网站的依赖。自己控制搜索更新时间,扩展功能,为用户提供及时的、高精度和高效率的站内搜索服务。其中利用CSCW技术来实现站内搜索引擎更能充分发挥站内搜索的优势。本文J下是研究如何有效地把CSCW技术应用到站内搜索引擎的实现上来。CSCW在本质上是一个分布式系统,它能够充分利用各个服务器上的资源,通力协作共同完成任务。目前使用多Agent技术来实现CSCW系统是比较常见和成熟的方式。本文提出的CSSS系统正是基于多Agent方式来实现的。在利用CSCW技术

3、提高站内搜索引擎更新率和服务响应速度的同时,本文还研究了个性化信息检索技术。通过建立用户兴趣模型来跟踪记录用户的浏览习惯,然后分析用户访问过的网页获取用户的兴趣特征,并把这些信息合并到用户的检索请求中,从而为用户提供更加准确的搜索服务。论文首先分析了当前搜索引擎技术的现状,探讨了CSCW的三要素和关键技术,研究了三种典型的搜索引擎模型、典型信息检索模型,针对现有的搜索引擎存在的精度低、效率差等问题,结合CSCW、用户个性化检索,提出了基于CSCW的站内信息搜索模型。在此基础上,论文对基于CSCW的信息搜索系统进行构架,该系统融入了层次化结构的设计思想,以基于消息原语的通信机制

4、为协同工作的基础,广东_y-,.1k大学硕士学位论文将基于CSCW的分布式信息搜索模型用于站内搜索引擎中,实现高效准确的信息搜索。关键词:CSCW;搜索引擎;搜索模型;个性化检索IIABSTRACTABSTRACTAsthecontinuouslydevelopmentoftheInternet,lotsofgeneralsearchenginesitesappear,suchas"Google,Baidu,Yahoo!andSOon,tohelpuserfindingtheusefulinformationinthisbigcyberworld.Ontheotherhand

5、,asthecontentofeverywebsiteincreasingquickly,howtohelpusersfindingthekinterestedcontentsandrecommendsitecontentstousers,keeptheusersandimprovetherevisitrateisbecomingaconcernedproblemtositesowners.Sothesite-searchengineappearances.Therearetwomainmethodsfortheimplementationofsitesearch.Oneis

6、usingthecodesuppliedbythosegeneralsearchenginesites,andaddingthemintotheirwebpagestoguidethecrawlerrobotstocollecttheirfreshestcontent.Inthisway,itcanbedeployedquicklyandsaveyoualotofmoney,buttherearealsosomedefectsthatyoucannotcontroltherobotstoworkasyouwantitto.Andyoucannotdealwiththesear

7、chresultsaccordingtoyouridea.Anothermethodistoestablishthesitesearchenginesbythemselves.Sothewebsitescancontroltheupdatescheduleandextendtheirservicetosupplytheuserswithnewestandhighprecisesitesearchservice.Infact,usingCSCWtechnologytoimplementthesitesea

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。