欢迎来到天天文库
浏览记录
ID:32024310
大小:2.99 MB
页数:51页
时间:2019-01-30
《【硕士论文】农业搜索个性化平台的研究与设计.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、摘要摘要近年来随着垂直搜索引擎的出现和发展,一定程度上克服了传统搜索引擎的弱点。然而现在的垂直搜索引擎基本上还是基于单一关键字查询的方式,无法克服关键字查询方式带来的准确率和召回率低的问题。在农业领域里,垂直搜索引擎也存在同样的问题,在国家重大科技支撑项目子课题“基于本体的农业搜索引擎"(2006BADlOA0502)的支持下,本文针对农业搜索引擎构建了用户个性化平台。首先研究了个性化平台的重要基础之一,农业信息的的地理属性的添加,这是为实现个性化平台在构建索引文档时做的基础工作。文中的设计主要对农产品市场名称进行地理定位,采用了
2、基于地理信息库索引的市场名地理定位、基于搜索引擎搜索结果项的市场名地理定位、基于搜索引擎搜索结果数量的市场名地理定位三种方法逐步提高对市场名称的地理定位能力。然后本文研究了用户搜索个性化平台的构建方法,从服务器日志中挖掘用户兴趣信息,并基于本体对用户兴趣词汇进行语义扩展,形成用户兴趣模型,当用户检索相关信息时,应用用户兴趣模型对用户提交的关键词进行扩展,然后将扩展后的关键词提交给检索系统,按照相似度排序输出结果,这是在信息检索时所采取的步骤,从而实现个性化服务平台。本文首先介绍了关于搜索引擎和本体论方面的一些基本知识,接着分析了网
3、络上抓取的农产品市场名称的一些特征,根据市场名称特点构建了带有别名识别的多级地理信息库,然后基于构建的地理信息库索引对市场名进行地理定位:下一步分析了在互联网上市场名称和它所在的地名一起出现在搜索结果的同一网页中的可能性关系后,研究了一种基于搜索引擎搜索结果的市场名地理定位的方法;在上述方法无法定位时,基于皮尔逊卡方来评价市场名称和地名同时出现在一个网页上的关系,从而产生了基于搜索引擎搜索结果数量的市场名地理定位的方法。然后本文研究了用户兴趣库的的构建和更新方法,首先通过用户注册信息构建初始兴趣词库,然后通过挖掘服务器日志和计算兴
4、趣词的响应系数,来维护和更新用户兴趣库;接着研究了根据用户访问文档的具体信息计算关键词用户兴趣度的方法;进一步系统通过将用户兴趣库中的词基于本体进行语义扩展构成用户兴趣模型,并且利用模型中词汇的兴趣度来维护和更新用户兴趣模型。接着分析了利用用户兴趣模型扩展用户提交的搜索关键词的方法,利用已经建立的用户兴趣模型给使用搜索引擎的用户提供个性化服务。最后对本文进行了总结,并指出了需要进一步研究的一些问题。关键词:.个性化服务,垂直搜索引擎,市场名地理定位,本体,用户兴趣模型第一章绪论第一章绪论1.1选题背景及意义随着互联网的发展,网络上
5、资源急剧增加,人们从大量的信息中查找自己需要的的信息变得愈发困难,这种情况下促进搜索引擎技术的迅速发展。搜索引擎借鉴了信息检索领域的许多研究成果,结合互联网信息分布特点,逐步形成了一个独立的研究领域。而随着搜索引擎的发展,使其服务更加个性化变的越来越有意义。人类进入20世纪以来,科学技术以前所未有的高速度向前发展,大量研究成果的大量涌现,导致科技文献数量的急剧增长。传统的信息处理和检索方法已经不能满足人们的需求,科学研究的渠道出现了严重的障碍。这种现象人们称为“信息危机”或“信息爆炸"。因此信息检索作为一个专门的研究领域逐步进入许
6、多国家高等学校的计划中,与之相关的研发活动也越来越频繁。信息检索【2I(InformationRetrieval)是指信息按一定的方式组织和存储,并根据信息用户的需要找出有关的信息的过程和技术。20世纪60年代到80年代,在信息处理技术、计算机等技术的推动下,信息检索在教育、军事和商业等各领或高速发展,得到了广泛的应用。信息检索技术的飞速发展积累大量理论和技术上的研究成果,为搜索引擎的出现和飞速发展奠定了坚实的基础。现在搜索引擎中广泛使用的思想和技术,有很多都是借鉴信息检索技术的成果。从而搜索引擎也被认为是信息检索技术的一个重要分
7、支【3】。从形式上分,可以把搜索引擎分为目录式搜索引擎和基于关键字匹配的全文搜索引擎。一类称为分类目录【4】,这种“搜索弓I擎”并不采集网站的任何信息,而是利用各网站向“搜索引擎”提交网站信息时填写的关键词和网站描述等资料,经过人工审核编辑后,如果符合网站登录的条件,则输入数据库以供查询。Yahoo畴1是分类目录搜索的典型代表。另一类是纯技术型的全文检索搜索引擎,如google∞1等,其原理是通过Spider程序到各个网站收集、存储信息,并建立索引数据库供用户查询。传统的搜索引擎多属于横向的水平型搜索,在现有的技术水平基础上,它在
8、达到搜索信息量大而全的同时却难以兼顾搜索的准确度与相关度的检索质量。当横向的搜索引擎的弱点随着网络资源的增长越来越明显时,垂直搜索引擎出现在人们的视野。第一章绪论垂直搜索J’8一瑚1是指针对特定的领域或行业的内容进行专业和深入的分析挖掘、精细分类和
此文档下载收益归作者所有