基于组合条件的web信息搜索方法

基于组合条件的web信息搜索方法

ID:35069211

大小:3.39 MB

页数:53页

时间:2019-03-17

基于组合条件的web信息搜索方法_第1页
基于组合条件的web信息搜索方法_第2页
基于组合条件的web信息搜索方法_第3页
基于组合条件的web信息搜索方法_第4页
基于组合条件的web信息搜索方法_第5页
资源描述:

《基于组合条件的web信息搜索方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、■II中图分类号TP391论文编号1006016-0315学科分类号520.4050密级*^資义涛嗦乂掌TIANJINUNIVERSITYOFTECHNOLOGY硕±学位论支耐巧巧巧冊擺巧gy基于组合条件的Web信息拨索方法WebInformationSearchMethodBasedon-MultiCondition。li.毒BF^tWH路因巧IBIm^xmB■BgygjjiEin雷鹏飞胃-号》.i^-7^

2、;E^MSSn巧坤高级工程师pH天津理工大学研究生院二〇-六年H月分类号:TP391520.4050密级:天津理工大学研究生学位论文基于组合条件的Web信息搜索方法(申请硕士学位)学科专业:软件工程研究方向:Web搜索作者姓名:雷鹏飞指导教师:李玉坤2016年3月ThesisSubmittedtoTianjinUniversityofTechnologyfortheMaster’sDegreeWebInformationSearchMethodBasedonMulti-ConditionByPen

3、g-feiLeiSupervisorYu-kunLiMarch,2016淋准1牲若巧本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加yA标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得义津理工大学或一其他教育化构的学位或证书而使用过的材料。与我同工作的同志对本研巧所做的任何贡献均已在论文中作了明确的说明并表示了谢意。/3(1^学住备丈作者签名;^1^签李口期;>4年令月^可学化4^^文肤权使巧援权韦本学位论文作者完

4、全了解天津理工大学有关保留、使用学位论文的规定。特授权义津理工大学可W将学位论文的全部或部分内容编入有关数据库进行检索,,并采用影印、缩印或扫描等复制手段保存、汇编供查阅和借阅。。同意学校向国家有关部口或机构送交论文的复本和电子文件(保密的学位论文在解密后适用本授权说明)学位冷文作者签名;/^的导巧签名:签李9期:年3月可签李。期;年导月ya摘要随着互联网技术的迅猛发展,Web信息呈现了爆发式的增长。面对海量的Web信息,用户主动获取信息的方式通常为提交关键词句到搜索引擎,从搜索引擎

5、返回的网页集合中获取信息。这种方式通常可以满足当搜索词句较为简单(仅包含关键字或短语)时的搜索需求。然而当搜索请求包含多个条件以及复杂的语法时搜索引擎所返回的结果常常是不准确和不全面的。其原因除了用户对搜索引擎的使用不熟练,无法准确的描述其所需要搜索获得的信息外,还包含(1)部分搜索语句包含了多个修饰条件,搜索引擎无法准确解析用户的真正查询意图;(2)用户的搜索目标需要从多个网页中综合分析才可以得到最终结果,而目前搜索引擎返回的搜索结果是单个网页的集合。此外,当用户提交的搜索语句包含多个搜索条件时,其期望搜索结果往

6、往是一个实体集合,而现阶段,用户为了得到该实体集合,通常的做法是逐页浏览,并分析判断某个实体是否符合搜索条件,浪费了大量的时间和精力。针对以上问题,本文提出了解决方案。本文主要贡献如下:(1)研究了基于组合条件Web搜索语句和搜索结果中实体之间的上下位关系,对组合条件搜索语句中的各个要素进行了分析、总结、抽象。定义了基于组合条件Web搜索语句的概念模型,对基于组合条件的Web搜索语句的语义进行了结构化描述,并对搜索过程和结果集进行了阐释。(2)提出了基于组合条件Web搜索策略:将组合条件Web搜索语句分割为一个中心

7、语和多个修饰语,利用分割后的中心语和修饰语将搜索语句重写为多个子搜索语句。基于重写后的子搜索语句,利用搜索引擎找到子搜索语句对应的网页。研究并归纳了网页中实体的存在形式,以此为依据,从页面中初步提取实体并获取实体的百科页面,从中定位实体的属性。根据修饰语,中心语,结合每个实体对应的百科页面,对实体进行筛选,过滤,得到最终的搜索结果(实体集合)。(3)基于所提出的基于组合条件Web搜索策略实现了原型系统。由于没有发现相关的数据集,本文分别基于中文和英文创建了测试数据集,根据数据集对原型系统进行了功能测试和性能测试,证

8、明了所提出方法的有效性。关键词:Web搜索中心语修饰语实体AbstractWiththerapiddevelopmentofInternettechnology,Webinformationhasgrownexplosively.FacingwithmassiveamountsofWebinformation,thewaythatusersacquiring

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。