deep+web搜索引擎的关键技术new

deep+web搜索引擎的关键技术new

ID:34401998

大小:1.85 MB

页数:54页

时间:2019-03-05

deep+web搜索引擎的关键技术new_第1页
deep+web搜索引擎的关键技术new_第2页
deep+web搜索引擎的关键技术new_第3页
deep+web搜索引擎的关键技术new_第4页
deep+web搜索引擎的关键技术new_第5页
资源描述:

《deep+web搜索引擎的关键技术new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、分类号:!竺密级:——单位代码:!!151一学号:竺!!!竺!竺97舍肥足学火警HefeiUniversityofTechnology硕士学位论文MASTERDISERTATIoNo论文题目:Deepweb搜索引擎的关键技术学位类别:兰堕!兰学科专业:(工程领域)作者姓名:导师姓名:完成时间:管理科学与工程藕军任明仑副教授2007年5月DeepWeb搜索引擎的关键技术摘要Web中包含着数量巨大、质量很高的信息,却不能被通用搜索引擎搜索。研究DeepWeb搜索引擎及其关键技术将有助于实现对DeepWeb自动搜索。首先介绍了通

2、用搜索引擎的一般原理。然后对DeepWeb进行概述,讨论了Web的定义及类型,定量地分析了DeepWeb的概况,并在此基础上给出了DeepWeb搜索引擎的完整框架及定义,同时指出它的四个关键技术:数据库自动发现、数据库自动选择、返回结果自动抽取、结果聚合。对这四个关键技术进行了详细的讨论:提出一种基于网络蜘蛛的数据库自动发现方法,实验结果表明该方法很有效;对数据库自动选择方法进行综述并设计了一种自动选择方法;提出一种高效的从查询返回结果页面上自动抽取结果的方法,实验结果表明该方法简单高效:将结果聚合分解为三个子问题并综述分

3、析。关键词:DeepWeb:数据库发现;数据库选择:Web信息拙取;结果聚合TheKeyTechniquesofDeepWebSearchEngineAbstractTherearegreatamountsofvaluableinformationintheDeepWeb,whichcan’tbesearchedbygeneralSearchEngines.ResearchonDeepWebSearchEngineanditskeytechniqueswillbeusefultorealizesearchingDeepWe

4、bautomatically.Firstly,introducethegeneralprincipleofgeneralSearchEngine.ThengivethesummaryofDeepWeb.DiscussthedefinitionandtypesofDeepWeb,andanalyzethesurveyofDeepWebquantificationally.Afterthat,designthemodelofDeepWebSearchEngineandgiveitsdefinition,andpointouti

5、ts4keytechniquesasautomaticallyDataBasesDiscovering,automaticallyDataBasesSelecting,automaticallySearchResultsExtracting,andResultsAggregation.Thendiscussthese4keytechniquesindetail.PresentanewmethodfordiscoveringdatabaseinthenetbasedonWebSpider,andexperimentsshow

6、thatthismethodiseffective.SummarizedifferentmethodsforDataBaseSelecting,andbasedonthese,designanewmethodtoselectdatabasesautomatically.PresentanewmethodforautomaticallyextractingSearchResultRecords,andexperimentsshowthatthismethodissimpleandefficient.Analyzetheque

7、stionofResultsAggregationinto3childquestions,thendiscussthem,andgivethesummaryofthem.Keywords:DeepWeb;DataBasesDiscovering;DataBasesSelecting;’WebInformationExtraction;ResultsAggregationII图2-1图3-1倒4-1表4-l图6一l图6-2图6-3图¨圈∞搜索引擎结构图⋯⋯.图表清单DeepWeb搜索引擎框架图SDB搜索界面⋯⋯⋯⋯⋯⋯⋯⋯⋯

8、⋯⋯⋯⋯⋯⋯.实验数据SR鼬⋯⋯⋯⋯⋯⋯⋯。SRPLs⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.标签张⋯⋯⋯⋯⋯⋯⋯⋯..SRRs抽取试验结果图SRPLs抽取试验结果图⋯⋯⋯⋯。VI...4⋯⋯⋯⋯⋯⋯⋯ll⋯⋯⋯⋯⋯⋯⋯.14.17”⋯⋯⋯⋯⋯⋯⋯⋯⋯27⋯⋯⋯...⋯⋯..⋯⋯.⋯..⋯30⋯⋯⋯⋯⋯33独创性声明本

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。