在深度链接中查询结构化数据

在深度链接中查询结构化数据

ID:43506136

大小:3.98 MB

页数:40页

时间:2019-10-09

在深度链接中查询结构化数据_第1页
在深度链接中查询结构化数据_第2页
在深度链接中查询结构化数据_第3页
在深度链接中查询结构化数据_第4页
在深度链接中查询结构化数据_第5页
资源描述:

《在深度链接中查询结构化数据》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、DeepWebIntegration:Querying StructuredDataontheDeepWebFangjiaoJiang1OutlineBackgroundAccessDeepWebMetaQuerierMetasearchenginevs.MetaQuerierRelatedresearchgroupsConclusion…Somesuggestions2BackgroundPart13ThepreviousWeb: thingsarejustonthesurface4ThecurrentWeb:Getting“deeper”Agreatnumb

2、erofdataishiddenbehindqueryforms5TheProblemforaccessdatafromDeepWebDeep=notaccessiblethroughtraditionalsearchengines????6Whyisitimportant?Morethan10milliondistinctforms7Whyisitimportant?Upto5,000billionsdynamicresultpages8Whyisitimportant? ——Google’sRecentSurvey[CIDR2007]Ifthereare1b

3、illionwebpages25millionpotentialDeepWebsources9Challenge:HowtoenableeffectiveaccesstotheDeepWeb?Cars.com10AccesstheDeepWebPart211ThreedifferentmannersWarehouse-likeapproachMetaQuerierSurfacingtheDeepWebWebDatabaseWebDatabaseWebDatabase…RepositoryQUERYWebdatabasesIntegratedqueryinterf

4、ace1)Pre-computeappropriatequeriersovertheforms2)Inserttheresultingpagesintoaweb-searchindex12(1)Warehouse-likeapproach中文期刊全文数据库国家自然基金信息库……WebDatabaseWebDatabaseWebDatabaseWebDatabaseWebDatabase…PDFPSDOCJournalHomepageAuhtorHomepageConf.Homepage13(2)MetaQuerierDatabaseCrawlerMetaQuer

5、ierInterfaceExtractionSourceClusteringinterfaceintegrationTheDeepWebBack-end:SemanticsDiscoveryFront-end:QueryExecutionQueryTranslationSourceSelectionSchemamatchingResultprocessingDeepWebRepositoryUnifiedInterfacesSubjectDomainsQueryCapabilitiesQueryInterfacesQueryWebdatabasesFindWeb

6、databasesMetaQuerieriswhatwefocuson.14(3)SurfacingtheDeepWeb[VLDB’08]ViewpointManydomainsandmanylanguagesNohumanintheloop,nosite-specificscriptsMainideapredictinginputvaluesfortextboxespredictinginputcombinationsGoogle’sDeep-WebcrawlingsystemAffectsmorethan1000queriespersecondEnables

7、accesstomorethanamillionDeep-WebsitesSpans50+languagesand100+domains15MetaQuerierPart316ASurveyonDeepWeb[SIGMOD2006]Howmanydeep-Websourcesareoutthere?307,000sites,450,000DBs,1,258,000interfaces.HowstructuredinDeepWeb?348,000(structured):102,000(text)==3:1Howdosearchenginescoverthem?c

8、overed10%sou

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。