面向领域的deep web查询接口发现与元数据信息抽取研究

面向领域的deep web查询接口发现与元数据信息抽取研究

ID:35102332

大小:2.45 MB

页数:60页

时间:2019-03-17

面向领域的deep web查询接口发现与元数据信息抽取研究_第1页
面向领域的deep web查询接口发现与元数据信息抽取研究_第2页
面向领域的deep web查询接口发现与元数据信息抽取研究_第3页
面向领域的deep web查询接口发现与元数据信息抽取研究_第4页
面向领域的deep web查询接口发现与元数据信息抽取研究_第5页
资源描述:

《面向领域的deep web查询接口发现与元数据信息抽取研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、暨南大学硕士学位论文题名(中英对照):面向领域的DeepWeb查询接口发现与元数据信息抽取研究Discoveryofqueryinterfacesandextractionofmetadatainformationonthedomain-orientedDeepWeb作者姓名:项江指导教师姓名及学位、职称:刘波硕士教授学科、专业名称:软件工程学位类型:专业学位论文提交日期:2016年4月20日论文答辩日期:2016年6月4日答辩委员会主席:论文评阅人:学位授予单位和日期:独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。

2、除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得暨南大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:签字日期:年月日学位论文版权使用授权书本学位论文作者完全了解暨南大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权暨南大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解

3、密后适用本授权书)学位论文作者签名:导师签名:签字日期:年月日签字日期:年月日学位论文作者毕业后去向:工作单位:电话:通讯地址:邮编:摘要在互联网中,大量的信息隐藏在深处而导致普通搜索引擎不能直接搜索到,然而绝大部分这些搜索引擎无法搜索到的信息正是我们需要的重要内容。这些在互联网上存储在网络数据库里,用户却无法通过超链接的形式访问的资源被称为DeepWeb数据。为了获得这些深层网的信息,需要通过它们的查询接口提交查询,建立一个DeepWeb信息集成系统,查询接口的发现﹑分类和构建元数据库等是首要任务。但是,深度网中的信息存储在不同的Web数据库里,并且随

4、时都在进行动态变化,相应的查询接口也经常变化着,对元信息的获取产生了巨大的困难。作为集成框架的基础,如何正确、有效的进行DeepWeb查询接口的发现、元数据信息抽取显得尤为重要。针对上面的主要问题,本文研究的重点内容在于:(1)对DeepWeb查询接口的发现进行研究,本文提出了基于规则的方法,通过爬取相关URL获得相应信息源的查询接口所在的网页,定位该网页中查询接口所在的位置,并获取该信息源的接口信息进行存储。(2)对DeepWeb源信息的抽取进行研究,本文主要采用了基于视觉特征和自定义规则的方法,来获取到源查询接口中的属性信息,并将这些信息存储在元信息

5、库中。(3)对获取到的DeepWeb源信息进行管理,主要采用表格方式存储数据,为系统集成和结果处理提供便利。(4)通过多线程的技术初步解决了多个信息源元数据更新的效率问题。本文最后对DeepWeb元数据信息的抽取结果进行了实验验证。实验结果表明所使用的发现、抽取方法具有可行性和较好的性能,所获取的结果适用于DeepWeb系统集成以及查询结果处理。同时,查询接口元信息的管理模块具有一定的可扩展性,为DeepWeb集成系统的设计打下较好的基础。关键词:DeepWeb;查询接口发现;元数据信息抽取;集成IABSTRACTOntheInternet,becaus

6、eagreatdealofinformationishiddeninthedepths,theordinarysearchenginescannotreturnthemdirectly.Butmostofinformationthattheordinarysearchenginescannotsearchisimportant.TheseresourcesstoredintheInternetdatabase,whichwecannotaccessthroughhyperlinksiscalledDeepWebdata.Toobtaindeepwebin

7、formation,itisnecessarytosubmitthequerybythequeryinterface,andestablishaDeepWebinformationintegrationsystem.ThediscoveryofQueryinterfaces,classificationandconstructionofmetadatabaseistheprimarytask.However,thedeepwebinformationstoredindifferentdatabasesandchangesdynamically,andth

8、ecorrespondingqueryinterfacesarealsochan

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。