欢迎来到天天文库
浏览记录
ID:32879052
大小:7.62 MB
页数:82页
时间:2019-02-17
《基于本体学习的deep web语义标注关键问题研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、苏州大学学位论文独创性声明本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含其他个人或集体已经发表或撰写过的研究成果,也不含为获得苏州大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。论文作者签名:挫堑:日期.-丝!三三耳一苏州大学学位论文使用授权声明本人完全了解苏州大学关于收集、保存和使用学位论文的规定,即:学位论文著作权归属苏州大学。本学位论文
2、电子文档的内容和纸质论文的内容相一致。苏州大学有权向国家图书馆、中国社科院文献信息情报中心<中国科学技术信息研究所(含万方数据电子出版社)、中国学术期刊(光盘版)电子杂志社送交本学位论文的复印件和电子文档,允许论文被查阅和借阅,可以采用影印、缩印或其他复制手段保存和汇编学位论文,可以将学位论文的全部或部分内容编入有关数据库进行检索。涉密论文口本学位论文属在——年一月解密后适用本规定。非涉密论文口论文作者签名:?赳查:月期:塑!兰:!:主Z导师签名:j陛日期:j蚪接十奉休学习的Deepw曲语义标渖关镪
3、皇问题IlJ堕摘要基于本体学习的DeepW.eb语义标注关键问题研究摘要随着互联网的快速发展以及w曲相关技术的不断成熟,Deepw扑目前已成为人们获取信息的重要来源,为了使用户可以快速、准确、方便地获取所需的DeepW曲资源,Deepw曲信息集成技术已经成为该领域研究的热点问题。DeepW曲结果语义标注是DeepW曲信息集成系统中的重要阶段,而DeepW曲查询接口模式的准确抽取又是语义标注的基础。因此,本文分别对Deepw曲查询接口模式抽取和语义标注进行了深入的研究,并将本体引入标注过程,在此基础上
4、设计并构建一个面向DeepW曲的搜索引擎原型系统。本文的主要研究工作如下:(1)对DeepWeb信息集成系统框架和DeepW曲语义标注国内外研究现状进行介绍,分析传统语义标注方法的缺点和不足。简要介绍本体的概念与作用以及本文所使用的DeepW曲领域本体的构建原则和学习方法。(2)提出一种基于分层模型的DeepW曲查询接口模式抽取方法,解决现有接口模式抽取方法中忽略查询接口内部结构与语义关系的问题。该方法首先挖掘查询接口元素的页面布局特征,使用基于扩展的层次聚类方法抽取接口模式树,其次利用控件与标签的
5、位置及语义关系为模式树各节点匹配语义描述标签。(3)提出一种基于本体的Deepw曲语义标注方法,解决传统方法中标注能力不足和标注结果不统一的问题。首先对数据单元进行对齐分组,然后采用多种基本标注器对分组进行组合标注;之后建立结果模式与本体问的映射得到完整且统一的标注结果;最后对同一领域内的不同数据源进行交叉标注验证。(4)设计并实现一个面向图书电子商务领域的DeepW曲搜索引擎原型系统。本文采用U砌C提供的数掘集分别对文中提出的解决方法进行实验,通过对实验结果的分析验证了本文提出的方法足可行且有效的
6、。关键词:DeepW曲,本体,查询接口,模式抽取,语义标注作者:朱旭东指导老师:伏玉琛Abstmct壁塑晖UonKeyIssuesofD!望坠I墨呈!竺璺堕!垒璺里!!!堕塑里笋e9on_ontology噬璺婴!塑ResearchonKeyIssuesofDeepW曲SemanticAnnotationBasedonOnt0109yLearning、一一‘一AbstractWiththerapiddeVelopment0fmeIntemetandrelatedWebtechnology'theinf
7、.omationontheW色bcontinues’’deepening”.Ala唱eamountofinf.0rmationhidesintheonlinedatabasesthatdistributeeVerywhereinthe111temet.Traditionalsearchenginescan’taccesst0thesecontentsandusersc锄onlygettlleretumedresultsbysubmittingkeywordsthroughthequeryingint
8、erface,sot量Ieinf6珊ationiscalledDeepWeb.DeepWebhasbecomeaIlimponantsourCeofinfbmationfortheuse璐.hlordertoaccesst0theDeepW曲inf.0mationrapidlyandaccurately'DeepW曲infbmationintegrationhasbecomeaproblemtobesolVedu唱ently.DeepWebsemanticannota
此文档下载收益归作者所有