欢迎来到天天文库
浏览记录
ID:1385939
大小:1.35 MB
页数:68页
时间:2017-11-11
《xml上关键字检索研究毕业论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、XML上关键字检索研究毕业论文目录摘要IAbstractII第1章绪论11.1选课目的11.2选课背景和意义11.3国内外研究现状21.3.1最紧致片段研究现状31.4论文主要研究内容41.5论文组织结构4第2章相关技术介绍62.1开发环境与开发工具62.2Java语言介绍62.3MyEclipse介绍72.4MySQL介绍72.5JDK介绍82.6本章小结9第3章IndexLookupEager算法原理与实现103.1最紧致片段及SLCA相关概念103.1.1XML数据及其树结构103.1.2
2、最紧致片段相关概念133.1.3SLCA概念详述143.2ILE算法原理153.2.1前缀编码153.2.2Dewey编码163.2.3ILE算法基本思想173.2.4ILE算法示例及分析183.3ILE算法的实现213.3.1查询左右匹配节点233.3.2求解最低公共祖先LCA243.3.3求解孩子节点25I3.3.4求解节点的祖先关系263.4本章小结27第4章SLCA查询系统的实现284.1数据库的实现284.1.1解析XML文档284.1.2数据库的设计294.2配置开发环境314.2.
3、1安装JDK314.2.2安装MySQL数据库314.2.3安装MyEclipse324.3页面设计和实现方法324.3.1主界面324.3.2查询功能的实现344.3.3数据库的连接354.4本章小结35第5章软件测试365.1软件测试的方法和步骤365.2测试用例设计与过程及结果分析365.2.1单元测试365.2.2集成测试375.2.3验收测试375.3评价37结论38参考文献39致谢41附录1开题报告42附录2中期报告48附录3文献综述52附录4外文原文57附录5外文翻译11I参考文献
4、第1章绪论1.1选课目的随着计算机网络和Internet的发展,在万维网上的文档资料越来越丰富。近年来,万维网已经成为资讯分享的主要平台,但是以HTML表示的网页资料,并不适合自动化处理。为此W3C制定了XML,允许使用者自己定义文件所需的标签和结构,以用来表述资料本身的涵义。现已有相当多的企业或组织,将资料以XML表示,以便网络上的资料交换与处理。XML上的关键字检索由于不需要对XML的模式有所了解,对用户来说是简单而实用的。在XML上的关键字检索正在成为一个研究热点。XML上的关键字检索不需
5、要用户对所查询的XML的DTD或模式、复杂的XML查询语言等相关知识有所了解,因此更容易被用户接受。通常在web上的关键字检索,比如Google或者百度,他们的返回结果是包含用户提供的关键字的整个网页,属于文档级。但如果对大XML文档上的关键字检索,由于XML文档被建模成树形,有着层次嵌套的关系,用户通常希望得到最小结果片段,此时查询的粒度不再是文档级别而是元素级。所以,更加详细的检索出用户所需要的信息是网络的迫切需要也是用户的迫切需要。如何检索出用户最需要得到信息即如何快速有效计算出关键字之间
6、最紧密的联系是一个有广泛应用前景的课题。1.2选课背景和意义XML(ExtendMARKUPLanguage)由于其具有的子描述性、灵活的数据结构以及丰富的数据表示能力等特点,现在已经被广泛应用到Internet智能信息检索、电子商务中的数据表示和数据交换、数据集成、WebService、数字图书馆等领域。这使得XML类型的数据成为当前流行的数据形式,对XML数据的有效管理也随之成为当前数据库领域研究的热点。13参考文献作为日渐广泛采用的数据形式,从XML数据中提取有用的信息是一个不可回避的研究
7、内容。为了从自描述的、半结构化的XML数据中抽取用户感兴趣的信息,研究人员开发了许多查询描述形式,文献根据查询请求描述特点的不同,可概括为两大类查询模式:XML结构化查询和XML关键字查询。XML结构查询首先定义精确的查询描述语言,用户借助它来描述自己感兴趣的模式,将用户的模式交由实际的XML数据处理系统处理,然后返回与模式相匹配的结果。这就要求用户掌握XML文档结构及查询语言。然而Internet的大多数使用者,是那些既不懂得查询语言,又不了解XML文档结构的普通用户,这时基于关键字的XML数
8、据查询是比较方便的,他只需要用户提供简单的关键字信息,而无需要用户懂得任何查询语言或文档结构。XML关键字查询中,主要有两种方式:一是直接将纯关键字方式不加修改的应用到XML数据查询中;二是辅助信息限定关键字所在节点的范围,例如标签或标签路径信息。由于后者引入的标签信息使得用户还要了解XML数据的实际组织,增加了用户使用的复杂性,而从本质上讲,这种扩散关键字的方式只是增加了过滤关键字节点的作用,实际处理与纯关键字方式并无本质区别。因此,大多将研究的重点放在纯关键字查询中。XML关键字查询的基本问
此文档下载收益归作者所有