基于关键词的文档层次查询

基于关键词的文档层次查询

ID:11563381

大小:2.21 MB

页数:6页

时间:2018-07-12

基于关键词的文档层次查询_第1页
基于关键词的文档层次查询_第2页
基于关键词的文档层次查询_第3页
基于关键词的文档层次查询_第4页
基于关键词的文档层次查询_第5页
资源描述:

《基于关键词的文档层次查询》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于关键词的文档层次查询HierarchicalQueryofDocumentsBasedonKeywords尹文生陈修国涂平晖张恒喜(华中科技大学机械科学与工程学院武汉430074)(武汉市交通基本建设工程质量监督站武汉430015)摘要文档查询是科学工作中的重要环节。从实现机理来看,文档查询是一种基于关键词的数据库查询过程,其核心就是构建查询语句即设计查询界面及向数据库查询语句转化。提出了一种面向文档查询的查询树概念,将每个叶结点对应于一条SQL语句,而分支结点则表示子结点之间的并交差集合运算关系和其他运算关系,便于表达复杂文档查询要求。设计了查询树向SQL语句转化算法,将整个查

2、询树合并为一条SQL语句,充分发挥DBMS查询优化功能。关键词文档查询关键词查询查询树查询子句中图分类号TP391.3G350文档查询是科学工作中的重要环节。随着计算机技术、通信技术、信息技术等的飞速发展,人们可以获得的文献资料越来越多,视野变得越来越开阔。然而问题也随之产生,人们可能不必为资料比较少而发愁,却为资料太多很难发现有用的资料发愁。因此为用户提供简便而有效的查询方法具有很大意义。合关系等等。为与用户的使用习惯相符,这里用关键词查询表示一般的文档查询。因此,查询过程是一个不断选择关键词及其关系,缩小搜索范围,提高搜索速度,最终找到自己所需要的文档的过程。1.2查询方式目前常

3、见的商用查询系统通常提供两种查询方式:简单查询和高级查询。简单查询一般只需要用户输入少量的关键词,逻辑关系比较简单,而高级查询则输入的关键词比较多,甚至可以输入比较复杂的逻辑关系。在大多数情况下,简单查询和高级查询之间的差别一般都不是本质上的,常常体现为查询所使用的关键词的多少不同。许多查询系统还提供对查询结果进行并交差集合运算的功能。例如百度搜索引擎等网上搜索引擎可以对查询的结果进行进一步的搜索,直到搜索完成或没有可选文档为止。这样的查询方式是一种线性的方式,即一步一步进行的查询方法。常用的查询方式具有查询界面简洁、使用简单、易于被大家所接受等优点,但是也存在查询功能不强、不容易表

4、达比较复杂的关系、可重用性差等缺点。由于查询的使用者往往是普通的用户,简单的用户界面具有较强的适应性,因此采用简洁的设计风格是有效的但是这种简洁的设计风格在表达复杂关系时具有较大的缺陷,主要体现为:关键词及其关系固定,不允许自由地对关键词进行关系组合等等。例如不能像公式表达式那样通过引入括号来包含复杂的层次关系。事实1常用查询方法1.1查询过程在日常生活中,人们经常使用计算机系统进行文档的查询。查询的一般过程是:搜索一篇文档中出现的字词,或者数据库一些表中的某些字段取值,如果这些字词或字段的取值与用户给定的字词及其关系相一致,则相应的文档或数据内容被选中。例如人们经常使用的网上搜索引

5、擎就是这种工作方式。在查询过程中,因为用户给定的字词及其关系是选择文档的重要依据,所以称这样的查询为关键词文档查询,并将这些字词或数据库表中字段的取值称为关键词。严格地说,人们经常使用的关键词包含关键词类型、关键词取值及关键词类型和关键词取值之间关系三种概念。由于在进行文档查询时关键词类型和关键词取值之间的关系常常是相等关系,所以将关键词的取值也称为关键词。事实上,在查询过程中,关键词类型和关键词取值之间还可以存在许多关系,如算术关系、逻辑关系、集作者简介:尹文生,男,1963年生,博士,副教授,研究方向为智能CAD、虚拟现实、人工智能;陈修国,男,1984年生,硕士研究生,研究方向

6、为智能CAD、人工智能;涂平晖,男,1968年生,博士,高级工程师,研究方向为桥梁隧道;张恒喜,男,1972年生,工程师,研究方向为建筑工程。上,如果查询系统为用户提供很强的查询表达式输入功能,使用效果反而会很差。为了增强查询能力,可以采取以下一些方法。a.设计功能强大的查询界面。有两类方法,一类是设计可以表示多种复杂关系的专用的交互界面,另一类方法是设计通用的交互界面,用户通过掌握高级的查询描述方法来构建查询语句,显然这两种方式都增加了普通用户使用它们的难度。b.提供关键词层次查询1~2。例如,Oracle系统中引进层次树查询(HierarchicalTreeQuery)机制来扩展

7、原有的SQL语言,提供面向层次数据的查询谓词(STARTWITH-CONNECTIONBY),从而可以有效的实现对层次数据的查询。c.构建XML查询树3~7。根据查询请求描述特点的不同,将XML查询方式概括为两大类,即:XMLQuery查询模式和XMLIR(InformationRetrieval)查询模式。其中,XMLQuery的查询过程是:首先定义精致的查询模式描述语言(如XPath,XQuery等),用户借助它来描述自己感兴趣的模式,然后将用户的模式

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。