欢迎来到天天文库
浏览记录
ID:25083141
大小:53.50 KB
页数:4页
时间:2018-11-18
《sql server 2000 全文检索技术论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、SQLServer2000全文检索技术论文1全文检索及其发展状况随着海量信息的出现以及计算机存储技术的发展,文献数据库正由书目数据库向全文数据库转变。这一转变使得全文检索技术得到空前的发展。常用的实现全文检索的方法主要有以下两种:第一种方法是不对数据库建立索引而直接对文章进行匹配的方法。这种方法由于没有建立索引库,因此所占空间较少,但同时正是因为它没有索引库,所以在进行全文匹配时要花费大量的时间。第二种方法则是一种为全文建立倒排索引库的方法。这种方法可以大大节省检索的时间。但同时,这种方法需要占用一定的存储空间来建立索引
2、库。目前,国内外对全文检索的研究可以说是达到一个高潮。许多研究机构和商业组织都在进行这方面的研究。国际最具影响力的全文检索评估机构当属TREC(TextRetrievalConference)。它是由美国技术和标准研究所(NIST)和美国高级研究计划局(DARPA)共同举办、自1992年以来每年一次的全文检索评估会议,会议参加者带来研究的检索系统以供专家进行评估。传统的信息单位.freeln);(5)为表创建全文索引(sp_fulltexLtable);(6)填充全文目录(sp_fulltext_catalog)。下面举
3、例说明:在本例中,对test数据库book表中title列和notes列建立全文索引。//首先先启动SQLServer的全文搜索服务。usetest//打开数据库go//打开全文索引支持executesp_fulltext_database‘enable’//建立全文目录ft_pubsexecutesp_fulltext_catalog‘ft_test’,‘create’//为titles表建立全文索引数据元,pk_title为book表中由主键所建立的唯一索引,此参数必须。executesp_fulltext_tabl
4、e‘book’,‘create’,‘ft_test’,.freeln‘book’,‘title’,‘add’executesp_fulltext_column‘book’,‘notes’,‘add’//建立全文索引executesp_fulltexLtable‘book’,‘activate’//填充全文索引目录executesp_fulltext_catalog‘ft_test’,‘start_full’go至此,全文索引建立完毕。3.2全文检索SQLServer2000提供的全文检索语句主要有CONTAINS和FRE
5、ETEXT。CONTAINS语句的功能是在表所有列或指定列中搜索:●一个字或短语;●一个字或短语的前缀;●与一个字相近的另一个字;●一个字的派生字;●一个重复出现的字。CONTAINS语句的语法格式为:CONTAINS({column*}),‘’)其中,column说明被搜索列,使用时说明对表中所有全文索引列莲行搜索Contains_search_condition说明CONTAINS语句的搜索内容,其语法格式为:{
6、
7、
8、
9、){
10、ANDIANDNOT
11、OR}}.n下面就simple_term和predix_term参数做
12、一简要说明:simple—term指出CONTAINS语句所搜索的单字或短语,当为一个短语时,必须使用双引号作为定界符。其格式为:{说明CONTAINS语句所搜索的字或短语前缀,其格式为:{“bookn*},‘freetext_string’)其中,column说明被搜索列,使用*时说明对表中的所有全文索引列进行搜索。Freetext_string参数指出所搜索的自由文本格式字符串。例如,下面语句使用FREETEXT语句搜索book表中包含SuccessfulLife字符串的数据行:selecttitle,notesfr
13、ombook)过滤的机制。在“.MSSQL\TDATA\SQLServer\config”目录下,有一个“noise.dat”文件类似于停用词表,可以对一些没有检索意义的词如a、you等进行过滤而不建立索引。用户自己也可以对该词表进行增补,以过滤一些词。同时,我发现SQLServer2000的全文检索存在一些不足。如当用户对全文索引过的字段进行修改后,需要用户进行手工的“填充”,而不能机器自动完成这一步,另外该系统对计算机硬件要求较高等等。随着计算机硬件的发展以及SQLServer软件本身的不断完善,我相信这些不足是可以
14、得到改善的。
此文档下载收益归作者所有