网络信息检索基本方法

网络信息检索基本方法

ID:39632299

大小:3.75 MB

页数:74页

时间:2019-07-07

网络信息检索基本方法_第1页
网络信息检索基本方法_第2页
网络信息检索基本方法_第3页
网络信息检索基本方法_第4页
网络信息检索基本方法_第5页
资源描述:

《网络信息检索基本方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二讲网络信息检索基本方法2010-9-13【目的与要求】掌握布尔逻辑检索等网络信息检索的基本技术。熟悉网络信息检索的途径和步骤。【重点】布尔逻辑语言、邻近检索、截词检索【难点】邻近检索影响信息检索质量的因素信息资源本身的质量对信息检索的影响(鱼龙混杂,参差不齐)检索软件对信息检索的影响(不同的搜索引擎,数据库系统)用户水平对信息检索的影响网络信息检索的基本技术网络信息检索的基本途径网络信息检索基本步骤网络信息检索基本方法MACTH计算机将检索提问词文献记录标引词信息检索过程的实质:智能检索基本技术邻近检索

2、字段限制检索布尔逻辑检索截词检索模糊检索词组检索一、网络信息检索的基本技术1.布尔逻辑检索(booleanlogic)逻辑检索是一种比较成熟、较为流行的检索技术,现代的情报检索系统大多都采用这种技术。逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符(booleanlogicoperator),它的作用主要是利用布尔逻辑算符将一些具有简单的、表达某一主题概念的检索单元(或检索标识)组配成一个具有复杂概念的检索式,以满足课题检索的要求。主要运算符有“和(and,*)”、“或(or,+)”、“非(no

3、t,-)”。运算优先级顺序为NOT、AND、OR,可以用括号“()”改变它们的运算顺序。如Aand(BorC),检索顺序为先B或C,然后再与A实例:【实例】在搜索引擎中输入“电视台-中央电视台”,查询结果不包含“中央电视台”。逻辑算符举例①查找关于“动物保护”的文献:“动物AND保护”②查找有关冬虫夏草的文献:“冬虫夏草or冬虫草or虫草”③查找关于能源方面的文章,但关于“核能”的不要:“energynotnuclear”(energy-nuclear)④检索西红柿种植技术的相关文章:(西红柿+番茄)*(种

4、植+栽培+培育)Exercise1:查找电子图书的标准(DigitalbookORelectronicbookORe-bookORonlinebook)ANDstandardGoolge的默认运算符就是逻辑“与”,用空格、“AND”和“+”都表示,而逻辑“非”只能用“-”而不能用“NOT”表示。百度的默认运算符是逻辑“或”,空格、“OR”均表示逻辑“或”。在ISIWebofKnowledge平台上,逻辑算符“AND”、“NOT”、“OR”不区分大小写,但不支持以“*”、“-”、“+”代替。在ScienceD

5、irect中,逻辑“非”是用“ANDNOT”表示,而不是我们常用的“NOT”。2.词组检索(phrasesearch)通常在所检索词上加“”对所检索词视为词组处理,表示检索与“”内形式完全相同的短语,以提高检索的精度和准确度,因而也有人称之为“精确检索”(exactsearch)。例如:“动物保护”,表示动物保护是个词组,检索结果动物和保护不能分开。若不加“”,检索结果可以是动物保护、动物多样性保护、动物栖息地保护、动物资源保护等形式。ScienceDirect用双引号“”表示宽松短语检索,标点符号、连字符

6、、停用字等会被自动忽略,如检索式为“heartattack”会检出包含“heartattack”和“heart-attack”的检索结果。在该数据库中,精确检索是用“{}”表示。邻近检索有时又被称为位置算符检索。因此,我们要利用位置逻辑算符来限定检索词与检索词之间的位置关系,从而使检索出的文献更确切地符合用户要求,提高查准率。在不同的检索系统中,所采用的位置算符是不同的,功能也有差异。下面以全球最大的联机检索系统Dialog为例来说明位置算符的用法,OCLC也是如此。3.邻近检索(proximitysear

7、ch)布尔逻辑运算符和词组检索虽然能有效的扩大和缩小检索范围,但无法对检索词之间的相对位置进行限制文献记录中词语的相对次序或位置不同,所表达的意思可能不同又称为位置算符检索,用来规定检索系统原始记录中的检索词之间的特定位置关系同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样我们要利用位置逻辑算符来限定检索词与检索词之间的位置关系,从而使检索出的文献更确切地符合用户要求,提高查准率。Eg:“粉末的掺合与颜料包装”①(W)—WITH算符表示两个检索词前后次序固定,二者之间只能间隔连字符、空格或者

8、是逗号。【实例】在OCLC中输入communicationwsatellite;②wN(withN)算符表示两个检索词之间插有n个词,但顺序不能颠倒。表达式:AWNBAB两词靠近,次序为A先B后,中间最多可加n个词。【实例】在EBSCO中输入communicationw3satellite;③N(Near)算符N(Near)表示两个检索词可以互换顺,二者之间只能间隔连字符、空格或者是逗号。表达式:ANB:AB两词

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。