信息检索技术讲义.ppt

信息检索技术讲义.ppt

ID:51959195

大小:674.50 KB

页数:83页

时间:2020-03-26

信息检索技术讲义.ppt_第1页
信息检索技术讲义.ppt_第2页
信息检索技术讲义.ppt_第3页
信息检索技术讲义.ppt_第4页
信息检索技术讲义.ppt_第5页
资源描述:

《信息检索技术讲义.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库

1、专题二:信息检索技术本专题内容第一节 布尔逻辑检索第二节 截词检索第三节 位置检索第四节 限定检索第五节 全文检索第六节 引文检索第一节 布尔逻辑检索一.布尔逻辑运算符二.布尔逻辑运算符的运算次序三.布尔表达式编制注意事项四.布尔检索表达式的特点(优缺点)*检索单元单元词检索-?S computer13000computer多元词检索-?S informationretrieval21300informationretrieval一.布尔逻辑运算符布尔逻辑检索的布尔逻辑表达式是采用布尔逻辑运算符(逻辑与“and”、逻辑或“or”、逻辑非“not”)来连接运算

2、分量(检索词),以及表示运算优先级的括号组成的一种表达检索要求的一种算式,简称提问逻辑式。逻辑与 “and”逻辑或 “or”逻辑非 “not”逻辑或“or”AorB;A+B信息源中含有检索词A或B的所有信息均为命中对象。逻辑或可以实现扩检,增强检全率ABABAB布尔或关系文氏图逻辑与“and”AandB ;A*B同时含A、B两个检索词的信息为命中信息。逻辑与运算,可以增强查找的专指性,提高检准率。布尔与关系文氏图ABABAB逻辑非“not”AnotB;A-B ;-B*A逻辑非运算是一种排除性运算,逻辑非运算必须与逻辑与运算同时使用。在实际检索中,常常在一个检

3、索中间结果中使用“非”运算,用来排除指定的其中某类文献,以提高检索的查准率。ABABAB布尔非关系文氏图二.布尔逻辑运算符的运算次序对于一个布尔检索逻辑表达式,计算机的处理总是从左向右进行的,遵循四则运算;对于运算符or,and,not,它们的运算优先次序在不同的系统中有着不同的规定:DIALOG:not-and-or对同一个布尔逻辑提问式来说,不同的运算次序将会产生不同的检索结果。练习练习1 有关上海市内的河流污染的文献。A上海市内B河流C污染练习2对日本与美国的军队信息化建设方面进行比较的文献。A日本B美国C军队信息化建设练习3有关日本或者美国的军队信息

4、化建设方面的文献。A日本B美国C军队信息化建设练习4有关除了大米以外的谷物进口的文献A谷物B大米C进口三.布尔表达式编制中的注意事项(1)概念整体与部分的关系(2)慎用“not”(3)布尔逻辑算符的使用技巧(1)概念整体与部分的关系例如“检索关于欧洲能源问题的文献”欧洲(Europe);能源(Energy)Europe*Engergy*概念检索(同义扩展、相关概念的联想)(Europe+Britain+France+Italy+Spain+…)*(Energy+coal+petroleum+naturalgas+…)练习查找“有关上海市内的河流污染的文献。”

5、A上海市内;B河流;C污染(上海市+黄埔区+卢湾区+…)*(河流+黄埔江+苏州河+暗沟+…)*污染(2)慎用“not”避免将非运算和或运算一起使用,否则将会再现滥检现象。检索逻辑‘not’慎用,否则会检索失败。例如:NOT计算机OR软件militaryaircraftNOTaircraft(computer+software)NOTharware(3)布尔逻辑算符的使用技巧当采用逻辑与“*”连接检索词时,尽可能将出现频率低的词放在“*”之前,其目的是为了使否定的答案尽早排除。(要求较高的查准率)采用逻辑或“+”连接检索词时,将出现频率高的词放在“+”之前,确

6、保命中答案尽早出现。(保证较高的查全率)四.布尔检索表达式的特点优点:与思维习惯一致查找出有关某一主题的文献同时包含主题A和主题B的文献主题A和主题B只要有一种即可获得主题A的文献,但排除其中含有主题B的文献表达方式直观清晰方便扩检与缩检增加逻辑或(扩检)增加逻辑与(缩检)缺点检索输出量难以控制;检索结果不能根据用户的检索需求按重要程度顺序排序输出;对于文献描述与布尔查询中的词汇无重要层次之分;过分依赖于检索用词,检索效果不甚理想。布尔逻辑检索小结布尔检索技术一直是信息检索系统采用的主要检索技术之一。布尔逻辑检索反映了检索词之间的逻辑关系,属于一种定性的信息

7、检索技术,这种定性检索难以分辨出检索结果之间的重要程度。严格的二值逻辑判断,使单纯布尔逻辑检索的结果缺乏“量”的比较。第二节 截词检索(模糊检索)截词检索利用检索词的词干或不完整的词形进行检索。在检索标识中保留相同部分,用相应的截词符(?#:$)代替可变化部分进行的检索。截词检索类型(一)按截断字符数量分:有限截断;无限截断(二)按截词位置分:左截断;右截断;中间截断词干后至多跟与截字符相同的字符数DIALOGchild????child+children+childish+childlikeORBITchild####BRSchild$4(一)按截断字符数

8、量分(1)有限截断(LimitedTruncatio

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。