ir-t03 检索工具与语言

ir-t03 检索工具与语言

ID:34096149

大小:1.02 MB

页数:18页

时间:2019-03-03

ir-t03 检索工具与语言_第1页
ir-t03 检索工具与语言_第2页
ir-t03 检索工具与语言_第3页
ir-t03 检索工具与语言_第4页
ir-t03 检索工具与语言_第5页
资源描述:

《ir-t03 检索工具与语言》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、文献检索之基本理论(续)检索、检索工具与检索语言1检索21什么是检索?•检索=web-search?•检索:findinganykindofrelevantinformation–web-pages,newsevents,answers,images,…–“relevance”isakeynotion3Howfardopeoplelookforresults?42情报检索与文献检索•情报检索•收集、组织、存储一定范畴的情报,并可供用户按需要查询情报的技术和过程。•信息加工(存储)---情报检索•文献检索5文献检索的目的•Goal=

2、finddocumentsrelevanttoaninformationneedfromalargedocumentsetInfo.needQueryIRRetrievalDocumentsystemAnswerlistcollection63真正的文献检索•检索(retrieve)≠查找(search,find)1如何有效查找到所需文献2如何查全、查精所需文献3如何整理、归纳文献4从文献中得出有意义的结论7文献检索效果评价•查全率(RecallFactor,R)–被检出相关文献量/相关文献总量•查准率(PrecisionFact

3、or,P)–被检出相关文献量/被检出文献总量•漏检率–未检出相关文献量/相关文献总量•误检率–被检出非相关文献量/被检出文献总量84问题:•AfatbookwhichmanypeopleownisShakespeare'sCollectedWorks.•SupposeyouwantedtodeterminewhichplaysofShakespearecontainthewordsBrutusANDCaesarandNOTCalpurnia.•How?9文献信息检索语言•根据文献信息检索的需要而创制的人工语言。(检索语言、文献存储

4、与检索语言、标引语言、索引语言等)•描述文献外表特征的检索语言:依据文献外表特征(题名、著者、文献序号、引用文献等)作为文献存储标识和文献检索提问的出发点而设计的索引语言。•描述文献内容特征的检索语言:分类检索语言、主题检索语言、代码检索语言。•网络环境下的一体化语言105检索语言的分类•外表特征语言J题名语言J作者语言J号码语言11•内容特征语言J分类语言J主题语言(代码语言)126–分类检索语言:按学科、专业集中文献,从知识分类的角度揭示多种不同文献在内容上的区别和联系,提供以学科分类为出发点的文献信息检索途径。–分类号13–

5、主题检索语言:以反映文献内容的主题词或关键词作为文献存储和检索的标识。•标题词语言•单元词语言•关键词语言•叙词语言147关键词与主题词•关键词–出现在文献的标题、摘要或全文中能表达文献实质内容的词或关键性专业名词术语•主题词(叙词)–以规范化的词汇来表达文献内容的主题,这种词汇叫主题词(叙词)。•严格规范化、可进行概念组配、具有完善参照系统、具有范畴索引等•主题词表15–代码检索语言:用代表事物的代码作为标识系统的索引语言。(化合物分子式索引、环状化合物环系索引、化学物质号索引等)1681718919孙宝国,北京工商大学副校长,

6、北京工商大学教授,博士生导师。2009年12月2日增选为中国工程院院士。孙宝国院士为中国工程院环境与轻纺工程学部最年轻的院士。《孙宝国院士被指曾称地沟油不可能回到餐桌》《中国工程院院士孙宝国:食品添加剂被诬陷》2010检索式•搜索引擎能够理解和运算的查询串,由关键词、逻辑运算符、搜索指令(搜索语法)等构成。•A:检索孙宝国没在北京工商大学期间发表的题名中含有作为一个整体的关键词“食品添加剂”的文献,并且“食品”二字必须在“添加剂”的前面,顺序不能颠倒。•题名=‘食品#添加剂’and(作者=孙宝国not机构=北京工商大学)21Boo

7、leanOperator布尔逻辑算符AND使用AND可查找包含被该运算符分开的所有检索词的记录。SAME使用SAME可查找被该运算符分开的检索词出现在同一个句子中的记录。句子的定义为:•文献题名;•摘要中的句子;或者•单个地址。使用SAME运算符(而非AND运算符)是缩小检索范围的好方法。OR使用OR可查找包含被该运算符分开的任何检索词的记录。NOT使用NOT可将包含特定检索词的记录从检索结果中排除。221123位置运算符•with运算符:(w)或()•nWords运算符:(nW)•Near运算符:(n)•nNear运算符:(nN

8、)2412截词运算符•通常用“+”,“*”,“?”表示。•前方一致•后方一致•中间一致25网络环境下的一体化语言•分类主题语言一体化:对分类表和叙词表中的术语、参照、标识及索引实施统一的控制,使两者有机地融为一体,从而实现分类主题一体化标引和一体化

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。