信息检索复习资料

信息检索复习资料

ID:23164229

大小:257.50 KB

页数:12页

时间:2018-11-04

信息检索复习资料_第1页
信息检索复习资料_第2页
信息检索复习资料_第3页
信息检索复习资料_第4页
信息检索复习资料_第5页
资源描述:

《信息检索复习资料》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、科学信息检索与应用第一章绪论1.情报检索与科学研究关系2.个体研究阶段,世界上最早出现的手工检索工具:答:1821年瑞士出版的《物理科学进展年报》1830年德国创办的文摘杂志《药学总览》3.社会化阶段,研制大型检索工具:答:美国1884年创办了《工程索引》(EI)美国1907年创办了《化学文摘》(CA)美国1926年创办了《生物学文摘》(BA)英国1896年创办了《科学文摘》(SA)4.自动化阶段,产生新的检索理论:答:1951年Taube,M提出:单元词组配法1958年Citron,J提出:轮排索引1958

2、年Luhn,H提出:定题服务(SDI)二战期间…案例:曼哈顿工程-阿波罗计划5.科技文献概念答:记录在载体上的科技知识,包括科技事实、数据、理论方法、构思和假设等。(文献/科技文献)6.文献信息源,按文献载体形式划分:答:印刷型文献:指印刷术发明之后,以纸张为存储载体,通过油印、铅印、胶印、静电复印等手段,将文字固化在纸张上所形成的文献。缩微型文献:又称为缩微复制品文献,它是以感光材料为载体,以印刷型文献为母本,采用光学摄影技术,将文献的体积浓缩而固化到载体上。机读型文献:机读型文献的全称为计算机阅读型,是以

3、磁性材料为存储载体,以穿孔、打字或光学字符识别装置为记录手段而形成的文献。声像型文献:又称为视听型文献,它是以磁性材料或感光材料为载体,借助特定的机械设备直接记录声音信息和图像信息所形成的文献。7.文献信息源,按文献的出版形式划分:答:科技图书(ScienceandTechnicalBook)科学期刊(ScienceandTechnicalJournal)科技报告(ScienceandTechnicalReport)专利文献(PatentDocument)会议文献(ConferencePaper)学位论文(D

4、egreeThesis)标准文献(StandardLiterature)政府出版物(GovernmentDocument)产品样本(ProductStylebook)技术档案(TechnicalFiles)8.文献信息源,按文献的产生、加工、用途划分为:答:一次文献,又称原始文献。以本人的研究成果为基本素材创作而成的文献。二次文献,将分散的一次文献进行选择、加工、整理之后所得到的产物,是为了便于管理和利用一次文献而编制的检索工具。三次文献,利用二次文献查阅大量一次文献,并将其进行综合、分析、研究而编写出来的文

5、献。9.文献寿命缩短半衰期:贝纳尔(Bernal,J.D)提出半衰期:某学科现时尚在利用的全部文献中较新的一半,是在多长一段时间内(X年)发表的。经过X年,某学科领域其一半文献的利用价值已逐渐衰减。例如:生物科学文献的半衰期是3年,也就是说,现时仍在利用的生物科学文献的50%,其出版年龄不超过3年。换句话说,上述生物学文献的半衰期(一半老化的时间)是3年。表1.各类科技文献使用寿命文献类型使用寿命文献类型使用寿命科技图书10-20年科技期刊3-5年科技报告10年标准文献5年学位论文5-7年产品样本3-5年平均

6、使用寿命为5-6年表2.不同学科文献半衰期学科半衰期学科半衰期学科半衰期数学10.5地理学16.0生物、医学3.0物理学4.6化工4.8生理学7.2化学8.1冶金工程3.9植物学10.0天文学4.7机械工程5.2农林科学5.9地质学11.8工程技术3.2社会科学5.010.情报检索(InformationRetrieval)是指将信息按一定的方式组织存储起来,并根据信息用户的需要找出相关信息的过程。11.主题检索语言:答:主题词:能表达文献的实质内容,经过规范化处理的名词术语。如,中国《汉语主题词表》、《医学

7、主题词表》、《农业、生物科学主题词表》…关键词:能表达文献主要内容的词汇或术语,未经过规范化处理。12.评价指标答:英国情报学家克莱弗登(Cranfield)在分析用户基本要求的基础上,提出了6项系统性能的指标,它们是:收录范围、查全率、查准率、响应时间、用户负担和输出形式,其中查全率和查准率是两个最常用的重要指标。查全率(Recallratio):指检出的相关文献量(a)与检索系统中相关文献总量(a+c)的比率。例如:某课题检出相关文献49篇,而该检索工具中与课题相关的文献总量有70篇,那么,此次检索的查全

8、率为70%。查准率(Precisionratio):指检出的相关文献量(a)与检出的文献总量(a+b)的比率。例如:某课题检出文献总量为60篇,经筛选只有30篇与课题相关,那么此次检索的查准率为50%。13.效果评价答:表3.各种因素对查全和查准率的影响:影响因素漏检率误检率数据库标引不全、漏标、误标29.8%11.5%检索语言专指词不足、词间关系层次错误10.2%35.7%检索式用词不当,组配错误

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。