信息检索第二章

信息检索第二章

ID:40245761

大小:450.00 KB

页数:43页

时间:2019-07-28

信息检索第二章_第1页
信息检索第二章_第2页
信息检索第二章_第3页
信息检索第二章_第4页
信息检索第二章_第5页
资源描述:

《信息检索第二章》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2.1信息检索基本概念2.1.1什么是信息检索?信息检索(InformationStorageandRetrieval):是指将信息按一定的方式组织和存储(Storage)起来,并根据信息用户的需要找出(Retrieval)相关信息的过程。信息检索是指从以任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的方法和过程。完整的信息检索含义包括信息的存储和检索,由此可知,信息检索的全过程应包括信息标引和存储过程及信息的需求分析和检索过程两个主要方面。2.1.2信息检索的意义与作用1.充分利用信息资源,避免重复劳动2.为人们更新知识,

2、实现终生学习提供门径。2.1.3信息检索的类型与特点按信息检索的目的和对象,可分为:文献(document)检索数据(data)检索事实(fact)检索按信息检索的技术手段可分为:手工检索计算机检索网络信息检索信息检索的类型根据检索的内容和查找的对象划分(1)数据信息检索(2)事实信息检索(3)文献信息检索(书目信息检索、全文信息检索)(1)数据检索(DataRetrieval)——确定性检索以数值或图表形式表示的数据为检索对象的信息检索,又称数值检索。是利用参考工具书、数据库等找出包含在信息中的某一数字数据(电话号码、银行帐号、各种统计数据

3、、参数等)和市场行情、图表、公式、化学分子式等非数字数据的检索。典型的提问式:锑的原子量是多少(121.75)检索结果回答用户提出的问题。(2)事实检索(FactRetrieval)——确定性检索以文献中抽取的事项为检索内容的信息检索,又称事项检索。它是利用参考工具书、数据库等从存储事实的信息系统中查找出指定事实的一种信息检索,包括某一事物或事件的性质、定义、原理以及发生的时间、地点、过程等。如:某事实发生的时间,地点或过程等.侧重于检索对象的质的方面.典型的提问式:中国辛亥革命是哪一年发生的?(1911)是信息检索中比较复杂的一种,一般不能

4、直接回答用户的具体问题,必须进行分析、推理后才能得出结果。(3)文献检索(DocumentRetriveal)——相关性检索以文献为对象的信息检索,利用相应的检索方式与手段,在存储文献的检索工具或数据库中,查找检索用户口所需文献的过程。凡是查找某一主题、时代、地区、著者、文种的有关文献,以及回答这些文献的出处和收藏地等,都属于文献检索的范畴。文献检索又分书目检索(目录、题录、文摘)和全文检索。典型的提问式:有关于“如何平衡人际关系”的书吗?我到哪里可以找到?关于汽车排放废气造成公害的情况有哪些文献报道?文献检索是信息检索的核心部分,它与数据检

5、索和事实检索比较内容更为丰富,方法更为多样。它是一种相关性的检索,带有很大的不确定性,是使用最广,效果最大,最重要的一种。所用检索工具之不同数据检索:更多的利用参考性工具书(包括百科全书,年鉴,手册,图表,图谱等等)和有关学术专著;事实检索:主要利用参考性工具书和有关学术专著;文献检索:利用检索检索性工具书(如目录,索引,文摘等)和计算机检索系统.2.2信息检索原理从原理上讲,我们可以把整个信息检索过程刻画为三个方面:即信息的存储与组织、信息的检索实施、信息的展示。其中的关系如下图所示:2.2.1信息检索效率查全率(RecallRatio,简

6、称R)查全率(R)=检出相关信息数量(w)/系统中相关信息总量(x)R=w/x×100%查准率(PrecisionRatio,简称P)查准率(P)=检出相关信息数量(w)/检出信息总量(m)P=w/m×100%查全率与查准率之间是互逆相关的,即任何提高查全率的措施会导致查准率下降,反之亦然。2.2.1信息检索效率专家们认为查全率和查准率处于最佳比例关系时,查全率大致在60%—70%,而查准率大致在40%—50%,一旦查全率超过70%时,要想提高查全率,就必须以牺牲查准率为前提。例如,要利用某个检索系统查某课题。假设在该系统文献库中共有相关文献

7、为1500篇,而检索出来2000篇,其中相关文献1000篇,那么查全率、查准率是多少?2.2.2信息检索系统的类型信息检索系统(InformationRetrievalSystem,IRS):是根据一定社会需求和为达到特定的信息交流目的而建立的一种有序化的信息资源集合体。通常拥有选择、整理、加工、存储、检索信息的设备与方法、并能向用户提供信息服务。2.2.2信息检索系统类型1.信息检索系统分类:手工检索系统:以印刷型检索工具为主体,读者手工查询,自己做出相关判断,获取信息。(例如:查字典)计算机检索系统:可以分为联机检索系统(Dialog、S

8、TN)、光盘检索系统(自建光盘数据库)、网络检索系统2.2.2信息检索系统类型2.数据库类型1)参考数据库(书目数据库、指南数据库)2)源数据库(全文数据库、数值数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。