计算机信息检索技术1

计算机信息检索技术1

ID:40510091

大小:1.14 MB

页数:99页

时间:2019-08-03

计算机信息检索技术1_第1页
计算机信息检索技术1_第2页
计算机信息检索技术1_第3页
计算机信息检索技术1_第4页
计算机信息检索技术1_第5页
资源描述:

《计算机信息检索技术1》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、《信息检索教程》第2章计算机信息检索技术1信息检索的基本概念1.1信息检索的涵义从广义上讲,信息检索包括两个过程,一是信息存储(informationstorage),即信息的标引、加工和存储过程:二是信息检索(informationretrieval),即信息用户的查找过程。从狭义上讲,信息检索仅指后一部分。信息检索的本质是一个匹配的过程即用户的信息需求和信息存储的信息集合进行比较和选择的过程信息存储和检索过程的基本原理输出一次信息信息特征检索语言信息特征标识检索结果信息需求检索提问检索提问标识分析标引标引输入检索信息检索系统(工具)存储过

2、程检索过程分析标引(indexing)通过对文献的分析,选用确切的检索标识(类号、标题词、叙词、关键词、人名、地名等),用以反映该文献的内容的过程。主要指选用检索语言词或自然语言词反映文献主题内容,并以之作为检索标识的过程。Indexing一词,音译为引得法或意译为索引法,系指索引的编制技术与方法。现代外语辞典中则说明此词有2解,一指索引法,一指标引。标引是文献加工中的重要环节。标引的质量,对文献的检索效果有直接的决定性影响。标识(标志)的词义标志”与“标识”,在现代汉语中是等价的。《现代汉语词典》中,【标识】biāozhì同“标志”。标识的

3、另类应用:信息创新定义信息的新定义与标识传统的信息定义,一直不够完备,关键就是没有更早的启用“标识=标志=表识”这词。传统经典信息定义,加上“标识”一词,马上就升格为,定义的标版。如,著名维纳的否定式的信息定义(改造前):信息就是信息,信息既不是物质,也不是能量。改造后,逆维纳信息定义:信息就是信息,信息是物质、能量、信息及其属性的标识。2002年Deng's原创的信息定义:信息是事物属性标识的集合。跟随模仿的画蛇定义:信息是事物属性的表征(普适性缩小,添足)。计算机信息检索是对信息进行收集、分类、标引、著录,并加以有序化组织,将信息储存到计

4、算机存储信息系统中,编制出一个信息检索系统或信息检索工具的过程。1.2计算机信息检索用户输入检索需求分析转换处理需求数据库检索=概念词的相关匹配运算概念词典控制词表信息源筛选录入分类、词索引文档预处理计算机信息检索的基本原理1.3信息检索的类型按信息检索的内容划分文献检索数据检索事实检索概念检索按信息检索的组织方式划分全文本检索多媒体检索超文本检索超文本检索是对每个节点中储存的信息以及信息链构成的网络信息进行的检索。与传统文本的线性顺序不同,超文本检索强调中心节点之间的语义联结结构,靠系统提供的工具进行图示穿行和节点展示,提供浏览式查询,可进

5、行跨库检索。WWW(1)文献检索DocumentRetrieval根据检索(查找)对象的划分为文献(信息)检索、事实检索和数据检索。文献检索主要是利用二次文献进行,是信息检索中最基本、最重要的类型。例:系统收集有关“高强度预应力混凝土管桩承载性能”这就需要我们根据课题要求,按照一定的检索标识(如主题词、分类号等),从所收藏的文献中查出所需要的文献。(2)数据检索DataRetrieval是指查找用户所需特定数据的检索。利用各种词典、手册、百科全书、年鉴、等参考工具书进行检索,也可以利用专门的数据库进行检索。例:我国第五次人口普查中全国汉民族的

6、人数。熔点、电阻系数,计算公式、数据图表,化学分子式等。(3)事实检索FactRetrieval是将存储于检索系统中的关于某一事件发生的时间、地点、经过等信息查找出来的检索。它回答的问题诸如:“有哪些海外华人得过诺贝尔奖?” 工具:字典、词典(dictionary)百科全书(encyclopedia)年鉴(annual,yearbook,almanac)手册(handbook,manual)名录(biography)和书目指南(directory)例:第三届全国ITAT教育工程就业职能大赛项目瑞萨超级MCU模型车大赛的比赛,福建工程学院学生的

7、获奖情况。某同类汽车产品中,哪种牌号的销量练习(判断问何种检索类型)1、世界上有多少篇关于“飞机材料疲劳断裂问题的研究”的文章等。2、某种型号飞机的体积、机动性能如何?3、某高速公路有多长?4、“title”的中文含义是什么?超文本、超媒体一、超文本(hypertext)一种全局性的信息结构,它将文档中的不同部分通过关键字建立链接,使信息得以用交互方式搜索。它是超级文本的简称。二、超媒体是超文本(hypertext)和多媒体在信息浏览环境下的结合。它是超级媒体的简称。用户不仅能从一个文本跳到另一个文本,而且可以激活一段声音,显示一个图形,甚至

8、可以播放一段动画。WebInternet采用超文本和超媒体的信息组织方式,将信息的链接扩展到整个Internet上。Web就是一种超文本信息系统,Web的一个主要的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。