计算机检索的步骤和方法

计算机检索的步骤和方法

ID:40147658

大小:24.55 KB

页数:6页

时间:2019-07-23

计算机检索的步骤和方法_第1页
计算机检索的步骤和方法_第2页
计算机检索的步骤和方法_第3页
计算机检索的步骤和方法_第4页
计算机检索的步骤和方法_第5页
资源描述:

《计算机检索的步骤和方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、计算机检索的步骤和方法一、明确检索要求和检索目标计算机检索的第一步准备工作是明确检索要求和检索目标。明确检索要求就是要搞清楚本课题属于什么学科,所需文献的类型及语种,查找文献的年代,所需文献的最佳篇数,允许支配的检索费用。这些要求对选择数据库、构造检索策略都是十分重要的。确定检索目标也是进行计算机信息检索前应搞清楚的准备工作。例如:如果属于开题调研,则应尽可能地检索出与之相关的全部文献,即要求较高的查全率;以便充分地做好开题的准备工作;如果属于探索性、开创性的课题,则只需要查出一些启发性的文献,对查准率和查全率要

2、求都不一定有很高的要求。二、课题分析1.课题概念的分析方法分析课题就是分析出课题所涉及的主要概念,并找出能代表这些概念的若干个词或词组,进而分析概念之间的上、下、左、右关系。对于新学科、交叉学科和边缘学科的课题,则要搞清楚这些概念之间的关系。概念分析的结果应以概念组为单元的词或词组的形式列出,以便下一步制订检索策略时使用。2.隐含概念的分析方法有些课题的实质性内容往往很难从课题的名称上反映出来,课题所隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,才能提炼出能够确切反映课题内容的检索概念。例如:"社会保

3、障"包含"养老保险"、"失业保险"、"医疗保险"和"社会救济"等概念,如果要检索社会保障方面的文献,应该析出上述概念,才能保证文献的查全率。3.核心概念的选取有些检索词中已经含有的某些概念,在概念分析中应予以排除。例如:课题"公司劳动奖励、职工培训和养老保险制度管理的理论和实践",如果把"劳动奖励","职工培训","养老保险","公司","制度","管理"六个概念全部组配起来,则会造成大量文献漏检。实际上,劳动力资源管理已经包含了劳动奖励、职工培训和养老保险三个方面,而且,劳动力管理必然是针对该三个方面而言的。因

4、此,本课题只须采用"劳动力资源"和"管理"这两个本质概念即可。为了提高文献的查准率,应该从相应的规范词表中选择所需的检索词。并且在确定检索词时,除了要考虑反映主题概念的同义词、近义词等相关的检索词外,还要注意选择被选用检索词的缩写词和不同拼法的词,以避免漏检有关的文献。三、检索词的扩展、选择和处理目前的计算机信息检索系统,还不具备智能思考的能力,还不会对所输入的检索词以及涉及的所有词进行自动、全面的检索,因此,必须在概念分析的基础上列出与概念有关的词,从中做出选择,并利用截词等方法对检索词予以归并。1.相同概念的

5、检索词的扩展扩展相同概念的检索词的方法一般有同义词方法、主题词表方法和截词方法   (1)同义词方法。在同一概念的范畴内,从语言角度,选择不同的名称、不同的拼写方法和单复数形式。不同的名称包括学名和俗名、简称和全称,商品名和物质或产品名,事物的代码和事物的学名。不同的拼写方法,以英语为例,包括英式英语和美式英语的区别。  (2)截词方法。当某些检索词词干相同、词义相近,但词尾或词中间有变化时(多数英语单词的单复数变化和英美不同拼写形式),可以采用截词方法扩展检索词。这种方法要求在词干后使用截词符。截词符一般包括"

6、?"和"*"两种。具体采用什么形式,各个系统都有明确的规定。例如:在DIALOG系统中,截词符号有无限截词算符("?")和有限截词("??"和"???")等多种,"?"有时还用做字符屏蔽符。  (3)主题词表方法。许多数据库都编有自己的主题词表。在数据库编有主题词表的情况下,应该尽量从词表中选择检索词。使用主题词表,不仅可以使检索词更加规范,提高检索结果的准确性,而且可以从同族词中选取更多的上位词、下位词、相关词,使获得的检索结果更为理想。2.检索词的选择和处理运用上述方法得到的词,首先应加以选择,并且注意选用本

7、专业通用的术语(应避免使用冷僻词和根据中文术语自译生造的词),然后以概念为单位,构成组面(facets)。例如:课题"东西方社会保障制度比较研究"的概念组面和检索词为:概念组面1:"社会保障"socialsecurity概念组面2:"制度研究"system?Research四、数据库的选择不同数据库的学科范围不同,检索指令不同,收费的标准也不同。所以,在检索之前应该阅读有关数据库的使用介绍,以便选择数据库时做到心中有数。选择数据库,我们一般应该遵循以下几条原则:1.按照课题的检索要求和目的,选择收录文献种类多、专

8、业覆盖面宽、年代跨度对口的数据库;2.当需要查找最新文献信息时,选择数据更新周期短的数据库;3.当还需要获取原文时,选取原文获取较容易的数据库;  4.在同时有多个数据库可供选择的情况下,应首先选择比较熟悉的数据库。  5.当几个数据库的内容交*重复率比较高时,应选择检索费用比较低的数据库。五、检索策略构成和调整方法  在实际检索过程中,仅需一个检索词就能满足检索要求的情

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。