万情报检索语言中聚类原理和方法

万情报检索语言中聚类原理和方法

ID:6103665

大小:247.51 KB

页数:8页

时间:2018-01-02

万情报检索语言中聚类原理和方法_第1页
万情报检索语言中聚类原理和方法_第2页
万情报检索语言中聚类原理和方法_第3页
万情报检索语言中聚类原理和方法_第4页
万情报检索语言中聚类原理和方法_第5页
资源描述:

《万情报检索语言中聚类原理和方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、雪商确誊拳孵《坑羞酴《北京图书馆馆刊》l997年第1期情报棠诱老器鬟愿,豫厚?壤苏一万情报检索语言中聚类的原理和方法张琪玉白,聚类原理和作用便条件.有助于提高检全率和检准率,也可以为每一个类目或检索词创造一个由等同概进行“聚类”,目的是使情报检索语言念、上位概念、下位概念和相关概念组成的具有“对内容相同及相关的情报加以集中或语言环境,在这种语言环境中,其涵义将会揭示其相关性”这项功能。各种情报检索语更加明确,这有助于文献标引人员准确选择言所采用的显示概念之间关系的一切方法,标引用语,提高标引质量;也有助于情

2、报检都是聚类方法。聚类原理,也正在于通过一索人员准确选择检索用语.提高检准率;还定形式揭示情报检索语言所表达的文献主题可以避免论述同一事物的几篇文献被标引在之间的相同性、相似性和相关性。多个同义标识下而造成的分散,提高检全聚类,具体地说,是要达到:(1)使一率。事物概念只用唯一的一个标识来表达;(2)各种情报检索语言正是采用了各种各样使一事物的所有各个部分的概念都与该事物的聚类方法,而使自己具有了“对内容相同的概念聚集到一起;(3)使一事物的所有各及相关的情报加以集中或揭示其相关性”这个方面的概念都与该事物

3、的概念聚集到一项功能,这是自然语言所不具有的但却是极起;(4)使一事物的所有各个相关事物的概为重要的功能。念都与该事物的概念聚集到一起;(5)使同类的所有各种事物的概念都聚集到一起。一聚类原则个个文献主题概念按相关性聚集到一起.就是成类过程,也即聚类。通过聚类.可以把聚类就是显示概念之间的关系。概念之成千成万纷繁散乱的文献主题系统组织起间的关系,是事物之间相互联系的反映。事来,使之有序化,加以控制。所以.聚类过物之间在某一或某些方面相同、相似、相程,实质是知识或情报的一种组织过程。关,乃至相差、相对,都可以

4、形成其概念之聚类的结果是构成一个文献主题概念网间的某种关系。客观世界万千事物之间的联络.这个概念网络的作用可概括为三点,系不仅是普遍存在的,而且是多方面的,千即“物类聚”,“鸟瞰全貌”,“触类旁通”。丝万缕的。情报检索语言在显示概念之同的J情报检索语言有了这些作用,就既可为进关系时,既不可能.也不必要,而且也不允D行族性检索和在检索过程中根据具体情况扩许把所有一切关系都显示出来。也就是说,一大、缩小、改变检索范围提供参考并创造方聚类要依据一定的原则。;18聚类的原则,即衡量聚类是否属于必需为聚类核心时,其聚

5、类范围则包括与该学科的标准,归纳起来,大体有以下几点:有关的一切文献主题;而当以代表一个专业(1)被确认为相关的两个或多个概念,(产业、事业、社会生活的某个领域、某种其所表达的各类文献中至少有相当数量的文专门业务)的概念作为聚类核心时,其聚类献,在内容上确有相同、相似或相关之处,范围就将包括与该专业有关的一切文献主可以起较大参考、借鉴、类比、启发作用题。因此,作为聚类核心的概念的属性,实的;际上决定着聚类的方式,即或按事物聚类,(2)所显示的关系对了解一事物在所有或按学科聚类,或按专业聚类。除此之外,相关事

6、物中的位置(即与相关事物的亲疏远在特殊情况下,也可以以专题(研究课题)、近关系),或一学科在所有相关学科中的位地域或文献类型作为聚类核心。置(即与相关学科的亲疏远近关系)是正确在围绕不同性质的聚类核心所形成的主无误的;题概念群之间,存在着错综复杂的交叉现(3)所显示的关系对鸟瞰一事物、一学象。所以,一种情报检索语言,一般只采用科或一专业的全貌是必要的;一种类型的聚类核心概念。当有必要采用不(4)所显示的关系对标引和检索能起方只一种类型的聚类核心概念而发生冲突时,便作用的(如能把同时需要的文献集中于一就必须用

7、相当具体的规则来加以明确规定某处,或能帮助标引人员和检索人员联想,在种文献主题的属此属彼。标引和检索中少费脑力劳动的,等等);主题法系统各种语言都是几乎全部以事(5)所显示的关系在大多数检索中既有物为聚类核心,体系分类法主要以学科为聚助于提高检全率,又不致带来很多误检的。类核心,但是也以专业和事物为聚类核心。在体系分类法中,以事物为聚类核心都是出聚类核心现在级位较低的类目中,并且一般只是局部地集中与某一或某类事物有关的文献主题,所谓“聚类核心”,是指决定着聚类结即不是完全地按事物聚类。分面组配分类法果所形成

8、的主题概念群的范围和基本性质的则可以说主要是以事物为聚类核心的。一些为首的泛指的概念。当以那些概念作为聚类过程是在多层次上进行的。在不同聚类核心时,一切与它相关的较专指的主题的层次上,可以有不同的聚类核心。处于较概念,凡符合适用于它的某种聚类依据者,高层次的聚类核心,一般对处于较低层次的便都围绕它进行集中,隶属于它,归附于聚类核心起约束作用;但在特殊情况下,处它,从而形成一个以它为首的比较完整的主于较低层次的聚类

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。