浅析中文搜索引擎分类体系

浅析中文搜索引擎分类体系

ID:40650227

大小:24.05 KB

页数:5页

时间:2019-08-05

浅析中文搜索引擎分类体系_第1页
浅析中文搜索引擎分类体系_第2页
浅析中文搜索引擎分类体系_第3页
浅析中文搜索引擎分类体系_第4页
浅析中文搜索引擎分类体系_第5页
资源描述:

《浅析中文搜索引擎分类体系》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、浅析中文搜索引擎分类体系摘要分类法在搜索引擎中的应用极大的提高了搜索效率与查准率,当前各中文搜索引擎都在建立自己的分类体系。本文对中文搜索引擎分类的特点和评价标准进行研究,在找出当前分类体系存在问题的基础上,提出一些改进建议。关键词搜索引擎分类体系分类法1.引言随着互联网的飞速发展,网络信息资源成爆炸式增长,如何从海量的、种类繁多、内容繁杂的网络信息资源获取想要信息资源是网络信息组织及检索亟待解决的问题。搜索引擎作为浏览和获取网络信息资源的工具,它的分类体系就显得尤为重要。当前大多中文搜索引擎采用关键词检索有着查全

2、率高、检索方便等特点,但也不可避免的存在查准率低的缺点,增加我们获得所需信息的难度。由于分类法限定了检索范围,可以提高查准率,分类等级结构可能提供检索词的上下文,当检索目的不明确或检索词不确定时,分类浏览方式更有效率,因此许多搜索引擎采用自编分类系统进行信息组织朱咫渝.谈中文搜索引擎对网络信息的分类[J].大学图书情报学刊,2003,01:71-72.。但是目前中文搜索引擎分类体系多为自编,没有统一的标准,都不同程度的存在着这样那样的问题,因此有必要对中文搜索引擎进行探究,找出问题并提出一些改进建议。2.中文搜索引

3、擎分类体系介绍2.1种类(1)等级分类体系。搜索引擎对所收录的信息或网站的内容进行逻辑划分和系统排列而形成等级分类体系。一般分为十到二十个左右的大类,每个大类下又细分为不同层次的子类,类的层次越深,专指度越高。等级分类体系还又细分为主题分类体系和学科分类体系。(2)分面组配分类体系。将网页信息内容按照某种标准进行分面,划分出来的若干特征概念,即类目,每一分面的类目与其它分面的类目进行组配,形成许多组配类目,达到细分的目的。(3)体系一组配分类体系。它的特点是在等级分类体系的基础上大量采用分面组配方法,以达到细分复杂

4、主题的目的,以满足信息查询或检索的多重需要,现在一些著名的中文搜索引擎如新浪、搜狐、网易等均采用这种分类体系谭宇红,胡德华,柳晓春.中文搜索引擎分类体系研究[J].情报科学,2001,06:635-638.。1.1特点(1)实用性强。搜索引擎主要是面向用户需求,以学科分类的传统分类法不能满足海量、日益变化的网络信息资源,因此分类更加要求实用性。(2)易用性。搜索引擎是方便用户查询信息的工具,而大多数用户缺乏基本的检索知识,因此中文搜索引擎的分类体系比较简明,操作快捷简单。(3)多维化。中文搜索引擎是根据网状的和立体

5、的网络信息而建立起来的,并且采用了超文本链接技术,把类目与类目之间、类目与主题之间都链接了起来,形成了网状结构,因此,其分类体系具有很高的多维性刘延章,谢琳惠.中文搜索引擎分类体系的特点、问题及其改进[J].郑州大学学报(哲学社会科学版),2002,06:146-148.。1.2评价标准评价标准说明知识覆盖程度覆盖人类知识领域的大小,如学科、行业、专业等类目组织程度类目划分的层次、类目的排列等类名规范程度是否简洁、规范、清晰等结构完善程度是否具备完善结构,如大纲、主表、次表等界面友好程度布局是否合理、界面是否雅观等

6、王亚南.中文搜索引擎分类体系的评价标准[J].河南师范大学学报(哲学社会科学版),2005,05:210-212.2.当前中文搜索引擎分类体系存在的问题2.1知识覆盖领域不全一般说一个中文搜索引擎分类体系质量不高,一般都是说它的知识覆盖率不高,很多搜索引擎网站在分类时总是或多或少的缺乏某个知识领域,这几乎是现有分类体系的通病。一个完整的综合性分类体系在划分基本大类时应该将所涉及到的知识领域全部涵盖进去,而目前一些搜索引擎在划分类目时往往只从商业角度考虑如何吸引用户,并未真正从知识领域、知识体系的角度来分类,因而使得

7、分类体系遗漏掉了许多重要的知识领域,同时又有重复列类的现象,体系的系统性和完整性受到很大影响吴丹.网络信息分类体系设计[J].图书情报知识,2002,05:37-39.。1.1类目体系混乱,结构不完善一般来说,搜索引擎分类体系都有严格的等级体系,但网络信息资源纷繁芜杂、种类多样,所以往往在一些类下同时采用两个或多个标准,以便减少类目展开的层次和增加类表的直接性王小平,刘波.网络信息分类体系研究[J].现代情报,2008,01:64-65+68.。1.2划分标准不唯一,归类不科学中文搜索引擎分类体系的类目没有统一的划

8、分标准,主要表现在划分过宽、划分过窄、划分出的子类级别过高或过低,划分出来的子类仍相交等余义芳.中文搜索引擎分类体系存在的问题及对传统分类法的借鉴[J].图书与情报,2004,03:52-54.。还有许多中文搜索引擎的分类体系都未能严格地按照类目的内涵和外延进行科学地归属类目,只是简单的随意堆集。1.3类名不规范统一,排列随意许多中文搜索引擎在分类过程中采用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。