索引和知识发现

索引和知识发现

ID:18722477

大小:114.00 KB

页数:13页

时间:2018-09-19

索引和知识发现_第1页
索引和知识发现_第2页
索引和知识发现_第3页
索引和知识发现_第4页
索引和知识发现_第5页
资源描述:

《索引和知识发现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、索引与知识发现史睿    古籍是中国历史文化遗产最为重要的物质载体,面对蕴藏于浩如烟海的古籍之中的文化思想,究竟应该如何解读,如何履践,不免令人有“一部十七史,不知从何说起”的感觉。胡适之先生认为传统的经史研究存在范围太狭窄,注重功力而忽略理解,缺乏参考比较的材料等积弊,故以清代三百年间第一流人才的心思精力,都用在经学的范围内,却只取得了一点点的成果,关键是缺少对古籍的系统整理,又不注重学术成果的积累,两千四百多卷的《清经解》,大多是一堆流水烂帐,没有条理,没有系统,人人从“粤若稽古”、“关关睢鸠”说起,怪不得学者看了要望洋兴叹了。针对清儒治学方法的缺陷,胡适之先生着重

2、提出,必须系统地整理古籍,包括索引式、结帐式和专史式的整理。此后,学界编纂了多种引得、通检、索引、年表等检索工具,部分完成了索引式整理的目标,拜前辈学者之赐,我们享受了检索知识的诸多便利。回顾国立北平图书馆(今国家图书馆)的历史,不难发现编制索引、目录等检索工具始终是一项重要工作内容,很多传世之作,如《清人文集篇名分类索引》、《石刻题跋索引》、《中国善本书提要》等都是出自国立北平图书馆学者之手。今天,传统索引仍然具有不可替代的知识管理特性,能与最前沿的数字图书馆技术结合,我们要将它的优势与数字图书馆这个新媒体的特性结合,把古籍的索引式整理工作做得更加深入,更加出色。索引

3、,乃至一切传统检索工具,本质上都是揭示人类知识内在关联的某种方式,而且完全符合人类的认识习惯,其性质正是数字图书馆所应具备的特性,彻底研究索引的知识扩展和知识管理功能,能给我们带来极大的启示。未来数字图书馆中,只有借助索引的知识扩展和知识管理的思路和特性,才能构建信息时代人类知识的新体系,探索实现知识发现的新方案。本文旨在探讨数字图书馆发展新趋势与传统索引的关联,索引的标引、编制和知识管理对于数字图书馆知识管理的启发,以及探索利用传统检索工具实现知识发现的方案。    一、 数字图书馆的定义和发展趋势  数字图书馆的定义千奇百怪,聚讼纷纭,我们认为必须从数字图书馆的功能

4、入手才能切中肯綮,即凡是以知识管理方式实现知识发现功能的数字典藏才是真正意义上的数字图书馆。数字图书馆应该是以人类可理解的基本信息为单位,以知识自身逻辑为线索进行管理知识获取的网络媒体,是国家知识基础设施的组成部分。国家知识基础设施(National Knowledge Infrastructure,简称NKI)是应用计算机及网络存储和传播人类知识、经验和智慧,改变人类知识获取方式的全新体系。数字图书馆的使命是提供获取有用的知识、管理知识、充分利用并共享知识的新渠道,并提高获取有用的新知识的效率,缩短新知识转化为一般社会常识的周期。  图书馆是建构人类知识体系的重要机构

5、,研究人类知识的构成及其内部联系是图书馆学研究最为重要的课题,无论古典目录学还是现代图书馆学,都以此为题中应有之义,人工智能研究更结合哲学、数学、语义学和计算机技术,试图模拟人类的认识、加工、分析知识的过程,逐渐形成重要的前沿学科。但是我国图书馆学界历来重视研究目录著录和机读目录格式,对于知识管理的研究却比较滞后,这必然严重阻滞我国的图书馆学理论研究和数字图书馆建设的发展。我们应当利用后发优势,建立知识库(Knowledge base)为基础的数字图书馆模型,以数据挖掘(Knowledge Discovery in Database,简称KDD,又称知识发现)技术,促进

6、知识、经验和智慧的有效积累、社会共享和社会转化。数据挖掘技术是实现数字图书馆功能的必要技术手段,数据挖掘又称数据库中的知识发现,是指从大量数据中提取出可信的、新颖的、有效的并易于理解的知识的高级处理过程。这必将大幅度地提高我们学习、研究中国古代文化的效率,将学者的时间和精力从艰苦而繁琐的爬梳、翻检工作中解放出来,开拓新的学术领域,推动人文学术研究的发展。  知识库不同以往所作的任何单个数据库(Database),也不是多个资源库的叠加。数据库里储存的是数据,而知识库收集知识,收集的方法就是将分析数据的逻辑、思维的流程、或一个重要个案的完整记录,知识库里的信息会成为将来研

7、究的重要指标。知识库以知识体系为核心组织全部信息,底层是具有严格规范控制的各学科关键词,这是支撑全部知识库的基础(见知识库架构示意图)。它不仅是实现数据挖掘和无缝链接的必要支撑,也是全部知识互相联系的必要桥梁。在文史领域内,具有规范控制的索引已经形成了完整的体系,而且有大量的经典之作,可以作为知识库建构知识的依据。这些索引所提供的规范关系是一种社会公共知识,我们以这些知识为线索建立起应用数据库,把从不同文献抽取的各学科的关键词联结成完整的知识体系。这如同用一条线把珍珠连成项链一样,其价值自然大幅度提升。        实现知识发现的方式有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。