主题数字博物馆信息分类系统的研究

主题数字博物馆信息分类系统的研究

ID:18361527

大小:3.76 MB

页数:86页

时间:2018-09-16

主题数字博物馆信息分类系统的研究_第1页
主题数字博物馆信息分类系统的研究_第2页
主题数字博物馆信息分类系统的研究_第3页
主题数字博物馆信息分类系统的研究_第4页
主题数字博物馆信息分类系统的研究_第5页
资源描述:

《主题数字博物馆信息分类系统的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、主题数字博物馆信息分类系统的研究第三章主题数字博物馆中信息分类系统体系的构建随着社会经济和科学技术的发展,人们可利用的信息量急剧增长。面对大量的信息,如何识别和组织这些信息以及如何快速、准确、直观地定位所需信息,成为有效管理和合理利用信息的首要问题,而对信息进行科学的分类是解决这一问题的前提和关键。主题数字博物馆的主要功能就是提供与主题相关的各种信息,而这些信息又包含许多基本的数据,例如一本书、一篇报告、一幅图片或者是一段视频记录等,它们可以被看作是主题数字博物馆的资源核心。所以对主题数字博物馆中的信息进行分类,也就是对这些资源内容的分类。本章主要针对主题数字博物馆的信

2、息分类问题进行了研究,构建了主题数字博物馆中信息分类系统的体系结构模型,并对其进行了详细阐述。3.1体系结构模型根据主题数字博物馆的相关特性,本章构建了主题数字博物馆中的信息分类系统体系结构,如图3.1所示。在该体系中,信息分类系统主要包含信息组织、信息分类和信息展示三大功能模块。信息组织模块:对采集到的原始数据进行预处理和结构化,按照信息分类的要求对其进行组织,形成元数据库和数字对象库口信息分类模块:在信息组织过程中将资源信息由元数据和数字对象进行组织,再对这些元数据和数字对象进行分类。首先依据文本分类技术将元数据文本进行分类,然后将元数据的类别信息赋予相应的数字对象

3、,从而达到对资源信息的分类。信息展示模块:将分类结果信息以友好的形式展示给用户,根据分类结果信息,对元数据库和数字对象库建立相应的索引,有效地支持分类结果信息的快速浏览及搜索处理。对用户享有的权限进行管理,用户根据其权限对这些信息进行浏览或者再检索。系统实现过程如下:采集来的待分类信息经过标准化处理之后,将由元数据和数字对象对其进行组织。其中,元数据由元数据管理器来进行组织和管理,并存放到元数据库中;数字对象由数字对象管理器来进行组织和管理,并存放到数字对象库中。依据句柄t"t(handle)信息分别给元数据和数字对象建立所在库中的存储地址索引,并将其存储于索引库中,供

4、Web服务器直接访问。对数字对象的分类,将借助于对其进行描述的元数据文本,通过元数据文本分类器对这些元数据文本进行分类之后,将给元数据加类别索引,并存储于索引库中。在浏览分类结果信息时,从索引库中找出某一类中包含的所有元数据句柄,并根据句柄所对应元数据在元数据库中的存储地址,从库中将元数据取出并以某种形式显示给用户:根据索引库中该句柄对应的数字对象存储地址,从库中将对应数字对象取出并以某种形式显示给用户。摘要主题数字博物馆中的信息具有异构性、多样性及大数量等特点,目前对主题信息资源的分类主要是由领域专家结合领域知识来完成,如何通过计算机对其进行自动分类是目前有待解决的一

5、个难题。本文以主题数字博物馆为基础,对其信息分类系统进行了研究,其目的是为了对主题资源进行有效组织,以及使领域专家和主题爱好者能够更有效、直观、准确、快速地获取某主题信息。本文主要进行了以下几方面工作:首先,本文在分析和研究主题数字博物馆信息资源的基础上,针对体系的可扩展性、互操作性以及运行效率几个关键问题,设计了一种主题数字博物馆的信息分类方案,并构建出了一个适合主题数字博物馆信息分类系统的详细体系结构。其次,本文对主题数字博物馆信息分类体系的核心部分—元数据文本分类器的关键技术问题进行了研究:提出采用领域中的主题词汇对文本进行向量表示的方法,其作用是避免因为传统中文

6、词语切分方法的差异而导致分类效率的降低;提出对文本特征向量进行两次缩减的方法,以弥补传统的采用一种特征缩减方法的不足;提出在对元数据文本进行具体分类时,对其元素采用不同的权重参数,以避免对所有文本特征平均用力,从而提高分类准确率;设计了元数据文本的详细分类流程。最后,以敦煌学数字博物馆遗书元数据文本为语料,对所设计的元数据文本分类器进行了验证,实验证明经过针对性改进之后的元数据文本分类器,其分类准确率得到了提升。关键词:元数据;主题数字博物馆;体系结构;文本自动分类;特征选择国家科技部社会公益专项资金资助项目:敦煌文物保护数字化研究〔项目编号:2001DIB10060)

7、AbstractHeterogeneity,diversity,andhugequantityarethecharacteristicsoftheinformationinfocuseddigitalmuseum(FDM).Atpresent,theclassificationofinformationresourcesinFDMiscarriedoutbyspecialistsinthefieldbasedontheirexpertise,andautomaticclassificationbycomputerisstilladiffi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。