欢迎来到天天文库
浏览记录
ID:12099798
大小:548.55 KB
页数:27页
时间:2018-07-15
《数字内容管理知识点总结》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、《数字内容管理》复习内容【】内的为补充内容0002CY一、名词解释1.数字内容:内容指各种形式的文本、图像、声频、视频、动画、软件等单媒体或多媒体信息。数字内容来源:传统信息资源的数字化;原生的数字资产2.数字内容管理:20世纪90年代出现的,以数字内容的获取、存储、管理与重复利用为目标,主要应用于新闻、出版、印刷、文化传媒产业等诸多涉及媒体内容服务的行业和领域。1.不同系统间的数据转换;2.数据的任意组织;3.跨媒体出版;【数字资产管理,简称为DAM,它是数字化存储与管理的工具,并已成为网络时代个人、工作团体、部门、公司等提供更方便的存储、检索、索引、恢复、修改的工具,即对数字
2、资产进行有效地组织与管理。】3.元数据:关于特性信息的信息,描述资源的结构化信息简单的说就是“关于数据的数据”,即关于数据的内容、质量、状况和其他特性的信息。也可以译为描述数据或诠释数据。包括两个方面的内容:(1)体内部元数据处理媒体内信息的解释(2)体相互间元数据处理多个媒体和他们相互关系信息的解释。4.编目:对信息资源的形式及内容特征进行分析、选择和记录,然后再将这些描述信息按照一定的规则有序地组织起来。按照一定的标准和规则,对某范围内文献信息资源每种实体(Item)的外部特征和内容特征进行分析、选择、描述,并予以记录成为款目,继而将款目按一定顺序组织成为目录(Catalog
3、ue)或书目(Bibliography)的过程。【编目的作用:有利于信息的有序化和系统化;有利于信息检索和信息的再利用;有利于数据交换和信息资源共享。】5.分词:又称切词,是将连续的字序列按照一定规范重组成有意义词的分词序列的过程。词是语言中最小的能独立运用的单位,也是语言信息处理的基本单位。分词是指根据某个分词规范,把一个“字”串划分成“词”串。6.语料库:存储语言材料的仓库现代的语料库是指存放在计算机里的原始语料文本或经过加工后带有语言学信息标注的语料文本。【真实语料:包括语言词与言语词;加工语料:分词与词性标注;机器处理与人工干预共同作用的产物。语料库中存放的是在语言的实际
4、使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源。】7.XML:SGML(StandardGeneralizedMarkupLanguage,标准的通用标记语言),它是一种元语言(MetaLanguage),利用它可以定义其它无数种语言;XML(eXtensibleMarkupLanguage,可扩展的标记语言),是SGML的一个子集,用来定义数据结构,用于在电子商务系统中传输大规模的数据;非常适合Web传输。XML提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。8.资源描述框架:X
5、ml及其扩展提供了强大的构建结构和处理元数据的概念和工具,然而xml没有提供数据模型或者元数据参考模型。为了使用xml来处理和交换元数据,就需要定义这些模型,以MPEG-7为例,它使用了XSD(xmlschemadefinition)的扩展版本,因此,定义资源描述框架(RDF,resourcesdefinitionframework,RDF),用来表示万维网上的资源、简化交换、文档翻译以及元数据。RDF是处理元数据的基础,它为在应用程序之间交换机器可理解的网络数据提供了可互操作性【作用:数据描述模式而且采用基于XML的句法;提供语义、结构、句法三个层次的互操作能力;模块化的互操作
6、能力;有些数据化信息需要不同的元数据描述,RDF对集成这些元数据非常有用;】9.标引:国标定义:对文献进行主题分析,从自然语言转换成规范化的检索语言的过程。n具体而言:在主题分析的基础上,以一定的词表或标引规则作为依据,将信息资源中具有检索意义的特征转换成相应的规范词,并将其组织成表达信息资源内容特征的标识的过程。n实质:按文献的内容特征对其进行主题分析与用词转换。n实施:标引是主题分析与用词表达两个步骤的结合,标引质量直接影响到检索【标引质量的衡量:穷举度(网罗度):标引中确认文献所有主题的程度。穷举度高,提高查全率。n一致性:不同标引人员或同一标引人员在不同时期,对同一主题文
7、献标引时,对其主题归属的一致程度。一致性强,提高查准率。】10.索引:一种能加快定位速度的有效方法。索引项:一个索引项中有关键词值和指针,通过指针就可找到含有此关键词值的记录。多个索引项就构成了一个索引(表)。索引本身也是一个文件,当索引很大时,也可将其分块,建立高一层的索引。如此继续下去,直到最高级索引不超过一个块时为止,这样就得到了一个多级索引结构。【索引树:对各级索引可采用定长记录固定组块的方式,并可对索引进行再索引,层层上去,直到最高级索引不超过系统规定的一个块的大小为止
此文档下载收益归作者所有