浅论我国年鉴全文数据库的现状和改进策略论文

浅论我国年鉴全文数据库的现状和改进策略论文

ID:25104522

大小:54.50 KB

页数:7页

时间:2018-11-18

浅论我国年鉴全文数据库的现状和改进策略论文_第1页
浅论我国年鉴全文数据库的现状和改进策略论文_第2页
浅论我国年鉴全文数据库的现状和改进策略论文_第3页
浅论我国年鉴全文数据库的现状和改进策略论文_第4页
浅论我国年鉴全文数据库的现状和改进策略论文_第5页
资源描述:

《浅论我国年鉴全文数据库的现状和改进策略论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、浅论我国年鉴全文数据库的现状和改进策略论文.freel;KI的年鉴全文库目前提供检索的年鉴共1301种,约8000卷(截至2007.11.21)t副。它们收录年鉴的类型分布如表1所示:两大数据库的销售方案也有所不同,Apabi可以按需选购年鉴品种,而KI则把所有年鉴打包销售。3年鉴全文数据库现有功能分析目前两大年鉴全文库都打破了印刷本年鉴的固有结构,突破了电子书传统的浏览模式,实现了跨年鉴、跨年卷、以条目为单位的整合检索,一定程度体现了年鉴资源的特点,检索系统也更符合用户利用年鉴的特征。3.1年鉴整刊导航年鉴整刊导航应当完整、有序地揭示数据库收录的年鉴品种,并提供收录年鉴品种检索、选定年鉴

2、中条目检索的功能。目前两大数据库的年鉴整刊导航功能如表2所示。Apabi特别列出了长三角、黄河流域等专题年鉴品种导航,并专列了“发展报告”类。在整刊全文浏览功能中,Apabi除提供网页文本格式的原文外,还提供原书版式文件全文,以便读者核对重要信息,避免文本误录人造成的影响。3.2检索性能两大年鉴库都提供初级检索与高级检索途径,KI还设置了专业检索。它们具体提供的检索字段、条目类型限定及可用检索技术如表3至表5所示。3.3结果处理功能结果处理功能是系统检索功能的延伸和补充,强大的结果处理功能可以使用户快速筛选信息,便捷地扩展相关信息,有事半功倍之效。目前这两大数据库的结果处理功能如表6所示。

3、3.4全文显示格式KI的年鉴文本、表格和图片均为PDF格式,不便于用户利用表格和图片。Apabi的年鉴文本都为纯文本格式,表格目前部分统计年鉴的表格为Excel格式,其他表格均为JPG格式,图片是具原图色彩的JPG格式。4年鉴全文数据库存在的问题与改进策略针对年鉴信息的特点,结合信息裣索技术,当前的年鉴全文库还有不少问题有待改进。4.1信息及时性有待加强信息的及时性是年鉴全文库在内容上保持吸引力的要素之一,包括年鉴新品种的及时收录和年鉴信息的及时更新两方面。但遗憾的是,目前年鉴全文库通常信息时差总要在印刷版出版后半年以上。增强信息的及时性,一方面要把新出版的、质量较好的年鉴新品种及时增加到

4、数据库中,如《中国企业文化年鉴》等;另一方面,对已收录的年鉴应及时更新信息,缩短信息时滞。数据库应与年鉴社充分沟通,最好在年鉴编纂完成、付印之前,就直接把数字化的新信息倒人数据库中。尤其是对一些数据、图表、事件、动态等时效性较强的内容,年鉴社可能每隔半年或一季度就会收集新的数据,数据库应随时将这些新收集齐但未正式出版的信息转人年鉴库,并通过设置“最新更新”栏目、RSS订阅等功能,及时告知用户更新信息。这样就可以在第一时间实现信息的动态更新,把年鉴信息的年度性提升到动态性。4.2检索性能应更契合年鉴的特点目前年鉴全文库的检索系统基本上是仿照期刊全文检索系统开发的,只是增加了一些针对年鉴的字段

5、和信息类型限制,这还不足以体现年鉴信息的特点,与读者的检索需求尚有一定的距离。近年来,包括自动摘要、自动分类、相似性检索乃至视频与图像内容检索的内容挖掘技术成为新的发展热点,年鉴数据库急待引人这些技术,而这些技术的基础则是对数据特征的详尽标引。因此,数据库首当其冲的是应针对不同类型的信息作更为详尽的标引,设定不同的可检索字段,以便为进一步的内容挖掘打下基础。例如,对机构名录信息应根据其属性要素,对机构名、法人、电话、传真、地址、邮编、e—mail、所属地域、机构性质、单位简介等进行标引;对人名录则主要包含人名、性别、生卒日、籍贯、工作单位、部门、职务、职称、简历、人物类型(先进、领导、专业

6、奖项获得者等)、从业类别等属性的标引;对大事记部分,现有的年鉴全文库都是不加分割地作为完整的文献单元处理,连最简单的检索某日各地发生的重大事件都不可能,因此应以独立的事件为单位,用数据库的结构提取时间、地点、所属地域、事件内容等相关信息提供检索,并按单独的事件为单位输出检索结果,而不是输出整篇大事记的全文;对法律法规类信息应提取其特有的法律法规的级别、颁布部门、颁布年、实施年、发文号等属性供用户检索;对图像应建立基于图像内容的索引库,提供图片内容特征的搜索;对统计表应进行统计指标、表头的标引,甚至有能力的话,还可以加强对统计表的标准化处理,提供具体的数值检索,充分体现数字信息检索的优势,发

7、挥年鉴统计数据的价值。同时,系统应在详尽标引的基础上,对以上信息类型设置专类信息检索功能,提供针对各类信息的检索字段,提高信息检索的精准度。4.3检索结果后处理能力不强(1)年鉴全文库现有的二次检索没有提供逻辑算符的选择,只能进行逻辑“与”的二次检索,这不便于用户进一步调整检索策略。(2)对于年鉴全文库而言,由于条目数量巨大,检出记录数往往较多,因此特别需要对检索结果作进一步的分面和聚类。但目前的年鉴全文库都没有提供检索

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。