数据库研发状况及面临的挑战

数据库研发状况及面临的挑战

ID:39711948

大小:3.64 MB

页数:69页

时间:2019-07-09

数据库研发状况及面临的挑战_第1页
数据库研发状况及面临的挑战_第2页
数据库研发状况及面临的挑战_第3页
数据库研发状况及面临的挑战_第4页
数据库研发状况及面临的挑战_第5页
资源描述:

《数据库研发状况及面临的挑战》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、我馆数据库研发状况及面临的挑站张文举数据库研究与开发部2010年5月我馆数据库研发状况及面临的挑战部门任务及工作情况我馆数据库研发历程与现状发展思考我馆数据库研发状况及面临的挑战1.研究开发医学文献信息数据库。2.开发医学文献信息工作相关应用软件。3.组织完成现有文献数据库产品的数据生产、销售和售后服务工作。4.承担馆藏文献的数字化。数据著录选择所需字段和内容、分篇部门任务及工作情况日常工作一(CMCC/CMCI产品生产)数据上传对扫描后的数据上传到流水线数据扫描1280种中文刊、400种外文刊扫描期刊登到入库数据登到、著录制作产品上传产品库和引文平台

2、格式规范格式规范、备份、归档校对编辑识别后的内容进行校对和编辑入库文字识别对所选内容进行文字识别数据转换处理后的数据进行格式转换部门任务及工作情况日常工作二(疾病系列库产品生产)数据规范对数据按照标准进行规范标引数据扫描文献扫描、识别和编辑数据选择选择产品所需内容数据链接与疾病数据的数据链接格式规范格式规范、转换、PDF制备证据规范依据循证医学要求加以规范化处理循证证据循证证据遴选发展思考数字化加工流程处理版权选定文献被选文献文献结构分析及标注元数据加工(描述性结构性)元数据加工(技术性)扫描图像制作元数据扫描OCR识别TIFsOCR文本打包文件系统全

3、文检索网站翻页应用数据库所挑选文献的结构需求图像制作上传、检索无扫描价值的文献期刊管理:合订本、逻辑卷、期、文章、其他文献数字化加工流程部门任务及工作情况日常工作三(软件保障)保障流水线生产的正常进行;及时解决产品生产流程中出现的问题;开发新的产品。部门任务及工作情况日常工作四(产品销售和用户服务)产品类型:CMCC网络版CMCC单机版CMCI网络版CMCI单机版 现有用户95家部门任务及工作情况日常工作五(新产品开发)根据市场需要开发新的产品第三阶段2007年开始研发CDD系列数据库产品。第二阶段2003年研发了CMCI数据库产品。第一阶段1994年

4、研发了CMCC、CMAC数据库产品;数据库研发历程与现状我馆数据库研究与开发建设经历了一个由点到面、由量到质的发展历程,分三个阶段:数据库研发历程与现状1994年我馆启动了中文生物医学期刊文摘数据库(ChineseMedicalCurrentContents,简称CMCC)。收录期刊1300种,累积文献记录450万篇,半月更新。2003年中国生物医学期刊引文数据库(CMCI),以CMCC参考文献为数据来源、以CMCC文献为引证来源而建立的姊妹数据库。月更新,累积引文数据1200万篇。2007年中国疾病知识库(CDD)研发成功。其系列数据库范围逐年扩大。

5、目前已涵盖了9个数据库模块。该系统的研发过程是探索图书馆传统知识组织方法向新的知识组织方法转变的过程。数据库整合系统的研发。整合系统是指将我部门现有的各种数据库系统(同时新增了馆藏外文期刊检索系统)整合在一个平台上,为用户提供不同层次、不同类型的医学知识服务和中外文全文传递服务。2009年CMCC的参考文献作为CMCI数据来源CMCC作为CMCI的引证来源肿瘤治疗中缓控释制剂的应用及研究进展数据库研发历程与现状形成一套数据加工流程和管理流程。积累了较为丰富的数据来源,尤其是传统数据源方面具有非常的优势。在数据规范和加工、数字化加工、数据存储、数据制备等

6、方面具有很好的经验。对数据库设计原理、设计规划、需求分析和需求设计、数据库逻辑设计和物理设计及数据库维护等方面具有相当的优势。数据库研发历程与现状缺乏长远的战略思考,面对复杂局面,显得素手无策。缺乏对研究的支持力度,更注重眼前效益或经济效益。缺乏一支过硬队伍。体制和机制均与现实有着很大的差距。数据库CMCC产品已经到了举步维艰的地步。数据库研发历程与现状数据库发展思考根据knowledgebid的报道,世界新增信息总量1992年为2132238TB~3212731TB2002年为3416281TB~5609121TB2006年在6869341TB~11

7、278629TB之间。信息环境变化发展思考过去50年产生的科技数据相当于过去5000年的总量,2006-2010年文献将翻6倍;(SourceIDC2007)九五期间科学家用于获取科学数据经费达240亿元。社会科学研究课题中约30%经费用于书刊资料收集;(自然基金会)2006年Google搜索80多亿网页,超过10亿张图片没有任何一所图书馆可以收藏所有这些资源。信息环境变化发展思考网络文献是立体、多维的网状结构,由节点、链、网络组成;网络信息的权威度、客观性、时间性、完整性、可信度难以保证;数字对象成为信息组织、存储、访问、管理的基本单元(流媒体对象,

8、复合数字对象);数字环境下信息获取,强调的是资源探索。图书馆面临被淡化的危险!信息环境变化发展

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。