欢迎来到天天文库
浏览记录
ID:9310187
大小:205.00 KB
页数:34页
时间:2018-04-27
《新闻出版重大科技工程项目中华字库工程申报指南》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、新闻出版重大科技工程项目“中华字库”工程申报指南新闻出版重大科技工程项目“中华字库”工程申报指南一、项目名称新闻出版重大科技工程项目—“中华字库”工程二、项目编号0610-1040BJNF2328三、项目概况“中华字库”工程是引领中华文化步入信息化、数字化时代的先导性、奠基性工程,是列入《国家“十一五”时期文化发展规划纲要》(中办发[2006]24号文件)的重大建设项目。《纲要》确定,“中华字库”工程要“建立全部汉字及少数民族文字的编码和主要字体字符库。重点研发汉字的编码体系、输入、输出、存储、传输以及兼容等关键技术”。“中华字库”工程要在文字学深入研究的基础上,探讨各种文字收
2、集、筛选、整理、比对和认同的方法与原则;充分利用先进的数字化技术,开发相应的软件工具,在统一的数字化平台上,探索人-机结合的文字收集、整理、筛选、比对和认同的操作与管理流程。从数千年流传下来的文字载体中,将尽可能搜集到的古今汉字形体和古今少数民族文字形体汇聚起来,在各种实际文本原形图像的基础上,确定规范形体,标注各类属性,有序地分层级排列,建立字际间的相互联系,并按照出版及网络数字化需求,建立汉字及少数民族文字的编码和主要字体字符库。完成后的“中华字库”,力争达到能满足中华各民族古今各类文献的出版印刷、数字化处理和传输的需要;全面打通信息化的发展瓶颈,满足国家信息服务与监管的用
3、字需求,满足两岸四地间信息的互联互通的需求。使中华各民族文字的使用,中华文明的普及与传播,更加方便和高效。34新闻出版重大科技工程项目“中华字库”工程申报指南“中华字库”工程从任务分配、研发过程到成果发布与维护自始至终将在统一的工作平台上,通过互联网进行。所有的数据要加入该平台管理,所有专家的研究也基于该平台进行。中间结果、最终成果均存储在工作平台的数据库中,并通过工作平台发布。工作平台的核心为资源库,是按标准规范建立起的包括文字属性、原始资源等一系列的相互链接的数据库。工程参与各方从资源调查、数据采集到字符搜集、考订、分集、编码,到字库制作、输入法研发等,都依托于这一平台进行
4、。“中华字库”总体组通过各集成性项目,实现对整个工程学术和技术层面的全面管理和监控。资源库为数以百万计的原文图像、几十亿字的数字文本和源出字形截图分配统一的标识符,将它们有序地存储在不同的数据库中,在专家对比、考证、论定时可及时调出,对应显现。通过逐步积累和完善,最终构建起包括文字编码、字形结构、今古读音、字际关系、字形原图、原始出处等各个子库,相互间可以多重链接。数据库中的各类数据也可以及时扩展和修订。除工程总集和数据管理、系统总集成、工程技术标准制定、字符集整合四项工作属于整体性工程管理和成果管理性质,由总体组或总体组推荐的有关机构承担外,“中华字库”工程本次申报共划分为2
5、3个包实施。四、分包内容简介及申报条件第1包:工作平台研发1.项目简介本项目为研发网络化的“中华字库”工程核心技术平台,为“中华字库”工程提供工作平台研发与系统维护及全过程技术支撑。该平台需要技术先进、配置灵活、安全可靠。本项目研发的工作平台是一个基于互联网的大型应用系统,为项目管理、资源管理提供软件支持,具有分类数据汇总、传输、在线修改以及专家工作台、平台维护等功能。同时,工作平台需要为采集平台、应用平台等“中华字库”研发的软件工具提供接口。本项目包括:34新闻出版重大科技工程项目“中华字库”工程申报指南(1)“中华字库”基础资源库:容量超过100TB的多文种数据库,用于存储
6、“中华字库”的各种资源。(2)管理子系统:项目管理子系统包括:1)任务流程管理功能;2)过程跟踪与管理功能;3)人员管理功能;资源管理子系统应对“中华字库”工程各种资源导入、导出、更新、发布和版本管理及检索服务;未收文字管理子系统建立规范的补字流程。在“中华字库”工程完成后,对社会开放,以便增补新发现的未收字符。(3)专家工作台:专家使用工作平台的操作界面。(4)公共工具开发:公共工具集提供工作平台中可公用的各种工具。2.考核指标(1)基础资源库必须有统一管理、查询“中华字库”的各种资源的不同类型数据的能力;基础资源库容量不低于100TB;具有支持不少于1000用户同时进行资源
7、库查询、检索的并发处理能力;(2)管理子系统应具有不少于1000用户同时操作的并发能力;(3)专家工作台应能处理本工程的所有文字,包括各类汉字和少数民族文字;3.项目特点与难度(1)工作平台时效性强,要求在项目启动后12个月内完成具备基本功能的稳定运行版本。全部研发工作应在项目启动后18个月内完成。(2)基础资源库存储、查询、检索的数据涉及文字,图像、软件等,类型多,数据量大。(3)工作平台与工程其他包研发的软件接口多,数据交换复杂。(4)专家工作台需要处理的文字包括古今汉字、少数民族文字,
此文档下载收益归作者所有