6 应用系统设计技术线路

6 应用系统设计技术线路

ID:1353092

大小:373.00 KB

页数:13页

时间:2017-11-10

6 应用系统设计技术线路_第1页
6 应用系统设计技术线路_第2页
6 应用系统设计技术线路_第3页
6 应用系统设计技术线路_第4页
6 应用系统设计技术线路_第5页
资源描述:

《6 应用系统设计技术线路》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、6应用系统设计技术线路选用拥有自主知识产权的“清华同方”kbase非结构化数据库系统作为底层。对所建设内容通过使用清华同方的TPI4.5建库与发布系统作为底层可实现。实现分项功能时:6.1数据库制作发布系统资源建设都有属于自己有特色的一些数据需要建立特色数据库,例如内部资料、行政公文、人事档案、会议纪要、科研成果、设计文档等等。TPI提供的数据库管理工具可以让用户来建立、维护自己的特色数据库。TPI数据库管理工具还提供了大量针对不同类别资源的数据库模版,供用户直接使用,用户也可以对模版中的字段进行增删改,以适应自身的需要。TPI数据库管理工具还提供了“多导航”的支持,多导航的

2、好处在于用户可以根据自己的需要,在同一个库中以不同的分类需求快速定位信息,如“馆藏资源”库,我们既可以按照中图法对图书进行分类,也可以按照学科分类的方法来进行分类,这样就可以在“馆藏资源”库中建立“中图法”和“学科分类”两个分类,用户就可以根据自己的习惯更加方便的在两个分类中进行切换,更好的进行浏览和检索。6.2元数据标引分类检查实现元数据的标引和分类。数据标引完成电子书元数据录入、修改和入库。数据标引工具支持Word文档、nh文件、html文件、kdh文件、txt文件等文件类型的标引工作。采用可视化操作,直接从原文中选择需要的内容,操作简单、直观。通过TCP/IP与FTS服

3、务器相联接,实现分布式的并行数据加工。元数据标引的主要功能包括:登录服务器、查看记录、数据标引和设置选项。6.3数据迁移工具TPI支持大部分常见的数据库格式,从而使您可以将现有的不同格式的数据库中数据导入TPI数据库中,这样您就不用担心现有的数据如何使用一种工具就可管理和发布了,TPI对CNMARK、ODBC、EXCEL、DC、ACCESS、XML、TPI、CALIS、自定义文本等格式都支持。6.4纸质资源数字化加工(电子书加工工具)Bookshop是清华同方知网(北京)技术有限公司自主研发的电子书加工工具。通过该工具可以把书籍、报刊、公文等各类纸张文档,通过书页扫描、书页图

4、像处理、目录树编改、书页压缩等过程简单快速地形成电子书籍。也可以把已有各种电子文件,例如WORD、PDF、HTML、PS、S2、S72、PS2、PSD、TXT等,通过本公司自主研发的打印驱动转化为电子书籍。Bookshop尤其支持各类纸张文档加工成电子书的全过程。其中包括书页图像扫描及管理、书页图像处理、书页图像识别导入及编改、目录加工处理、书页图像及目录合并形成电子书。为适应大规模图书加工业务,该工具对部分工艺还设计了批处理工作方式,用于电子书流水线加工。Bookshop为书籍电子化提供了一种快捷、方便、高效的全面解决方案。6.5KBASE全文检索服务器清华同方KBase全

5、文数据库管理系统(简称KBase)是以管理海量的文本、网页、档案、文献、办公文档等非结构化数据为主,具备中文智能信息处理能力的国产数据库管理系统。KBase具有优异的全文检索性能和强大的海量非结构化数据存储管理能力,拥有超过400万词汇量的、大百科式的概念关系词典,具备业界领先的中文智能信息处理能力。KBase是清华同方在承建中国国家知识基础设施(CNKI)这一国家级大规模信息化工程的过程中,依托清华大学科技和人才优势,厚积薄发自主研发而成的。KBase作为CNKI工程的运营支撑平台,管理着目前全球最大的中文知识信息资源数据库,每天提供千万人次的信息检索服务。同时,KBase

6、已成功应用于包括欧美发达国家在内的全球5000多家机构用户,其优异的性能和稳定性,受到用户的一致好评。KBase解决了非结构化信息处理的基本问题,可用于任何处理非结构化信息的行业应用,如数字图书馆、数字档案馆、电子政务、企业搜索、知识管理、内容管理、情报分析、互联网不良信息监控、信息资源开发利用、门户建设等等。6.1.3.5.1.主要特点5.1.3.5.1.1.高效、准确的全文检索KBase全文检索速度高达500G/S,处于业界领先地位。同时,KBase基于先进的高维索引技术在国际上首次将相似检索功能真正做到了实用化水平:速度高达百万级文献量毫秒级响应。KBase集成先进的全

7、切分切词算法,很好地解决了歧义切分问题,可将“原子结合成分子”正确地切分成“原子/结合/成/分子”而不是“原子/结合/成分/子”,从而使KBase与同类产品相比具有更高的查准率、查全率。6.1.3.5.1.2.海量非结构化数据管理KBase具有强大的海量非结构化数据存储管理能力,单表管理的记录数可达40亿,单表管理的数据容量可达TB级(分区表可达PB级)。KBase同时支持多机群集,实现数据的分布式存储。KBase作为CNKI工程的运营支撑平台,目前管理着全球最大的中文知识信息资源数据库,每天提供千万人

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。