爱如生数据库与翰堂典藏数据库的对比

爱如生数据库与翰堂典藏数据库的对比

ID:5777538

大小:33.00 KB

页数:6页

时间:2017-12-24

爱如生数据库与翰堂典藏数据库的对比_第1页
爱如生数据库与翰堂典藏数据库的对比_第2页
爱如生数据库与翰堂典藏数据库的对比_第3页
爱如生数据库与翰堂典藏数据库的对比_第4页
爱如生数据库与翰堂典藏数据库的对比_第5页
爱如生数据库与翰堂典藏数据库的对比_第6页
资源描述:

《爱如生数据库与翰堂典藏数据库的对比》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、爱如生数据库与翰堂典藏数据库的对比一.简介爱如生数据库:爱如生数据库包括中国方志库,中国谱牒库,中国丛书库,中国类书库,中国俗文库,中国经典库,敦煌文献库,申报数据库以及《中国基本古籍库》。各据善本,采用爱如生独有的数字再造技术制作,还原式页面,左图右文逐页对照,眉批、夹注、图表无障碍显示;毫秒级全文检索,可编辑、下载和打印。其中,中国基本古籍库——由四个子库构成:哲学库、史地库、文艺库、综合库,共20大类,收录自先秦至民国历代典籍1万种,17万卷,版本12500个、20万卷,全文17亿字、影像1200万页,数据总量约320G。翰堂典藏:《翰堂典藏》古籍数据库是由北京时代瀚堂科技

2、有限公司推出的核心产品,其采用基于Unicode四字节编码和自然语言全文检索的典籍文献数字化构建。《瀚堂典藏》古籍数据库由14个子库构成:小学工具、类书集成、出土文献、中医药文献、经部集成、史部集成、子部集成、集部集成、古典戏曲、古本小说、佛教典籍、道教典籍、敦煌文献、专题文献。《瀚堂典藏》加工入库的图书自先秦至民国,从甲骨文到近代文献约有10190种,图片数量约1200万张,文字总量超过15亿字,可全文检索和连续图文对照阅读的记录条目1500万条以上,并持续定期增加中。VI二.收录内容及标准《中国基本古籍库》所收历代典籍及所附重要版本,均经严格筛选。1.收书标准:历代名著,各学

3、科基本文献,有拾遗补阙意义的特殊著作;2.选本标准:完本而非残本、现存最早之本或晚出精刻精钞精校本;未经删削窜改之本。《瀚堂典藏》1.收书标准:⑴加工小学工具类,包括古代字书、韵书等瀚堂具有加工和管理优势的图书。这类图书是《瀚堂典藏》全库的基础;⑵由于瀚堂典藏可以依据用户的要求安排加工种类和进度,也可根据用户的科研要求调整入库品种。2.选本标准:尽量多收集不同版本的图书,力争收录所有公开影印出版的唐五代写本和宋元珍本。三.检索方式《中国基本古籍库》提供4条检索路径,并提供模糊匹配:1.分类检索,通过库、类、目的树形结构进行定向检索;2.条目检索,限定书名、时代、作者、版本、篇目等

4、条件进行目标检索;3.全文检索,输入任意字、词或字符串进行爬梳检索;4.高级检索,可以进行多次检索,或组合字词进行逻辑检索,或综合选项进行关联检索,可以保存最近一次检索结果。VI基本古籍库的二次检索与一般数据库的二次检索稍有不同,并不是将检索结果进行二次检索,而是将第一次检索的词与多次检索词进行组合检索。《瀚堂典藏》的检索限定词包括全文、出处、标题、书目,有三种检索模式:1.绝对精准模式,不对检索条件启动任何转换处理,完全按照输入词条进行检索;2.精准模式,启动简繁体和常用异体字自动转换;3.模糊模式,启动人工智能分词检索功能和简繁体、异体字自动转换。在检索过程中,可以在左侧“书

5、目树”中选择库、类、书目录,以缩小检索范围,并且可以二次检索、跨库检索,也可以选择某本书进行内容检索。如果注册个人用户,可以保存10次的检索式,方便读者使用。相同:虽然两个数据库的检索界面不同,但是检索方式基本相似,都能够对检索词进行智能模糊匹配,检索的准确率及相关率也是很高的四.使用比较《中国基本古籍库》1.VI使用时要求必须下载安装客户端,因此可以使用一些个性化的工具,但是安装客户端比较麻烦,查看内容的时候是全屏显示,使用者要做其他操作时会略有不便1.在使用细节方面,《中国基本古籍库》可以繁体字与简体字进行转换,这种转换虽然符合现代人的识字习惯,但是繁简要自由转换,暂时没有技

6、术手段保证不出现错误。2.可以将查看内容与图书原版的图像进行对比,这样就可以减少错误,同时也可以通过图书的原版图像查看到一些无法识别的字。3.该库还自带常用字典,可查询所收录典籍中常用字的发音和释义4.中国基本古籍库》还可以改变背景颜色、增加列线、将文字从竖排改变成横排,并且可以对原文增加标点批注以及书签,可自动收藏并分类管理以前查阅的信息,方便归纳研究。《瀚堂典藏》1.采用浏览器/服务器模式,对系统及浏览器无特殊要求和限定,使用时不需要安装客户端及特殊浏览器,直接使用IE浏览器查看,比较方便。2.可以将内容与原版进行对比查看,正文为了适应当代人的阅读习惯自动排版为横排,每周对数

7、据更新校勘,因此差错率非常低,能控制在1/10000以内。3.在查看全文的时候,自动将原版书图像与内容对照。并且该数据库利用UnicodeVI四字节编码技术基本解决了生僻汉字在计算机平台上无法录入、显示、编辑的难题,从根本上彻底突破了古籍整理和研究中生冷僻汉字数字化的瓶颈,因此只要使用时安装宋体-扩展字符集,就可以查看到所有的生冷僻汉字,极大地方便了使用者。这一点是其他古籍数据库无法办到的。在原文文献下载方面相同:《中国基本古籍库》和《瀚堂典藏》都可以检索后找到相应文献,并对其进

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。