标段一工作说明书内容

标段一工作说明书内容

ID:33860455

大小:53.00 KB

页数:3页

时间:2019-03-01

标段一工作说明书内容_第1页
标段一工作说明书内容_第2页
标段一工作说明书内容_第3页
资源描述:

《标段一工作说明书内容》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、1系统整体结构1.1系统功能结构图 系统整体结构如上图所示:资源门户及统一搜索系统,分为七个功能模块,分别为:1)分类体系管理分类体系是有信息存入采集库中。其中的图片、文件附件等资源数据存入资源存储系统中。2)  1.2功能性需求分类 功能模块功能编码子功能分类体系管理A-001存储分类管理存储分类是由领域专家管理的,是否需要审核?存储数据标准?A-002展示分类查看及与存储分类的关系元数据管理B-001数据类型管理B-002属性管理B-003属性值管理数据标准管理C-001存储数据标准维护C-002存储数据标准查看C-003展示分类申请C-004展示分类审核C-005展示数据标准查

2、看审核通过后,如果对其进行变更领域专家D-001申请成为领域专家D-002领域专家审核D-003领域专家管理标签库E-001对外接口资源中心F-001对外接口系统管理G-001用户管理G-002角色管理G-003操作日志 2网页爬虫2.1网站站点配置网站站点配置功能用于设定爬虫需要采集的站点,包括网站入口地址,网站分类、采集深度、采集优先级、内容模板等等。数据库索引,用于从采集库中的数据,读取后创建索引到索引库中。对于采集库中的标准库数据,可以直接映射创建索引库。对于采集库中的非标准库数据,需要根据搜索的业务需要对数据进行标准化,再创建索引。在索引过程中,还可能需要对数据进行加工和处

3、理。5.5文件索引文件索引主要实现将存储资源库中的文件进行解析和创建索引。支持对本地文件、网络文件目录、FTP目录、NFS文件目录进行遍历、采集和更新。支持的文件类型近300余种,包括常见的Txt、HTML、Xml、Office文档、Pdf、Rar文件等等。此外也可以自定义文件扩展名和解析器。用户也可以通过开发插件方式来解析其他的文件格式内容。支持多媒体信息、各种格式文档、及其它应用系统中的文档采集。包括JPEG、BMP、GIF、TIFF、PCX、AVI、WAV等二十多种图像声音动画格式;可支持多国语系(英文、繁简体中文、日文、西欧语系等)混合的文件;可支持藏文、维文等少数民族语言,

4、文件编码支持Big5、GBK、Unicode、UTF-8等。5.6定时采集任务通过设置定时的采集任务,系统可以定时地从采集库,或是文件资源中读取数据,创建索引,用于提供检索服务。6资源中心门户6.1资源分类与管理建立统一的分类目录,实现资源统一揭示;建立逻辑分类目录,实现资源多维度揭示。包括资源关联、资源聚合等功能。6.2资源在线浏览针对资源库中存储的各种资源类型,包括各种文本资源、音频、视频、图片、教学课件等,提供在线阅读和播放查看功能,以方便用户高效快速和直观的利用。6.3与学校公共平台对接通过接口与学校统一身份认证系统的信息集成,实现知识资源中心的用户与权限管理;知识资源中心与

5、各应用间前台展示功能:如在线展示,目录展示等;与短信、通讯、用户通讯信息等相关信息通过浙江大学公共通讯平台对接获取;师生基本信息数据通过与浙江大学数据中心对接获取。7统一搜索模块7.1全文检索(1)提供全方位检索手段,包括外部特征与正文内容的各种逻辑组合检索、位置检索、二次检索、渐进检索、模糊检索、历史检索、词根检索、大小写敏感检索、概念检索、对检索结果按与检索表达式的相关性程度排序等。实现精确计算,报告准确的检索记录数。 8.2OpenUrl接口OpenURL即“开放链接”,一种解决不同的数字资源系统互操作、进行资源整合的方法,也是一项的技术标准,它是一种附带有元数据信息和资源地址

6、信息的“可运行”的URL。本系统也将提供标准的OpenURL接口,用于资源整合,资源共享。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。