科研大数据平台项目

科研大数据平台项目

ID:13096734

大小:9.08 MB

页数:28页

时间:2018-07-20

科研大数据平台项目_第1页
科研大数据平台项目_第2页
科研大数据平台项目_第3页
科研大数据平台项目_第4页
科研大数据平台项目_第5页
资源描述:

《科研大数据平台项目》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、科研大数据平台项目技术建议书目录1.概述11.1.项目背景11.2.需求分析11.3.方案简述11.4.方案价值22.设计方案42.1.设计原则42.2.系统架构52.3.分布式数据库系统52.3.1.MPP+ShareNothing架构52.3.2.核心组件62.3.3.高可用62.3.4.高性能在线扩展72.3.5.高性能数据加载82.3.6.OLAP函数92.4.Hadoop集群92.4.1.Hadoop企业版92.4.2.HIVE分布式内存分析引擎102.4.3.HBASE分布式实时在线数据处理引擎102.4.4.Stream流处理引擎112.5.服务器

2、虚拟化112.5.1.设计理念122.5.2.系统结构132.5.3.服务器虚拟化系统组成142.6.云管理平台152.6.1.浪潮云海OS架构图152.6.2.浪潮云海OS实现的功能152.7.爬虫软件182.7.1.建设网络爬虫私有云182.7.2.高效的分布式、协同化数据采集模式202.7.3.爬虫路线规划能力212.7.4.爬虫调度和负荷规划能力212.7.5.极致的开放兼容平台222.7.5.1.为什么需要开放的可集成的网页抓取软件222.7.5.2.集搜客网络爬虫的开放接口223.方案优势233.1.浪潮MPP数据库优势233.1.1.高性能233.

3、1.2.高性价比233.1.3.高易用性233.2.浪潮Hadoop优势233.3.浪潮云计算优势233.3.1.运营效率提升23第25页3.3.2.服务水平提高243.3.3.实现数据中心的绿色节能243.3.4.分工细化使得终端用户只需专注自身业务243.3.5.降低总体拥有成本(TCO)243.3.6.可靠性提高253.3.7.性能强大253.3.8.扩展性好253.3.9.可管理性254.推荐配置26第25页1.概述1.1.项目背景通过本项目的实施与建设,在以服务科研工作为主导的原则下,基于高性能大数据软硬件设施,构建多样化、专业化、柔性化的科研数据服务

4、应用平台。利用大数据技术,满足不同层级用户的需求,达到改善我校的科学研究环境与学科建设、提升我校的科研管理水平、提升我校针对物流行业的科研服务能力等目标。本项目分阶段实施,初期重点在于建立一个能满足业务需求的基于大数据的计算、存储以及通讯的硬件环境平台和数据管理架构。1.2.需求分析要构建多样化、专业化、柔性化的科研数据服务应用平台,现有架构很难承担日益增长的数据分析需求。迫切需要寻求一种全新的系统架构帮助我校满足日常业务及数据分析。并有效利用数据的价值,提高系统安全、系统高可用等。需求分析如下:Ø寻求新的系统架构,从物理架构、数据架构、业务模型架构及应用架构等

5、几方面满足业务需求。Ø从全局及用户长远利益考虑,规划先进的大数据平台底层架构,满足大数据时代的业务需求。Ø保护用户现有资源,考虑系统现状以及现有资源利用等,在系统建设中,充分考虑现有资源利旧。Ø系统多平台整合,建设统一的底层平台,提高系统安全等保级别,规避系统单点风险。1.3.方案简述根据对背景及需求的分析,为了帮助我校能够更好地在大数据时代支撑大规模数据的应用,分别从物理架构及数据架构建设科研大数据平台系统。Ø物理架构:采用虚拟化技术,为客户打造IaaS底层系统架构。Ø数据架构:采用与客户习惯使用的SQL这种更易于理解的、交互性更好的访问接口,架构需要以MPP

6、数据库及计算框架为核心,将MPP第25页运算调度引擎完全融入非关系型运算调度框架,实现可以同时调度关系运算和非关系运算的调度引擎,构建统一的结构化信息提取和数据类型转换框架,将非结构化数据映射为关系模型,实现面向关系模型的全数据统一视图,从而平滑的实现MPP数据库和Hadoop的统一调度和处理,为新型的基础软件平台和上层应用提供数据服务。1.1.方案价值弹性扩展采用虚拟化技术做为底层资源抽象技术,为科研大数据平台动态提供基础计算、存储、网络资源,同时运用云平台计算技术为云数据中心提供统一的管理和运维平台,实现资源弹性服务、流转和管理。动态资源分配云计算被认为是分

7、布式处理、并行处理以及网络计算的进一步发展,其使用虚拟机力度方式,根据应用的动态对资源进行增删。快速响应以并行计算为核心,按需调度计算任务分配和计算资源,并提供从数据导入整合处理、计算模型设定到计算结果输出、多形式展现、应用API等完整的数据处理服务。高可用采用分布式存储系统,数据互备,快速备份和恢复。支持各种数据处理、计算模型,满足不同领域、不同特点的计算需求。多副本容错,数据安全无忧。数据分析构建大数据存储应用平台,围绕大数据应用构建大数据处理基础软件平台的关键问题是如何解决结构化和非结构化不同类型的数据融合,以及实现不同类型数据处理模式的整合。单一的MPP

8、数据库或Hadoop产品

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。