大数据平台概要设计说明书

大数据平台概要设计说明书

ID:25844874

大小:535.01 KB

页数:31页

时间:2018-11-23

大数据平台概要设计说明书_第1页
大数据平台概要设计说明书_第2页
大数据平台概要设计说明书_第3页
大数据平台概要设计说明书_第4页
大数据平台概要设计说明书_第5页
资源描述:

《大数据平台概要设计说明书》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、概要设计说明书计算平台概要设计说明书文件编号受控编号版次1.0密级内部公开总页数42附录作者:日期:2013-01-28批准:日期:审核:日期:(版权所有,翻版必究)内部公开第31页共31页概要设计说明书文件修改记录修改日期修改状态修改页码及条款修改人审核人批准人内部公开第31页共31页概要设计说明书目录1.引言51.1编写目的51.2术语与缩略词61.3对象及范围81.4参考资料92.系统总体设计92.1需求规定92.1.1数据导入92.1.2数据运算92.1.3运算结果导出102.1.4系统监控102.1.5

2、调度功能112.1.6自动化安装部署与维护112.2运行环境122.3基本设计思路和处理流程132.4系统结构142.4.1大数据运算系统架构图142.4.2hadoop体系各组件之间关系图142.4.3计算平台系统功能图152.4.4系统功能图逻辑说明162.4.5计算平台业务流程图162.5尚未解决的问题173.模块/功能设计173.1计算驱动模块173.1.1设计思路173.1.2流程图193.1.3处理逻辑203.2调度模块203.2.1设计思路203.2.2流程图223.2.3处理逻辑233.3自动化安

3、装部署模块233.3.1设计思路233.3.2处理逻辑233.4调度模块与计算驱动模块交互流程243.4.1处理流程图243.4.2处理逻辑243.4.3hadoop驱动模块调用驱动接口253.4.4调度模块接收hadoop执行状态接口25内部公开第31页共31页概要设计说明书3.5调度模块与kettle交互流程263.5.1处理流程图263.5.2处理逻辑273.6对调度任务运行过程进行监控流程273.6.1处理流程图273.6.2处理逻辑273.7对hadoop驱动任务运行过程进行监控流程283.7.1处理流

4、程图283.7.2处理逻辑283.8对操作系统/应用程序监控流程293.8.1处理流程图293.8.2处理逻辑293.9监控报警模块303.9.1设计思路303.9.2流程图313.9.3处理逻辑314.系统数据结构设计324.1数据实体关系图324.2数据逻辑结构324.2.1驱动任务设置表324.2.2驱动设置表334.2.3驱动任务执行明细表344.2.4调度任务表344.2.5调度步骤表354.2.6调度步骤执行记录表364.2.7操作系统监控数据表374.2.8应用程序监控数据表384.2.9监控系统配

5、置表384.2.10业务数据记录表394.3数据物理结构395.安全设计396.容错设计406.1挽救措施406.2系统维护设计407.日志设计401.内部公开第31页共31页概要设计说明书引言1.1编写目的大数据泛指巨量的数据集,因可从中挖掘出有价值的信息而受到重视。《华尔街日报》将大数据时代、智能化生产和无线网络革命称为引领未来繁荣的三大技术变革。麦肯锡公司的报告指出数据是一种生产资料,大数据是下一个创新、竞争、生产力提高的前沿。世界经济论坛的报告认定大数据为新财富,价值堪比石油。因此,发达国家纷纷将开发利用

6、大数据作为夺取新一轮竞争制高点的重要抓手。互联网特别是移动互联网的发展,加快了信息化向社会经济各方面、大众日常生活的渗透。有资料显示,1998年全球网民平均每月使用流量是1MB(兆字节),2000年是10MB,2003年是100MB,2008年是1GB(1GB等于1024MB),2014年将是10GB。全网流量累计达到1EB(即10亿GB或1000PB)的时间在2001年是一年,在2004年是一个月,在2007年是一周,而2013年仅需一天,即一天产生的信息量可刻满1.88亿张DVD光盘。我国网民数居世界之首,每

7、天产生的数据量也位于世界前列。淘宝网站每天有超过数千万笔交易,单日数据产生量超过50TB(1TB等于1000GB),存储量40PB(1PB等于1000TB)。百度公司目前数据总量接近1000PB,存储网页数量接近1万亿页,每天大约要处理60亿次搜索请求,几十PB数据。一个8Mbps(兆比特每秒)的摄像头一小时能产生3.6GB数据,一个城市若安装几十万个交通和安防摄像头,每月产生的数据量将达几十PB。医院也是数据产生集中的地方。现在,一个病人的CT影像数据量达几十GB,而全国每年门诊人数以数十亿计,并且他们的信息需

8、要长时间保存。总之,大数据存在于各行各业,一个大数据时代正在到来。  信息爆炸不自今日起,但近年来人们更加感受到大数据的来势迅猛。一方面,网民数量不断增加,另一方面,以物联网和家电为代表的联网设备数量增长更快。2007年全球有5亿个设备联网,人均0.1个;2013年全球将有500亿个设备联网,人均70个。随着宽带化的发展,人均网络接入带宽和流量也迅速提升。全球新产生数据年

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。