欢迎来到天天文库
浏览记录
ID:35057398
大小:3.72 MB
页数:49页
时间:2019-03-17
《基于kafka的大规模流数据分布式缓存与分析平台》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:TP311.50183单位代码;1研究生学号:201353H222密级;公开古林大学硕女学位论文专北学位()基子Kafka的大规模流数据分布式缓存与分析平台ADistributedCacheAndAnalysisPlatformforLa巧eScaleStreamingDataBasedOnKafka作者姓名:牛牧类别:工程硕古领域(方向):软件工程指导教师:周袖副教授培养单位:软件学晓2016年12月基于kafka的大规模流数据分布式缓存与
2、分析平台ADistributedCacheandAnalsisPlatformforLareScaleygStreamingDataBasedOnKa化a作者姓名:牛牧专业名称:软件工程指导教师:周袖副教授学位类别:在职工程硕±^'答辩日期:2016年11月20日未经本论文作者的书面授权,依法收存和保管本论文书面版本、电子版本的任何单位和个人,均不得对本论文的全部或部分内容进行任何形式的复制、修改、发行、出租、改编等有碍作者著作权化商业性使用(但纯学术性使用不在此限)
3、。否则,应承担侵权的法律责任。大学硕±学位论文原创性声明本人郑重声明:所呈交的硕±学位论文,是本人在指导教师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均己在文中W明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:牛松日期:2016年12月06日摘要基于kafka的大规模流数据分布式缓存与分析平台近年来,随着信息技术与互联网应用的不断发展,全球数据总量也
4、在呈现爆炸式的增长,大数据时代即将来临。这将不仅为科学研究领域带来巨大变革,也将深远地影响到未来我们生活的方方面面。现阶段,在大数据分析与计算领域,由于分布式集群架构低成本、高计算能力、良好的可扩展性等特点获得了越来越广泛的应用。于此同时,分布式集群架构中所计算和分析的数据结构也越来越多样化。近年电子商务、物联网,互联网金融等领域的应用不断发展,在多数分布式集群中同时存在着监控端传输的动态流数据和系统生成的运行时日志文件。这种情况下,由于不同特点的数据所适合分析算法和计算方式也有所不同,例如流数据处理过程关于实时性和拓扑结构多样性的要求
5、,大规模数据批量处理过程中的系统吞吐量和资源利用率的要求。而现有的主流分布式集群系统通常只适合对一种特定的数据进行分析,例如Hadoop[19][21]、Storm[22]以及S4[23]等,而无法适应多种类型数据结构并存情况。本文创新性的提出了基于kafka的大规模流数据分布式缓存与分析平台。该平台的设计目标是组织和缓存系统输入的大规模流数据。并分别设计在线流数据处理和离线批处理多种方式的处理单元,依据不同数据类型选择合适的方式进行分析运算。总结该缓存与分析平台的特点,主要分为以下几个方面:(1)采用分布式消息系统作为大规模流数据的缓
6、存,提高了平台对动态流数据输入数据量突发性变化的适应能力。(2)设计并实现在线实时处理单元及离线批处理单元,分别处理集群中不同特点的数据,以满足不同类型的数据对计算实时性和系统吞吐量不同方面的需求。(3)整个平台采用集中式的管理方式,不同模块、不同处理单元中的节点信息统一同步到管理模块,以实现平台节点信息的全局一致性。本文详细介绍了平台的总体架构设计,将系统分为三个部分,分别实现缓存订阅、在线实时处理以及系统管理等功能。并基于此设计实现了基于kafka的大规模流数据分布式缓存与分析平台模型。最后验证了平台的可用性,可扩展性及高效性等特点
7、。本文希望能通过该平台的设计与实现过程,给分布式计算集群的搭建和大规模流数I据处理过程提供新的思路和方法。也希望能够通过进一步的努力,不断完善平台模型,将该平台用于实际生活、生产、以及研究过程中。关键词:分布式,流数据,在线处理,kafka,HadoopIIAbstractADistributedCacheAndAnalysisPlatformforLargeScaleStreamingDataBasedOnKafkaInrecentyears,withthecontinuousdevelopmentofinformationtechn
8、ologyandInternetapplication,globaldatascaleexplosivegrowth,andthatmeans,BigDataEraiscoming.Thiswillnoto
此文档下载收益归作者所有