大大数据的技术与应用基础-教学大纲设计

大大数据的技术与应用基础-教学大纲设计

ID:29198996

大小:68.00 KB

页数:6页

时间:2018-12-17

大大数据的技术与应用基础-教学大纲设计_第1页
大大数据的技术与应用基础-教学大纲设计_第2页
大大数据的技术与应用基础-教学大纲设计_第3页
大大数据的技术与应用基础-教学大纲设计_第4页
大大数据的技术与应用基础-教学大纲设计_第5页
资源描述:

《大大数据的技术与应用基础-教学大纲设计》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实用标准文案《大数据技术与应用基础》教学大纲学时:60代码:适用专业:制定:审核:批准:一、课程的地位、性质和任务大数据技术的发展,已被列为国家重大发展战略。而在过去的几年里,无论是聚焦大数据发展的《促进大数据发展行动纲要》,还是《“十三五”规划》中都深刻体现了政府对大数据产业和应用发展的重视。目前国内大数据发展还处于加速期、转型期,数据与传统产业的融合还处于起步阶段,各行业对大数据分析和挖掘的应用还不理想。但随着市场竞争的加剧,各行业对大数据技术研究的热情越来越高,在未来几年,各领域的数据分析都将大规模应用。本课程在注重大数据时代应用环境前提下,考虑大数据处理分析需求多样复

2、杂的基本情况,从初学者角度出发,以轻量级理论、丰富的实例对比性地介绍大数据常用计算模式的各种系统和工具。考虑到当前大数据发展处于起步并逐步赶超先进的阶段,其应用领域丰富广泛,在教学过程中应注重掌握大数据分析的实践操作。本课程通过丰富简单易上手的实例,让学生能够切实体会和掌握各种类型工具的特点和应用。二、课程教学基本要求1.了解大数据的发展和基本概念,理解并掌握大数据的特征及主要技术层面。2.掌握Scrapy环境的搭建,了解网络爬虫获取数据的过程,熟悉爬虫项目的创建。3.深刻了解hadoop的基础理论,理解并掌握Hadoop单机及集群环境的部署方法。4.掌握HDFS的基本概念和

3、HDFS在hadoop中的作用,理解并识记HDFS的使用,了解HDFS的JAVAAPI接口及数据流原理;让学生明白Map过程与Reduce过程这两个独立部分各自的原理及合作途径,知道如何独立编写满足自己需求的MapReduce程序。5.理解HBase中涉及的基本概念,掌握HBase的简单应用;让学生了解数据仓库的基础概念,熟悉Hive与HDFS、MapReduce直接的关心。6.熟悉Spark和RDD的基本概念,熟悉spark接口的使用,解决实战时的步骤及思路。7.明白Hadoop和Storm之间的差别,掌握对Storm的使用。理解Apex的工作过程并能简单应用。8.了解Dr

4、uid的基本概念、应用场景以及集群架构,掌握批量数据加载、流数据加载的操作。了解Flink的重要概念和基本架构,掌握Flink简单的使用实例。9.理解Elasticsearch的基本架构,掌握Elasticsearch的一些入门操作。了解并基本掌握怎样利用所学的工具对目标实例进行数据分析。三、课程的内容1.大数据概述精彩文档实用标准文案了解大数据的产生和发展,识记大数据的特征、数据类型和系统,大数据的计算模式和技术层面间的关联。2.数据获取识记基本概念,识记各功能应怎样用Scrapy爬虫实现,了解采集目标数据项定义,领会并掌握爬虫运行和数据存储技术。3.Hadoop基础领会H

5、adoop的主要特点,识记HadoopHDFS、HadoopMapReduce、HadoopYARN的原理,了解其生态系统中重要组成的原理,熟悉Hadoop的配置。4.HDFS基本应用熟悉HDFS所需的API接口,了解数据流的工作过程,能简单操作HDFS的接口。5.MapReduce应用开发了解所需的开发环境eclipse,领会Map过程与Reduce过程的工作原理,了解使用mapreduce解决实际问题时的步骤和思路,识记MapReduce代码的不同功能。6.分布式数据库HBase识记HBase的基本概念,熟悉安装HBase集群的步骤,了解HBaseAPI的基本步骤。7.数

6、据仓库工具Hive领会Hive的作用,掌握Hive接口的使用,会利用Hive解决实战问题。8.开源集群计算环境Spark了解Spark的基本思想,熟悉Spark所需的环境及API等,熟悉Spark实战的完整工作过程,领会其所需的代码。9.流实时处理系统Storm识记Storm相关概念,掌握Storm环境的安装配置,了解Storm的基本使用10.企业级、大数据流处理Apex识记Apex的基本概念,掌握Apex的环境配置过程,理解常见组件的原理和特点,会简单的应用Apex解决问题。11.事件流OLAP之Druid了解Druid的概念及其应用场所,掌握Druid单机环境的安装方法和

7、步骤,并能利用Druid进行加载流数据处理数据查询等。12.事件数据流引擎Flink识记Flink的基本概念,明白Flink的基本架构,能够安装Flink的单机和集群环境。精彩文档实用标准文案13.分布式文件搜索Elasticsearch了解Elasticsearch包含重要部分的基本概念,掌握Elasticsearch重要的安装过程,掌握简单的操作。14.实例电商数据分析能够通过已经学习了解过的环境和工具等,有条理有步骤的对实例进行数据挖掘、数据处理和数据分析等,进而得出相关的结论。四、课程的重点、难

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。