数据仓库与数据挖掘-教学大纲

数据仓库与数据挖掘-教学大纲

ID:35504744

大小:57.89 KB

页数:5页

时间:2019-03-25

数据仓库与数据挖掘-教学大纲_第1页
数据仓库与数据挖掘-教学大纲_第2页
数据仓库与数据挖掘-教学大纲_第3页
数据仓库与数据挖掘-教学大纲_第4页
数据仓库与数据挖掘-教学大纲_第5页
资源描述:

《数据仓库与数据挖掘-教学大纲》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、《数据仓库与数据挖掘》教学大纲一、课程概况课程名称:数据仓库与数据挖掘英文名称:Datawarehousinganddatamining课程性质:选修课程学时:32课程学分:2授课对象:信息类的大学本科高年级学生开课时间:三年级下学期讲课方式:课堂+实验主讲老师:二、教学目的本课程把数据视为基础资源,根据软件工程的思想,总结了数据利用的历程,讲述了数据仓库的基础知识和工具,研究了数据挖掘的任务及其挑战,给出了经典的数据挖掘算法,介绍了数据挖掘的产品,剖析了税务数据挖掘的案例,探索了大数据的管理和

2、应用问题。三、教学任务完成《数据仓库与数据挖掘》教材内容,及教学计划中的互动实践内容,另有学牛自主选题的大作业、选作的论文报告。32学时:课堂24、实验2、课外2、研讨4学时。四、教学内容的结构课程由9个教学单元组成,对应于《数据仓库与数据挖掘》的内容。笫1章数据仓库和数据挖掘概述1.1概述11.2数据中心41.2.1关系型数据小心1.2.2非关系型数据中心123混合型数据屮心(大数据平台)1.3混合型数据中心参考架构笫2章数据2.1数据的概念2.2数据的内容2.2.1实时数据与历史数据222吋

3、态数据与事务数据2.2.3图形数据与图像数据2.2.4主题数据与全部数据2.2.5空间数据226序列数据和数据流2.2.7元数据与数据字典2.3数据属性及数据集2.4数据特征的统计描述222.4.1集中趋势222.4.2离散程度232.4.3数据的分布形状252.5数据的可视化262.6数据相似与相异性的度量292.7数据质量322.8数据预处理322.8.1被污染的数据332.8.2数据清理352.8.3数据集成362.8.4数据变换372.8.5数据规约38第3章数据仓库与数据ETL基础39

4、3.1从数据库到数据仓库393.2数据仓库的结构393.2.1两层体系结构413.2.2三层体系结构413.2.3组成元素423.3数据仓库的数据模型43331概念模型433.3.2逻辑模型433.3.3物理模型463.4ETL463.4.1数据抽収473.4.2数据转换483.4.3数据加载493.5OLAP493.5.1维493.5.2OLAP与OLTP493.5.3OLAP的基本操作501.6OLAP的数据模型511.6.1ROLAP521.6.2MOLAP521.6.3HOLAP53第四

5、章数据仓库和ETL工具544.1IBMDB2V104.1.1自适应压缩544.1.2多温度存储554.1.3时间旅行查询564.1.4DB2兼容性功能604.1.5工作负载管理614.1.6PureXML624.1.7当前己落实634.1.8DB2PureScaleFeature634.1.9分区特性654.1.10并行技术674.1.11SQW684.1.12CubingServices684.1.13列式存储及压缩技术(BLU)704.2InfoSphereDatastage714.2.1基

6、于InformationServer的架构724.2.2企业级实施和管理754.2.3高扩展的体系架构794.2.4具备线性扩充能力814.2.5ETL元数据管理824.3InfoSphereQualityStage82第5章数据挖掘基础845.1数据挖掘的起源845.2数据挖掘的定义855.3数据挖掘的任务865.3.1分类5.3.2回归分析5.33相关分析5.3.4聚类分析5.3.5关联规则5.3.6异常检测5.4数据挖掘标准流程5.4.1商业理解5.4.2数据理解5.4.3数据准备5.4.

7、4建立模型5.4.5模型评估5.4.6结果部署5.5数据挖掘的十大挑战性问题5.5.1数据挖掘统一理论的探索5.5.2高维数据和高速数据流的研究与应用5.5.3时序数据的挖掘与降噪5.5.4从复杂数据中找寻复杂知识5.5.5网络环境屮的数据挖掘5.5.6分布式数据挖掘5.5.7生物庚学和环境科学数据挖掘5.5.8数据挖掘过程自动化与可视化5.5.9信息安全与隐私保护5.5.10动态、不平衡及成木敏感数据的挖掘第6章数据挖掘算法6.1算法概述6.1.1分类算法及评估指标6.1.2聚类算法及其评价指

8、标6.2C4.56.3CART算法6.4K-Means算法6.5SVM算法1216.6Apriori算法6.7EM算法6.8PageRank6.9Adaboost算法6.10KNN算法6.11NaiveBayes第7章数据挖掘工具与产品7.1数据挖掘工具概述7.2簡业数据挖掘工具IBMSPSSModeler7.3开源通用的数据挖掘工具WEKA第8章数据挖掘案例8.1概述8.2纳税评估示例8.3税收预测建模示例8.4税务行业纳税人客户细分探索8.5基于Hadoop平台的数据挖掘思考题第9章大数据管

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。