大数据与数据挖掘

大数据与数据挖掘

ID:25195702

大小:6.83 MB

页数:77页

时间:2018-11-16

大数据与数据挖掘_第1页
大数据与数据挖掘_第2页
大数据与数据挖掘_第3页
大数据与数据挖掘_第4页
大数据与数据挖掘_第5页
资源描述:

《大数据与数据挖掘》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘课程教学研讨数据挖掘课程的目的什么是数据挖掘Wiki中的定义theanalysisstepofthe"KnowledgeDiscoveryinDatabases"process,orKDDAninterdisciplinarysubfieldofcomputerscience,isthecomputationalprocessofdiscoveringpatternsinlargedatasetsinvolvingmethodsattheintersectionofartificialintelligence,machinele

2、arning,statistics,anddatabasesystems.Theoverallgoalofthedataminingprocessistoextractinformationfromadatasetandtransformitintoanunderstandablestructureforfurtheruse.Asidefromtherawanalysisstep,itinvolvesdatabaseanddatamanagementaspects,datapre-processing,modelandinference

3、considerations,interestingnessmetrics,complexityconsiderations,post-processingofdiscoveredstructures,visualization,andonlineupdating.2021/7/4数据库研究所3开设数据挖掘课程的目的技术发展的趋势的需要大数据和智能化是信息技术发展的新动力技术发展路径数据库->数据仓库->数据挖掘->大数据数据挖掘技术已经成为很多应用领域的基本支撑技术WEB数据分析电子商务生物信息学金融数据分析…2021/7/4数据库研

4、究所4开设数据挖掘课程的目的数据分析类课程在计算机教学体系中的作用将逐渐增加数据挖掘、机器学习、…培养学生理论与应用相结合能力培养学生应用基本的方法,提高解决实际的系统能力数据挖掘课程的特点入门容易有深度应用实例多易于设计实验2021/7/4数据库研究所5复旦大学数据挖掘课程的设置复旦大学计算机科学技术学院基本情况学生情况120名本科生/年150名研究生/年教师情况教学科研教师:100名左右教学理念强调数据基础强调学生综合能力的培养强调学生创新能力培养复旦大学计算机科学技术学院基本情况主要研究方向媒体计算数据库与数据科学网络与信息安全智

5、能信息处理人机接口和服务计算理论计算机科学软件工程与系统软件2021/7/4数据库研究所6复旦大学数据挖掘课程的设置总体目标掌握大规模数据挖掘与分析的基本流程掌握数据挖掘的基本算法掌握对实际数据集进行挖掘的系统能力算法设计挖掘算法的内涵参数设置结果评估…了解数据挖掘的主要应用方向为后续的课程做准备2021/7/4数据库研究所7复旦大学数据挖掘课程的设置2021/7/4数据库研究所8数据仓库与数据挖掘WEB数据管理和数据挖掘数据密集型计算文本数据挖掘…高级数据挖掘技术数据库系统机器学习生物信息学多媒体数据处理数据库新技术数据仓库与数据挖掘

6、课程的教学目的掌握数据仓库数据挖掘原理、技术和方法,掌握建立数据挖掘应用系统的方法,了解相关前沿的研究。教学内容数据挖掘、数据仓库的基本概念数据仓库设计和应用数据挖掘的基本技术关联分析、分类分析、聚类分析、异常分析和演化分析等;联机分析处理OLAP技术;数据挖掘应用系统开发数据挖掘技术的新应用数据挖掘软件发展2021/7/4数据库研究所9高级数据挖掘课程的教学目的让学生掌握数据挖掘的基本概念、算法和高级技术;将这些概念、算法和技术应用于实际问题。教学内容分类算法,包括决策树(ID3,C4.5,SPRINT等)、基于规则的分类器(C4.5

7、rules,RIPPLE等)、NaïveBayes分类器和贝叶斯网络、最近邻分类器(kNN,CondensedkNN,DANN等)、支持向量机(SVM)、Ensemble方法(如AdaBoost,Bagging,RainForest等),以及模型选择(如MDL,RegularizationNetwork等)。2021/7/4数据库研究所10高级数据挖掘教学内容聚类分析划分型聚类算法,如K-means等层次型聚类算法,如Singlelink,completelink,Ward方法等及基于模型的聚类如EM算法;基于密度的聚类算法如DBSCA

8、N其他高级聚类算法,如Clique,CURE,CHAMELEON,BIRCH等关联分析,Apriori算法、DHP、FP-growth,以及频繁序列挖掘、图挖掘等教学内容数据挖掘应用异常检测、数据流挖掘、W

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。