资源描述:
《[计算机软件及应用]数据挖掘和知识发现综述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Chap1Introduction数据挖掘和知识发现综述ForPhDofCSofSCU,2007BasedonthebookofJiaweiHan,EditedandModifiedByC.Tang唐常杰四川大学计算机系DataMining:ConceptsandTechniques2021/6/301韩加炜教授在川大作学术讲座2021/6/302数据挖掘chap.1提纲国外教学经验和我们的安排动机,背景数据库进展回顾5PPT什么是DM挖掘什么KDDProcessDM的分类兴趣度KDD的基本思想DM5要素DMQL—语言KDD的技术要求和难点主要的KDD技
2、术现有的KDD系统KDD研究学派数据挖掘十大成果(算法)数据挖掘十大问题2021/6/303国外的教学经验和我们的安排ThebookwillbecoveredintwocoursesatCS,UIUCCS412:Introductiontodatawarehousinganddatamining1-7章(Fall)Preprocessing,DataWarehouseandOLAPDataCube,AssociationClassificationClusterCS512:Datamining:Principlesandalgorithms8-11章(S
3、pring)Miningcomplexdata,SpatialMultimedia,Textmining,Webmining,Miningbusiness&biologicaldata,Visualdatamining,Dataminingandsociety:Privacy-preserving我们的处理:PHD课程:全书,重点是后面部分2021/6/304国外的教学经验和我们的安排学习方法。讨论班:轮流报告,报告教材。论文,研究心得考察方式:学期论文学习材料PPT,软件,论文等大约260M1:实验室421的Fileserver22http://202
4、.115.32.77/~tangchangjie/buf/download/XXX,RAR其中XXX为:3课后:讲台上计算机内(校园网外的同学)2021/6/305教学材料包括若干DM方面的PPT,英文的,中文的组织PPT的素材(DOC,TXT,PPT,PDF,去年的报告)两个软件Weka,DB-Minner教学计划学期论文封面2021/6/306教学计划第一周老师讲授第二周同学报告数据挖掘软件Weka,DB-Minner安装使用经验,获得感性认识。DM是什么,可以作什么事情将排出一个通讯录,报告题目,章节和时间,委托某同学来作2021/6/307提纲国
5、外教学经验和我们的安排动机,背景数据库进展回顾5PPT什么是DM挖掘什么KDDProcessDM的分类兴趣度KDD的基本思想DM5要素DMQL—语言KDD的技术要求和难点主要的KDD技术现有的KDD系统KDD研究学派数据挖掘十大成果(算法)数据挖掘十大问题2021/6/308Motivation:Whydatamining?动机,背景发生在数据库上的”成长的烦恼”数据库的发展给自己引出了麻烦。数据爆增103T没有数据时千方百计搜集管理数据,上世纪60-70年代层次库,网状库,有了数据扩充能力,搜集管理更多数据,上世纪80-90年代关系库,OODB…..数
6、据太多了,管不下来。上世纪-90年代–现在KDD,DM…..(作科研找项目也类似)2021/6/309WeareDataRichbutInformationPoor(nextcc)DatabasesaretoobigDataMiningcanhelpdiscoverknowledgeTerrorbytes2021/6/30102021/6/3010Motivation:Whydatamining?动机,背景Datacollectionanddataavailability1数据库是人类搜集存储数据能力的延伸。哲学:2人类活动需求对人流物流,资金流的描述
7、Business:Web,e-commerce,transactions,stocks,…Science:Remotesensing,bioinformatics,scientificsimulation,Societyandeveryone:news,digitalcameras,Wearedrowningindata,butstarvingforknowledge!矛盾:数据多、知识少2021/6/3011Motivation:Whydatamining?动机,背景数据海洋不支持决策信息&噪声,观点的矛盾“Necessityisthemotherof
8、invention”—Datamining—Automatedanalysiso