数据分析科学的过去、现在、未来

数据分析科学的过去、现在、未来

ID:17384357

大小:9.11 MB

页数:81页

时间:2018-08-30

数据分析科学的过去、现在、未来_第1页
数据分析科学的过去、现在、未来_第2页
数据分析科学的过去、现在、未来_第3页
数据分析科学的过去、现在、未来_第4页
数据分析科学的过去、现在、未来_第5页
资源描述:

《数据分析科学的过去、现在、未来》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、数据分析科学的过去、现在、未来--统计是数据科学谢邦昌教授1朱建平教授21.辅仁大学统计资讯学系暨应用统计所教授首都经贸大学统计学院&中央财经大学统计学院博导厦门大学计划统计系&西南财经大学统计学院客座教授中华数据挖掘协会理事长2.厦门大学计划统计系数据源:赵民德,「统计是数据科学」人大讲稿•统计学的发展,是根据数据的型态和问题的本质来改变的,不是因为我们会做他背后的数学而发展的。•不要因为(统计的)问题困难而去做它;也不要因为它难而不做。(贺吉士J.L.Hodges,Jr.,1922-2000)•统计学的

2、味道,来自她的数据,因为这是她的本质。数据源:赵民德,「统计是数据科学」人大讲稿统计是数据科学数学是数理统计的基础数据源:赵民德,「统计是数据科学」人大讲稿数据源:赵民德,「统计是数据科学」人大讲稿统计科学还是统计工业•工业意味着不断改进的、有市场的产品和日益增加的就业人口。如果统计只是在大学里或者研究单位里面存在的话,那么这个行业的萧条,也是可以预期的。•工业的另一个意涵是不再有单兵作战。工业化的结果,除了世俗化之外,还暗示着有更高的附加价值。•化工厂里满墙的屏幕:每一个都在监测某一重要生产环节的状况和反

3、应;企业里开始有「数据价值发展部」的编制。•将某些统计工作专业化,不断地加上新的价值数据源:赵民德,「统计是数据科学」人大讲稿什么是数据挖掘?•数据挖掘是计算机应用领域的新名词。然而当人类还在茹毛饮血的上古时代早已进行着数据挖掘的行为–为了快速并准确捕获猎物,人类的祖先必须细心观察猎物的习性,并预测猎物的行为,才能战胜猎物、存活下去•同样的,在讲究实时、竞争激烈的网络时代,如果能事先破解消费者的行为模式,将会是赢得电子商务的关键因素之一数据源:赵民德,「统计是数据科学」人大讲稿ItisNew•资源与信息共享

4、InformationDelivery•Datamining(DM)是一个当红的专题,也是蛮新的一个专题•多半的人,并不知道它能做甚么。•但是不能太晚上车。(中研院赵民德)数据源:赵民德,「统计是数据科学」人大讲稿瞎子摸象?找Pattern?Trend?Relationship?数据源:赵民德,「统计是数据科学」人大讲稿林共进教授提供什么是数据挖掘?•定义–WilliamFrawley&GregoryPiatetskyShapiro,1991–从现有的大量数据中,撷取不明显的、之前未知的、可能有用的信息•目

5、标–建立起决策模型•哪一类的用户对我的产品有兴趣?–根据过去的行动来预测未来的行为数据源:赵民德,「统计是数据科学」人大讲稿什么是数据挖掘?Interpretation/EvaluationDataMiningKnowledgeTransformationPreprocessingSelectionPatternsTransformedDataPreprocessedTargetDateDataData10数据源:赵民德,「统计是数据科学」人大讲稿什么是数据挖掘?信用卡消费资料:假设每人帄均有1.5张信用卡

6、,每月帄均消费10笔,该行约有150万的客户。就大量的资料资料量而言,每月约有2,250万笔消费记录,每年约有2亿7千万笔消费记录型态或规则客户的消费型态或规则里面要有矿!数据源:赵民德,「统计是数据科学」人大讲稿你不能不知的十大创新技术根据TECHNOLOGYREVIEW杂志(麻省理工学院2002年1月出刊)提出改变未来的十大创新技术机器与人脑的界面塑料晶体管资料採礦(Datamining)数字权利管理生物测定學(Biometrics)语言识别处理微光学技術(Microphotonics)

7、解开程式碼(Untanglingcode)机器人设计微应用流体學(Microfluidics)数据源:赵民德,「统计是数据科学」人大讲稿Speech/WritingDevicesWi-Fi/BroadbandWebServicesTrustedComputingHardwareRightsManagementXML/SOAPHTTP/HTMLSMTPEmailClientsWebBrowsersMouseGUILANsPCArchitectureDOSSpreadsheetsWordProcessor

8、sTodayPCApplications数据源:赵民德,「统计是数据科学」人大讲稿InternetWebAppsMid80sLate80s-Mid90sMid90sMid00s-...智能提炼让数据为您开启智识大门数据源:赵民德,「统计是数据科学」人大讲稿IntelligenceRefiningProcessDataWarehousing15数据源:赵民德,「统计是数据科学」人大讲稿数据挖掘方法概述•1.Clas

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。