数据挖掘中的统计方法概述

数据挖掘中的统计方法概述

ID:33586029

大小:156.94 KB

页数:4页

时间:2019-02-27

数据挖掘中的统计方法概述_第1页
数据挖掘中的统计方法概述_第2页
数据挖掘中的统计方法概述_第3页
数据挖掘中的统计方法概述_第4页
资源描述:

《数据挖掘中的统计方法概述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、计算机测量与控制$%&&’$""("%)综述·!"#·!"#$%&’()’*+%(’#’,&-!",&(".!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!文章编号:"-)"(#,!.(%&&’)"%(&!"#(&#中图分类号:/0!"%$’"文献标识码:1数据挖掘中的统计方法概述赵广社,张希仁(西安交通大学,陕西西安)"&&#!)摘要:统计方法有成熟的数学基础,可以很好的对数据进行解释,在数据挖掘中有着大量的运用。文章回顾了数据

2、挖掘中常用的统计方法,包括传统的统计方法(回归分析、主成分分析、判别分析和聚类分析)和其他一些非机器学习的方法(模糊集、粗糙集和统计学习理论),分析了各种统计方法的优缺点。关键词:数据挖掘;回归分析;主成分分析;判别分析;聚类分析;模糊集;粗糙集;支持向量机/,&("0%1&2",3&*&2+&21*.4’15,26%’+2,7*&*)2,2,8231456789:;<=,231>5?@:A=8(?@’78B@7CDC89E8@F=A;@DG,?@’78)"&&#!,*<@87)9:+&(*1&:HD7D@;D@

3、I7JD=I<8@K6=;<7F=L7D6A=M7;=;CNL7D<;,=87MJ=DC@8D=AOA=DI<7A7ID=A@;D@I;CNP7D778P<7F=L6I<7OOJ@I7:D@C8@8P7D7L@8@89$Q8D<@;O7O=A,R=A=F@=R;D7D@;D@I7JD=I<8@K6=;6;=P6;67JJG,@8IJ6P@89DA7P@D@C87J;D7D@;D@I7JD=I<8@K6=;78PD=I<:8@K6=;R<@I<7A=8CDL7I<@8=J=7A8@89D=I<8@K6=$/<=7P

4、F78D79=;78PP@;7PF78D79=;CN=F=AG;D7D@;D@I7JD=I<8@K6=;7A=787JGS=P$;’<="(0+:P7D7L@8@89;A=9A=;;@C8787JG;@;;OA@8I@O7JICLOC8=8D787JG;@;;P@;IA@L@878D787JG;@;;IJ6;D=A@89787JG;@;;N6SSG;=D;AC69<;=D;;6OOCADF=IDCAL7I<@8=化。数据挖掘主要有统计方法(因为基本的数据分析来>引言自于这个领域,许多数据分析问题存在统计解决方法)

5、近年来,数据挖掘引起了信息产业界的极大关注,和机器学习(它从另外的方式去处理数据,可以自动地其主要原因是存在大量数据,可以广泛使用,并且迫切产生和证实假设,分别描述假设)两种方法。此文中主需要将这些数据转换成有用的信息和知识。获取的信息要是回顾数据挖掘中的统计方法。和知识可以广泛用于各种应用,包括商务管理、生产控制、市场分析和科学探索等。?数据挖掘的统计方法知识挖掘最新的描述性定义是由E;7L7T$[#,,]%V"回归分析["]:数据挖掘是从数据集中识别出有设有!个自变量(预报因子)",⋯,",#个U7GGG7P

6、等给出的"!效的、新颖的、潜在有用的,以及最终可理解的模式的因变量$,⋯,$,相应的%组观测资料是"#非平凡过程。数据挖掘的基本过程和主要步骤如图"所"&",⋯,"&#,$&",⋯,$&#,&’",%,⋯,%(示["&]。用矩阵来表示,可得资料矩阵)’($&!),+’("&!),%*#%*!如果因变量$与自变量",⋯,"之间有线性关系!"!式,且$的值又带有误差,于是有!$!’"&!,""!"","%!"%,⋯,"!!"!,#!,!’",⋯(#(写成矩阵形式,就是""&""""⋯"!"$""$图"数据挖掘过程的步

7、骤"$"$⋯"#"$"&%""%"!%""’,数据挖掘是一个多学科领域[%],包括数据库技术、#$%##%##⋯%#"%#"&#""#"!#!人工智能、机器学习、神经网络、统计学、模式识别、统计问题就是从已知的资料矩阵)和+出发,如何求知识库系统、知识获取、信息检索、高性能计算和可视得上式中的这些未知常数,并且对误差#作出估计"&-.和推断。称为回归系数,而略去误差后的关系式"&-收稿日期:%&&’(&)(%"。$!’"&!,""!"","%!"%,⋯,"!!"!,!’",⋯(/(基金项目:国家重点基础研究发展规

8、划项目(%&&"*+’&!#&,)称为回归方程。用最小二乘法求解。作者简介:赵广社("!--(),男,陕西省乾县人,副教授,主要"&-回归是学习一个函数,这个函数是将数据项映射为从事图像测量与信息融合理论、数据挖掘与知识发现以及嵌入式系统的研究。第!"期赵广社:数据挖掘中的统计方法概述·#!$·!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。