资源描述:
《数据挖掘中的统计方法概述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、计算机测量与控制$%&&’$""("%)综述·!"#·!"#$%&’()’*+%(’#’,&-!",&(".!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!文章编号:"-)"(#,!.(%&&’)"%(&!"#(中图分类号:/0!"%$’"文献标识码:1数据挖掘中的统计方法概述赵广社,张希仁(西安交通大学,陕西西安)"&!)摘要:统计方法有成熟的数学基础,可以很好的对数据进行解释,在数据挖掘中有着大量的运用。文章回顾了数据
2、挖掘中常用的统计方法,包括传统的统计方法(回归分析、主成分分析、判别分析和聚类分析)和其他一些非机器学习的方法(模糊集、粗糙集和统计学习理论),分析了各种统计方法的优缺点。关键词:数据挖掘;回归分析;主成分分析;判别分析;聚类分析;模糊集;粗糙集;支持向量机/,&("0%1&2",3&*&2+&21*.4’15,26%’+2,7*&*)2,2,8231456789:;<=,231>5?@:A=8(?@’78B@7CDC89E8@F=A;@DG,?@’78)"&!,*<@87)9:+&(*1&:HD7D@;D@
3、I7JD=I<8@K6=;<7F=L7D6A=M7;=;CNL7D<;,=87MJ=DC@8D=AOA=DI<7A7ID=A@;D@I;CNP7D778P<7F=L6I<7OOJ@I7:D@C8@8P7D7L@8@89$Q8D<@;O7O=A,R=A=F@=R;D7D@;D@I7JD=I<8@K6=;6;=P6;67JJG,@8IJ6P@89DA7P@D@C87J;D7D@;D@I7JD=I<8@K6=;78PD=I<:8@K6=;R<@I<7A=8CDL7I<@8=J=7A8@89D=I<8@K6=$/<=7P
4、F78D79=;78PP@;7PF78D79=;CN=F=AG;D7D@;D@I7JD=I<8@K6=;7A=787JGS=P$;’<="(0+:P7D7L@8@89;A=9A=;;@C8787JG;@;;OA@8I@O7JICLOC8=8D787JG;@;;P@;IA@L@878D787JG;@;;IJ6;D=A@89787JG;@;;N6SSG;=D;AC69<;=D;;6OOCADF=IDCAL7I<@8=化。数据挖掘主要有统计方法(因为基本的数据分析来>引言自于这个领域,许多数据分析问题存在统计解决方法)
5、近年来,数据挖掘引起了信息产业界的极大关注,和机器学习(它从另外的方式去处理数据,可以自动地其主要原因是存在大量数据,可以广泛使用,并且迫切产生和证实假设,分别描述假设)两种方法。此文中主需要将这些数据转换成有用的信息和知识。获取的信息要是回顾数据挖掘中的统计方法。和知识可以广泛用于各种应用,包括商务管理、生产控制、市场分析和科学探索等。?数据挖掘的统计方法知识挖掘最新的描述性定义是由E;7L7T$[#,,]%V"回归分析["]:数据挖掘是从数据集中识别出有设有!个自变量(预报因子)",⋯,",#个U7GGG7P
6、等给出的"!效的、新颖的、潜在有用的,以及最终可理解的模式的因变量$,⋯,$,相应的%组观测资料是"#非平凡过程。数据挖掘的基本过程和主要步骤如图"所"&",⋯,",$&",⋯,$,&’",%,⋯,%(示["&]。用矩阵来表示,可得资料矩阵)’($&!),+’("&!),%*#%*!如果因变量$与自变量",⋯,"之间有线性关系!"!式,且$的值又带有误差,于是有!$!’"&!,""!"","%!"%,⋯,"!!"!,#!,!’",⋯(#(写成矩阵形式,就是""&""""⋯"!"$""$图"数据挖掘过程的步
7、骤"$"$⋯"#"$"&%""%"!%""’,数据挖掘是一个多学科领域[%],包括数据库技术、#$%##%##⋯%#"%#"""#"!#!人工智能、机器学习、神经网络、统计学、模式识别、统计问题就是从已知的资料矩阵)和+出发,如何求知识库系统、知识获取、信息检索、高性能计算和可视得上式中的这些未知常数,并且对误差#作出估计"&-.和推断。称为回归系数,而略去误差后的关系式"&-收稿日期:%&&’(&)(%"。$!’"&!,""!"","%!"%,⋯,"!!"!,!’",⋯(/(基金项目:国家重点基础研究发展规
8、划项目(%&&"*+’&!#&,)称为回归方程。用最小二乘法求解。作者简介:赵广社("!--(),男,陕西省乾县人,副教授,主要"&-回归是学习一个函数,这个函数是将数据项映射为从事图像测量与信息融合理论、数据挖掘与知识发现以及嵌入式系统的研究。第!"期赵广社:数据挖掘中的统计方法概述·#!$·!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!