《r语言课件》第七课多元统计分析

《r语言课件》第七课多元统计分析

ID:42387554

大小:567.50 KB

页数:16页

时间:2019-09-14

《r语言课件》第七课多元统计分析_第1页
《r语言课件》第七课多元统计分析_第2页
《r语言课件》第七课多元统计分析_第3页
《r语言课件》第七课多元统计分析_第4页
《r语言课件》第七课多元统计分析_第5页
资源描述:

《《r语言课件》第七课多元统计分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、数据挖掘十大经典数据挖掘算法是那些?数据挖掘十大经典算法可以分为以下情况。1与分类相关的算法:C4.5(分类决策树),CART(分类与回归树儿NaiveBayes(朴素贝叶斯),KNN(K近邻分类),SVM(支持向量机),EM(最大期望),AdaBoost;与聚类相关的算法:(K-Means)K均值;3与关联规则相关的算法:Apriori;1.判别分析是用于判别个体所属群体的一种统计方法,属于分类。判别通常由3种方法:距离判别、Fisher判别和Bayes判别,它们本质上属于线性判别和二次判别,R并没有给出这3种判别,而是3中判别法综合在一起,分

2、别给出线性判别函数lda()和二次判别函数qda()函数。kk()和qda()使用前,需要加载MASS程序包:library(MASS)它们的使用形式基本相同,有公式形式,矩阵或数据框形式两种:公式格式为:(加载MASS包:library(MASS))lda(formula9data,・・・,subset,na.action)qda(formula9data,・・・,subset,na.action)参数formula为公式,形如groups-xl+x2+...,data为数据构成的数据框,subset为可选择向量,表示观察值的子集,^.acti

3、on为函数,表示处理缺失数据的方法。lda()函数的返回值有:调用方法、先验概率、每一类样本的均值和线性判别系数,qda()函数的返回值与lda()函数的返回值相同,只是没有线性判别系数,因此,无论预测还是回代,还需要有预测函数predict()函数。对于lda()函数而言,predict)函数的使用格式:predict(object,newdata,prior=object$prior9dimen,method=c(uplug-inM,**predictive*1/Mebiased^),...)对于qda()函数而言,predict(数的使用格

4、式:predict(object,newdata,prior=object$prior,method二c(“plug・in”Jpr£dictive",”debiased”,”looCV”),・・・)参数object为lda()函数或qda()函数生成的对象;当lda()或qda()使用公式形式计算时,newdata为预测数据构成的数据屆当lda(咸qda()使用矩阵或因子计算时,newdata为向量,默认值为全体训练样本;prior为先验概率,默认值使用对象的先验概率,dimen为使用空间的维数,method为参数估计的方法。predict()函

5、数的返回值有:$class份类),$posterior(后验概率),$x(qda函数无此项)。例1某气象站检测前14年气象的实际资料如下表,有两项综合预报因子,其中有春旱的是6个年份资料,无春旱的是8个年份资料,今年测到两个指标的数据为(23・5,・1・6),试用lda()函数和qda()函数对数据做判别分析,并预报今年是否有春旱。表某气象站有无春旱的资料序号春旱无春旱124.8-2.022.1-0.7224.1-2.421.6-1.4326.6-3.022.0-0.8423.5-1.922.8-1.6525.5-2.122.7-1.5627.4

6、・3・121.5-1.0722.1-1.2821.4-1.3解:数据框输入数据,格式调用library(MASS)exam.data<-data.frame(Xl=c(24.8,24.1,26.6,23.5,25.5,27.4,22.1,21.6,22.0,22.8,22.7,21.5,22.1,21.4),X2=c(-2.0,-2.4,-3.0,-1.9,-2.1,-3.1,•0.7,-1.4,-0.8,-1.6,-1.5,-1.0,-1.2,-1.3),sp=rep(c(nHaveH,nNoH),c(6,8)))new<-data.frame

7、(Xl=23.5,X2=-1.6)Ida.solv・lda(sp〜X1+X2,data=exam.data)predict(lda>sol9new)$classtable(exam>data$sp9predict(lda.sol)$class)##看二次判别结果:qda.solv・qda(sp~X1+X2,data=exam.data)predict(qda.sol9new)$classtable(exam>data$sp9predict(qda>sol)$class)同学自己看一下,lda()和qda()结果是否一样?例2(FisherIris

8、数据)Iris数据有4个属性,萼片的长度、萼片的宽度、花瓣长度和花瓣的宽度。数据共150个样本,分为3类,前50个数据为第一类一一Set

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。