资源描述:
《R语言中级篇ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、SectionII基础统计与数学模型数据的产生dat1<-rnorm(20)#####一组数的平均值dat1dat2<-rnorm(10,mean=7,sd=5)dat21基础统计数据检验正态W检验方法shapiro.test(),提供了W的统计量和检验P值,我们当P>0.05时候,我们可以认为这组数据是正态的,但是适用条件是所测的数据个数在3and5000之间格式test.nor<-dat$biomassshapiro.test(test.nor)格式binom.test(x,n,p=0.5,alternative=c(“two.si
2、ded”,“less”,“greater”),conf.level=0.95)####数据是否是二项分布的binom.test(c(682,243),p=3/4)binom.test(682,682+243,p=3/4)#Thesame1基础统计求一组数据的95%置信区间xbar<-mean(x)#####一组数的平均值sigma<-sd(x)####标准差sem<-sigma/sqrt(length(x))####平均标准误low<-xbar+sem*qnorm(0.025)###置信区间下限high<-xbar+sem*qnorm(
3、0.975)####置信区间上限1基础统计随机抽样(randomsampling)sample(x,size,replace=FALSE)a<-1:40asample(a,6,replace=FALSE)sample(c("H","T"),10,replace=T)>[1]"T""H""T""H""T""H""H""H""H""T"1基础统计概率统计(Probability)a<-1:40asample(a,6)40个数字中,抽取想要的6个数字,由于是非放回抽样,每个抽取数字的概率分别为:1/40,1/39,1/38,1/37,1/36
4、,1/351基础统计整体的概率:Pro<-1/prod(40:35)如果是仅仅选取5个数字,那么就有不同组合,总体的概率为prod(5:1)/prod(40:35)或者是:1/choose(40,5)数据分布-密度图(Densities)x<-seq(-4,4,0.1)plot(x,dnorm(x),type="l")1基础统计数据分布-密度图(Densities)x<-0:50plot(x,dbinom(x,size=50,prob=.33),type="h")###prob解释##probabilityofsuccessoneach
5、trial1基础统计基础统计练习x<-rnorm(20)#####产生一组随机树Exercise:##编辑一个能够返回所有基本统计量的函数var(x)mean(x)sd(x)1基础统计R语言中求导###############R语言求导y=D(expression(sin(x)+x^3),'x')x=2;eval(y);###就可以计算出f(2);值y=deriv(expression(sin(x)+x^3),'x',function.arg=T)y(2)1基础统计Apply函数的应用函数格式:apply(X,MARGIN,FUN,..
6、.)###MARGIN可以选择,1为按行,2为按列dat<-matrix(1:6,2,3)#######创建一个2×3的矩阵apply(dat,1,mean)apply(dat,2,mean)apply(dat,1,sd)Ex:a<-tapply(dat$biomass,dat$disturb,mean)1基础统计2、一般线性模型(GeneralLinearmodels)2.1一般线性模型(GeneralLinearmodels)一般线性回归模型generallinearmodels##Note1:适用的假设前提是1)变量的独立性,非独
7、立的变量会有很多意想不到的结果出现;2)正态的残差分布;3)方差齐性;4)小的采样误差##Note2;线性模型lm:自变量是连续变量(即x是1,2,3,4,4.5这种);ANOVA:变量是因子型的(比如加温、森林干扰类型等);ANCOVA:既有因子变量又有连续变量2.1一般线性模型(GeneralLinearmodels)线性回归模型lm()lm(formula,data,subset,weights,na.action,method="qr",model=TRUE,x=FALSE,y=FALSE,qr=TRUE,singular.ok
8、=TRUE,contrasts=NULL,offset,...)Ex1:dat<-read.csv("data_eg1.csv",head=T)head(dat)lm.model<-lm(biomass~n