资源描述:
《吴喜之-统计学基本概念和方法-第三章数据的描述.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第三章数据的描述R语言简介数字,字符与向量向量的赋值X<-c(10.4,5.6,3.1,6.4,21.7)Assign(“x”,c(10.4,5.6,3.1,6.4,21.7))c(10.4,5.6,3.1,6.4,21.7)->xY<-c(x,0,x)数字,字符与向量向量的运算X<-c(-1,0,2);y<-c(3,8,2)V<-2*x+y+1X*yx/yX^2Y^x数字,字符与向量求向量最小,最大和范围min,max,rangeWhich.min,which.max求和,乘积等Sum,prod,length中位数,均值
2、,方差,标准差和顺序统计量Median,mean,var,sort数字,字符和向量产生有规律的序列等差数列X<-1:6等间隔函数Seq(from=v1,to=v2,by=v3)重复序列X<-Rep(x,times=3)数字,字符和向量字符向量Labs<-Paste(“X”,1:6,sep=“”)复数向量X<-seq(-pi,pi,by=pi/10)y<-sin(x)Z<-complex(re=x,im=y)Plot(z)数字,字符和向量将向量定义成数组z<-1:12,Dim(z)<-c(3,4)用array构造数组X<-a
3、rray(1:20,dim=c(4,5))用matrix构造矩阵A<-matrix(1:15,nrow=3,ncol=5,byrow=TRUE)数字,字符和向量数组下标A<-1:24,dim(A)4、据的图形描述在对数据进行深入加工之前,总应该对数据有所印象。可以借助于图形和简单的运算,来了解数据的一些特征。由于数据是从总体中产生的,其特征也反映了总体的特征。对数据的描述也是对其总体的一个近似的描述。图的种类基本绘图函数函数名功能Plot(x)以x的元素作为纵坐标,以序号为横坐标作图Plot(x,y)以x,y二元作图Pie(x)饼图Boxplot(x)盒形图HistX的频率直方图Barplot(x)X值的条形图Paris(x)如果x是矩阵或是数据框,作x的各列之间的二元图coplot(x~y
5、z)关于z的每个数值(或数
6、值区间)绘制x与y的二元图matplot(x,y)二元图,其中x的第一列对应y的第一列,依次类推qqnorm(x)正态分位数-分位数图image(x,y,z)x,y,z三元图heatmap(x)热图二元函数图形饼图定性变量(或属性变量,分类变量)不能点出直方图、散点图或茎叶图,但可以描绘出它们各类的比例。易于显示每一组的相对大小用于显示每一组有多少个观测数时不是很好最早的饼图直方图对于一个定量变量,比如某个地区测量了163个高三男生的身高。用图形来表示这个数据,使人们能够看出这个数据的大体分布或“形状”的一个办法是画直方图
7、(histogram)图像直方图图像的直方图图像的直方图直方图分割经验分布经验分布函数核密度估计核密度函数用density()函数可以绘制与直方图配套的核密度估计。density的一般用法为:density(x,bw="nrd0",adjust=1,kernel=c("gaussian","…"),window=kernel,width…)bw是带宽,默认值R画出光滑图形;kernel是核函数;adjust表示实际带宽是adjust*bw。其他参数详见帮助文档。>w<-c(75,64,47.4,66.9,62.2,62.2
8、,58.7,63.5,66.6,64,57,69,56.9,50,72)>hist(w,freq=F);>w.density<-density(w);w.densityCall:density.default(x=w)Data:w(15obs.);Bandwidth'bw'=3.478xyMin.:36.97Min.:9.044e-051stQu.:49.081stQu.:4.402e-03Median:61.20Median:1.603e-02Mean:61.20Mean:2.061e-023rdQu.:73.323rd
9、Qu.:3.409e-02Max.:85.43Max.:5.518e-02>lines(w.density,col="blue");>x<-44:76;>lines(x,dnorm(x,mean(w),sd(w)),col="red");盒型图简单一些的是盒形图(boxplot,又称箱图、箱线图、盒子图