资源描述:
《r语言入门,向量、多维数组和矩阵》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、实验目的实验内容学习S语言中向量、多维数组和矩阵的表示方法1、数据表示2、应用实例3、实验作业S向量、多维数组和矩阵S语言是基于对象(Object)的语言基本的数据类型有:向量、矩阵、列表等复杂的数据对象有:数据框对象,时间序列对象,模型对象,图形对象,等等。S语言表达式可以使用常量和变量。变量名:由字母、数字、句点组成,第一个字符必须是字母,长度没有限制,但区分大小写。特别要注意句点可以作为名字的合法部分。常量常量为:数值型、逻辑型和字符型三种,其中数值型数据又可以分为整型、单精度、双精度等例如,123,123.45,1.2345e30是数值型常量
2、;“Weight”,“李明”是字符型;逻辑真值写为T或TRUE(注意区分大小写,写t或true都没意义),逻辑假值写为F或FALSE。复数常量就用3.5-2.1i这样的写法表示。S中的数据可以取缺失值,用符号NA代表缺失值。函数is.na(x)返回x是否缺失值(返回值T或F)。向量(Vector)与赋值向量是有相同基本类型的元素序列,即一维数组定义向量的最常用办法是使用函数c(),它把若干个数值或字符串组合为一个向量,比如:>x=c(1:3,10:13)>x[1]12310111213S中用符号“<-”、“=”来为变量赋值。另一种赋值的办法是用ass
3、ign函数,比如>x1=c(1,2)和>assign(“x1”,c(1,2))相同函数length(x)可以计算向量x的长度。向量运算可以对向量进行加(+)减(-)乘(*)除(/)、乘方(^)运算,其含意是对向量的每一个元素进行运算。例如:>x<-c(1,4,6.25)>y=x*2+1>y[1]3.09.013.5%/%表示整数除法(比如5%/%3为1),%%表示求余数(如5%%3为2)。可以用向量作为函数自变量,sqrt、log、exp、sin、cos、tan等函数都可以用向量作自变量,结果是对向量的每一个元素取相应的函数值函数min和max分别取
4、向量自变量的最小值和最大值,函数sum计算向量自变量的元素和,函数mean计算均值,函数var计算样本方差(分母为n-1),函数sd计算标准差(在Splus中用sqrt(var())计算)如果求var(x)而x是矩阵,则结果为样本协方差阵。(行向量为观测值)随机向量记X=(X1,X2,…,Xp)'为p维随机向量,对X=(X1,X2,…,Xp)'进行一次观测,得观测值:(x11,x12,…,x1p)=X'(1),它是一个样品。对X=(X1,X2,…,Xp)'进行观测n次,得n个样品:X'(i)=(xi1,xi2,…,xip),i=1,…,n它是一个样本
5、.用矩阵记为如下称为样本数据阵.多元总体样本的数字特征其中(1)样本均值向量X:多元总体样本的数字特征其中(2)样本离差阵(又称交叉乘积阵)A:(3)样本协方差阵S:多元总体样本的数字特征其中称为变量Xi的样本方差;样本方差的平方根¯称为变量Xi的样本标准差.sii(4)样本相关阵R:多元总体样本的数字特征其中sort(x)返回x的元素从小到大排序的结果向量order(x)返回使得x从小到大排列的元素下标向量(x[order(x)]等效于sort(x))。>x=c(2,4,8,6,10)>order(x)[1]12435>x[order(x)][
6、1]246810任何数与缺失值的运算结果仍为缺失值。例如,>2*c(1,NA,2)[1]2NA4>sum(c(1,NA,2))[1]NA产生有规律的数列在S中很容易产生一个等差数列。例如,1:n产生从1到n的整数列,-2:3产生从-2到3的整数列,5:2产生反向的数列:注意1:n-1不是代表1到n-1而是向量1:n减去1,>1:n-1[1]01234>1:(n-1)[1]1234seq函数是更一般的等差数列函数。如只指定一个自变量n>0,则seq(n)相当于1:n。指定两个自变量时,第一量是开始值,第二量是结束值,如seq(-2,3)是从-2到3,默
7、认公差为1。S函数调用的一个很好的特点是它可以使用不同个数的自变量,函数可以对不同类型的自变量给出不同结果,自变量可以用“自变量名=自变量值”的形式指定。例如,seq(-2,3)可以写成seq(from=-2,to=3)。可以用一个by参数指定等差数列的增加值,例如:>seq(0,2,0.7)[1]0.00.71.4也可以写成seq(from=0,to=2,by=0.7)。有参数名的参数的次序任意,如:>seq(0,by=0.7,to=2)[1]0.00.71.4可以用length参数指定数列长度,如seq(from=10,length=5)产生10
8、到14。seq函数还可以用一种seq(along=向量名)的格式,这时只能用这一个参数,产生该向量的下标序列