资源描述:
《R语言统计分析作业.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、T<-read.table("G:/学习文件夹/R语言/R语言作业/5/住房状况调查.csv",header=TRUE,sep=",")1、对变量计划户型制作一张频数分布表,并绘制相应的图形,写出相应的结论(请写出R代码)table(T$计划户型)2、请对变量计划面积选择正确的图形进行描述,写出相应的结论(请写出R代码);hist(T$计划面积,col="lightgreen")3、对变量计划面积,计算样本数、平均值、中位数、修剪均值、样本标准差、偏态系数、峰态系数、最大值、最小值、上下四分位数,并对计划面积的分布特征进行综合分析(请写出R代码);t<-na.omit(T$计划面
2、积)summary(t)library("psych")describe(t)根据第二题的直方图显示,计划面积的数据分布是非对称分布,其中位数为100,平均数为101.6,上四分位数为80.0,下四分位数为120.0,分位数之差是40.04、请选用合适的图形来展示变量计划户型和变量从业状况之间的关系,并进行独立性检验;(请写出R代码);t<-na.omit(T)b<-data.frame(t$从业状况,t$计划户型)a<-table(b)barplot(a,main="从业状况与计划户型的关系",ylab="频数",col=c(rainbow(6)),beside=TRUE)su
3、mmary(assocstats(a))H0:计划户型与从业状况独立,即两个变量不关联;H1:计划户型与从业状况不独立,即两个变量关联;Pearson卡方检验结果表明,n=719,X-squared=129.270,df=50,p-value=6.0761e-09,小于0.05,拒绝原假设,Cramer′sV=0.19,有证据表明计划户型与从业状况不独立。5、请选用合适的图形来展示变量户口状况和变量现住面积之间的关系;如果想分析变量户口状况是否对变量现住面积产生显著性影响,应该采取哪种统计分析方法?户口状况是否对变量现住面积产生显著性影响?为什么?(请写出R代码)c<-data.
4、frame(T$户口状况,T$现住面积)boxplot(T$现住面积~T$户口状况,data=c,ylab="现住面积",xlab="户口状况",varwidth=TRUE,col="red2")如果想分析变量户口状况是否对变量现住面积产生显著性影响:(1)首先,现住面积是大样本数据,检验方差齐性时可以使用Levene检验,分析本市户口人民的现住面积与外地户口人民的现住面积之间的总体方差是否有显著性差异。根据R输出结果,F=5.4041,p-value=0.02016,p-value小于0.05,拒绝原假设;有证据表明本市户口人民的现住面积与外地户口人民的现住面积之间的总体方差存
5、在显著差异。leveneTest(T$现住面积~T$户口状况,data=T)(2)本研究使用了独立样本t检验方法,分析本地户口人民的现住面积和外地户口人民的现住面积之间是否存在显著差异。t.test(T$现住面积~T$户口状况,data=T)cohensD(现住面积~户口状况,data=T,method="unequal")由于t=3.3136,d=0.,df=182.43,p值=0.,p值小于0.05,所以拒绝原假设。有证据表明本地户口人民的现住面积和外地户口人民的现住面积之间存在显著差异。但本案例的效应不大。6、如果想分析变量文化程度是否对变量家庭收入产生显著性影响,应该采取
6、哪种统计分析方法?文化程度是否对变量家庭收入产生显著性影响?为什么?(请写出R代码)attach(T)shapiro.test(家庭收入[文化程度=="初中及以下"])shapiro.test(家庭收入[文化程度=="大学(专、本科)"])shapiro.test(家庭收入[文化程度=="高中(中专)"])shapiro.test(家庭收入[文化程度=="研究生及以上"])原假设:文化程度为“初中及以下”时的家庭收入来自于正态总体;备择假设:文化程度为“初中及以下”时的家庭收入不来自于正态总体。原假设:文化程度为“大学(专、本科)”时的家庭收入自于正态总体;备择假设:文化程度为“
7、大学(专、本科)”时的家庭收入不来自于正态总体。原假设:文化程度为“高中(中专)”时的家庭收入来自于正态总体;备择假设:文化程度为“高中(中专)”时的家庭收入不来自于正态总体。原假设:文化程度为“研究生及以上”时的家庭收入来自于正态总体;备择假设:文化程度为“研究生及以上”时的家庭收入不来自于正态总体。根据输出结果,n1=805,n2=896,n3=1258,n4=34,各组的p值均小于0.05,拒绝原假设,有证据表明各组数据不服从正态分布。describe.by(家庭收入,文化