资源描述:
《统计软件R作业——adult、babiesI数据课件.pptx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、《数据分析与统计软件》作业姓名:杨烨军学号:2019110148——adult、babiesI数据第一部分adult数据22.4:组合方法:adaboost、bagging、随机森林分析2.1、2.2、2.3:rpart分析2.5:最近邻方法分析2.6:人工神经网络分析2.8:关联规则分析2.7:支持向量机分析1数据简介目录1.数据简介数据来自于1994年人口普查数据,经过年龄>16、AGI>100、AFNLWGT>1和每周工作时间>0等条件筛选。共有48842个观测,其中:训练集32561个观测,测试集16281个观测。15个变量,其中
2、:6个连续性变量,9个名义变量。资料来源:archive.ics.uci.edu/ml/datasets/Adult任务:预测人们收入是否超过5万/年。变量描述序号变量名序号变量名1class:分类(>50K,<=50K)9relationship:关系(妻子、丈夫等)2age:年龄(连续变量)10race:种族(白人、黑人等)3workclass:工作类别(私人、不工作等)11sex:性别(女、男)4fnlwgt:(连续性变量)12capital.gain:财产收益(连续变量)5education:教育(学士、硕士、博士等)13capi
3、tal.loss:财产损失(连续变量)6education.num:教育年限(连续变量)14hours.per.week:每周工作时间(连续变量)7marital.status:婚姻状况(未婚、已婚配偶为军人、已婚配偶为平民等)15native.country:国籍(美国、柬埔寨、英国等)8occupation:职业(技术支持、销售等)数据概览ageworkclassfnlwgteducationeducation.nummarital.status139State-gov77516Bachelors13Never-married250S
4、elf-emp-not-inc83311Bachelors13Married-civ-spouse338Private215646HS-grad9Divorced453Private23472111th7Married-civ-spouse528Private338409Bachelors13Married-civ-spouseoccupationrelationshipracesexcapital.gaincapital.loss1Adm-clericalNot-in-familyWhiteMale217402Exec-manageri
5、alHusbandWhiteMale003Handlers-cleanersNot-in-familyWhiteMale004Handlers-cleanersHusbandBlackMale005Prof-specialtyWifeBlackFemale00hours.per.weeknative.countryclass140United-States<=50K213United-States<=50K340United-States<=50K440United-States<=50K540Cuba<=50K2.1分类树rpart分析
6、:程序library(rpart);w=read.table("e:/adult.txt",header=TRUE,sep=",");wt=read.table("e:/adulttest.txt",header=TRUE,sep=",");summary(w);summary(wt);(b=rpart(class~.,w));b;plot(b,uniform=T,branch=1,margin=0.1,cex=0.9);text(b,cex=0.85);table(predict(b,w,type="class"),w[["class"
7、]]);table(predict(b,wt,type="class"),wt[["class"]])2.1分类树rpart分析:输出结果n=32561node),split,n,loss,yval,(yprob)*denotesterminalnode1)root325617841<=50K(0.759190440.24080956)2)relationship=Not-in-family,Other-relative,Own-child,Unmarried178001178<=50K(0.933820220.06617978)4)ca
8、pital.gain<7073.517482872<=50K(0.950120190.04987988)*5)capital.gain>=7073.531812>50K(0.037735850