统计软件R作业——adult、babiesI数据课件.pptx

统计软件R作业——adult、babiesI数据课件.pptx

ID:57374107

大小:1.95 MB

页数:51页

时间:2020-08-13

统计软件R作业——adult、babiesI数据课件.pptx_第1页
统计软件R作业——adult、babiesI数据课件.pptx_第2页
统计软件R作业——adult、babiesI数据课件.pptx_第3页
统计软件R作业——adult、babiesI数据课件.pptx_第4页
统计软件R作业——adult、babiesI数据课件.pptx_第5页
资源描述:

《统计软件R作业——adult、babiesI数据课件.pptx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、《数据分析与统计软件》作业姓名:杨烨军学号:2019110148——adult、babiesI数据第一部分adult数据22.4:组合方法:adaboost、bagging、随机森林分析2.1、2.2、2.3:rpart分析2.5:最近邻方法分析2.6:人工神经网络分析2.8:关联规则分析2.7:支持向量机分析1数据简介目录1.数据简介数据来自于1994年人口普查数据,经过年龄>16、AGI>100、AFNLWGT>1和每周工作时间>0等条件筛选。共有48842个观测,其中:训练集32561个观测,测试集16281个观测。15个变量,其中

2、:6个连续性变量,9个名义变量。资料来源:archive.ics.uci.edu/ml/datasets/Adult任务:预测人们收入是否超过5万/年。变量描述序号变量名序号变量名1class:分类(>50K,<=50K)9relationship:关系(妻子、丈夫等)2age:年龄(连续变量)10race:种族(白人、黑人等)3workclass:工作类别(私人、不工作等)11sex:性别(女、男)4fnlwgt:(连续性变量)12capital.gain:财产收益(连续变量)5education:教育(学士、硕士、博士等)13capi

3、tal.loss:财产损失(连续变量)6education.num:教育年限(连续变量)14hours.per.week:每周工作时间(连续变量)7marital.status:婚姻状况(未婚、已婚配偶为军人、已婚配偶为平民等)15native.country:国籍(美国、柬埔寨、英国等)8occupation:职业(技术支持、销售等)数据概览ageworkclassfnlwgteducationeducation.nummarital.status139State-gov77516Bachelors13Never-married250S

4、elf-emp-not-inc83311Bachelors13Married-civ-spouse338Private215646HS-grad9Divorced453Private23472111th7Married-civ-spouse528Private338409Bachelors13Married-civ-spouseoccupationrelationshipracesexcapital.gaincapital.loss1Adm-clericalNot-in-familyWhiteMale217402Exec-manageri

5、alHusbandWhiteMale003Handlers-cleanersNot-in-familyWhiteMale004Handlers-cleanersHusbandBlackMale005Prof-specialtyWifeBlackFemale00hours.per.weeknative.countryclass140United-States<=50K213United-States<=50K340United-States<=50K440United-States<=50K540Cuba<=50K2.1分类树rpart分析

6、:程序library(rpart);w=read.table("e:/adult.txt",header=TRUE,sep=",");wt=read.table("e:/adulttest.txt",header=TRUE,sep=",");summary(w);summary(wt);(b=rpart(class~.,w));b;plot(b,uniform=T,branch=1,margin=0.1,cex=0.9);text(b,cex=0.85);table(predict(b,w,type="class"),w[["class"

7、]]);table(predict(b,wt,type="class"),wt[["class"]])2.1分类树rpart分析:输出结果n=32561node),split,n,loss,yval,(yprob)*denotesterminalnode1)root325617841<=50K(0.759190440.24080956)2)relationship=Not-in-family,Other-relative,Own-child,Unmarried178001178<=50K(0.933820220.06617978)4)ca

8、pital.gain<7073.517482872<=50K(0.950120190.04987988)*5)capital.gain>=7073.531812>50K(0.037735850

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。