新决策树例子.docx

新决策树例子.docx

ID:59193717

大小:405.30 KB

页数:18页

时间:2020-09-10

新决策树例子.docx_第1页
新决策树例子.docx_第2页
新决策树例子.docx_第3页
新决策树例子.docx_第4页
新决策树例子.docx_第5页
资源描述:

《新决策树例子.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、rpart包的rpart函数Iris数据集library(rpart)#加载rpart包head(iris)#看看iris数据集里有哪些变量iris以鸢尾花的特征作为数据来源,数据集包含150个数据,分为3类,每类50个数据,每个数据包含4个属性分别是花萼长度、花萼宽带、花瓣长度、花瓣宽度用gini度量纯度iris.rp1=rpart(Species~.,data=iris,method="class",parms=list(split="gini"))#rpart(formula,data,method,parms,...)得到决策树对象,其中(1)formula是回归方程的形式

2、,y~x1+x2+…,iris一共有5个变量,因变量是Species,自变量是其余四个变量,所以formula可以省略为Species~.(2)data是所要学习的数据集(3)method根据因变量的数据类型有如下几种选择:anova(连续型),poisson(计数型),class(离散型),exp(生存型),因为我们的因变量是花的种类,属于离散型,所以method选择class(4)parms可以设置纯度的度量方法,有gini(默认)和information(信息增益)两种。plot(iris.rp1,uniform=T,branch=0,margin=0.1,main="Cla

3、ssificationTreeIrisSpeciesbyPetalandSepalLength")#plot的对象是由rpart得到的决策树对象,可以把这课决策树画出来,其中(1)uniform可取T,F两个值,T表示图形在空间上均匀分配(2)branch刻画分支的形状,取值在0和1之间,branch=0是倒v型,branch=1是直角型,而当branch属于(0,1)时是梯形(3)margin刻画图的大小,margin越大,决策树越小,上述三幅图的margin=0.1,而当margin=1时,决策树变小了(4)main是图的标题,其中“”是换行的意思text(iris.r

4、p1,use.n=T,fancy=T,col="blue")text(iris.rp1,use.n=T,fancy=F,col="blue")(1)use.n=T,在每个节点处都会显示落在该节点的观测个数和对应的分类,use.n=F时就不显示观测个数了。(2)fancy=T、F的区别见上图(3)col=“blue”就是写在树上的信息的颜色。还有另一种画图函数library(rpart.plot)rpart.plot(iris.rp1,branch=0,branch.type=2,type=1,extra=1,shadow.col="gray",box.col="green",bor

5、der.col="blue",split.col="red",main="决策树")rpart.plot(iris.rp1,branch=0,branch.type=0,type=1,extra=1,shadow.col="gray",box.col="green",border.col="blue",split.col="red",main="决策树")(1)branch.type是分支的形状参数,branch.type=0时画出来的分支跟plot里的一样,就是一条线,而当branch.type=2时,分支的宽度是数据的标准差,branch.type=1时,是方差(2)type:

6、type=0只对叶子节点画圆圈。type=1对根节点和叶子节点画圆圈,分裂属性的值会写在节点框的上面。type=2时跟type=1近似,但分裂属性的值会写在节点框的下面。type=3时每个根节点左右分支对应的属性的取值范围都标出来了(之前那些都只标了左分支的属性取值),并且只对叶子节点画圆圈。type=4时,跟type=3近似,但对叶子节点和根节点都画圆圈。(1)extra是表示在节点处显示的额外信息的种类。当extra=0(缺省值)时,无额外信息。当extra=1,在节点处会显示落在该节点的观测个数和对应的分类(如上图)。当extra=2,在节点处会显示(在该点分类正确的个数/落

7、在该节点的观测个数)。(1)shadow.col="gray",box.col="green",border.col="blue",split.col="red"分别是决策树中节点框的阴影颜色、填充颜色、边框颜色、和分类属性的颜色用信息增益度量纯度iris.rp2=rpart(Species~.,data=iris,method="class",parms=list(split="information"))plot(iris.rp2,uniform=T,branch

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。