利用r语言进行机器学习

利用r语言进行机器学习

ID:5450109

大小:745.00 KB

页数:32页

时间:2017-11-15

利用r语言进行机器学习_第1页
利用r语言进行机器学习_第2页
利用r语言进行机器学习_第3页
利用r语言进行机器学习_第4页
利用r语言进行机器学习_第5页
资源描述:

《利用r语言进行机器学习》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、利用R语言进行机器学习利用R语言进行机器学习R语言简介R语言特性机器学习基本概念与一般步骤R语言对机器学习的支持利用R语言进行机器学习实例1.R语言简介R语言是从S语言演变而来的。S语言是二十世纪70年代诞生于贝尔实验室,由RickBecker,JohnChambers,AllanWilks开发。基于S语言开发的商业软件Splus,可以方便的编写函数、建立模型,具有良好的扩展性,取得了巨大成功。1995年由新西兰Auckland大学统计系的RobertGentleman和RossIhaka,编写了一种能执行S语言的软件,并将该软件的源代码全部公开,这就是R软件,其命令统称为R语言。htt

2、p://www.tiobe.com/tiobe-index/r/http://www.tiobe.com/tiobe-index/r/2.R语言特性R语言具有一些非常值得推荐的特性:多领域的统计资源;跨平台R可在多种操作系统下运行;命令行驱动R即时解释:输入命令,即可获得相应的结果;R拥有众多的工具包涵盖统计模型,机器学习,数据可视化,数据导入和导出以及数据整理各个方面。3.机器学习基本概念与一般步骤人是怎么样学习的?记忆——理解教学——自学观察、模仿、类比、归纳、解释思考以获取知识反复练习以获得技能长年累月的学习3.机器学习基本概念与一般步骤机器怎样学习?模仿人类?有教师学习——无教师

3、学习——强化学习学习的方法记忆学习示例学习推理学习归纳学习类别学习3.机器学习基本概念与一般步骤(1)收集数据(2)探索数据和准备数据(3)基于数据训练模型(4)评价模型的性能(5)改进模型的性能4.R语言对机器学习的支持https://site.douban.com/269412/widget/notes/191094910/note/535690481/5.利用R语言进行机器学习实例决策树技术用于分类和预测;以实例为基础的归纳学习算法;它着眼于从一组无次序、无规则的事例中推理出决策树表示形式的分类规则。5.利用R语言进行机器学习实例决策树技术决策树学习通过包括三个步骤:特征选择、决策

4、树的生成、决策树的剪枝;决策树算法ID3、C4.5、CART5.利用R语言进行机器学习实例决策树输入:学习集输出:分类规则(决策树)决策树的表示5.利用R语言进行机器学习实例用社区网址中不真实账号检测的例子来说明如何使用ID3算法构造决策树。为了简单起见,我们假设训练集合中包含10个元素,其中:s,m和l分别表示小、中和大。5.利用R语言进行机器学习实例日志密度好友密度是否使用真实头像账号是否真实ssnonoslyesyeslmyesyesmmyesyeslmyesyesmlnoyesmsnonolmnoyesmsnoyesssyesno5.利用R语言进行机器学习实例信息增益是特征选择中

5、的一个重要指标:它定义为一个特征能够为分类系统带来多少信息,带来的信息越多,该特征越重要。那么如何衡量一个特征为分类系统带来的信息多少呢?对一个特征而言,系统有它和没它时信息量将发生变化,而前后信息量的差值就是这个特征给系统带来的信息量。所谓信息量,其实就是熵。5.利用R语言进行机器学习实例信息增益熵有这么一个变量X,它可能的取值有n多种,分别是x1,x2,……,xn,每一种取到的概率分别是P1,P2,……,Pn,那么X的熵就定义为:5.利用R语言进行机器学习实例信息增益条件熵设有随机变量(X,Y),其联合概率分布为:条件熵H(Y

6、X)表示在已知随机变量X的条件下随机变量Y的不确定性。5

7、.利用R语言进行机器学习实例信息增益条件熵随机变量X给定的条件下随机变量Y的条件熵H(Y

8、X),就定义为X给定条件下Y的条件概率分布的熵对X的数学期望5.利用R语言进行机器学习实例信息增益特征A对训练数据集D的信息增益g(D,A),定义为集合D的经验熵H(D)与特征A给定条件下D的经验条件熵H(D

9、A)之差,即:5.利用R语言进行机器学习实例设L、F、H和R表示日志密度、好友密度、是否使用真实头像和账号是否真实;下面计算各属性的信息增益:5.利用R语言进行机器学习实例因此,日志密度的信息增益是0.276。用同样的方法得到H和F的信息增益分别是:0.033和0.553因为F具有最大的信息增

10、益,所以第一次分裂选择F为分裂属性,分裂后的结果如下图所示:5.利用R语言进行机器学习实例5.利用R语言进行机器学习实例使用R语言中提供的rpart库iris数据集萼片长、萼片宽、花瓣长、花瓣宽、花名数据示例5.利用R语言进行机器学习实例输入准备模型训练5.利用R语言进行机器学习实例可视化决策树5.利用R语言进行机器学习实例对测试数据进行预测将预测的结果与源数据对比,就可以得到预测的准确性这里写一个小的程序,将预测结果同真实值比较一

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。