机器学习与r语言学习笔记

机器学习与r语言学习笔记

ID:12468065

大小:10.27 MB

页数:132页

时间:2018-07-17

机器学习与r语言学习笔记_第1页
机器学习与r语言学习笔记_第2页
机器学习与r语言学习笔记_第3页
机器学习与r语言学习笔记_第4页
机器学习与r语言学习笔记_第5页
资源描述:

《机器学习与r语言学习笔记》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、机器学习与R语言学习笔记内部资料,注意保密机器学习与R语言学习笔记2015年7月132机器学习与R语言学习笔记文档修订记录:版本编号变化状态简要说明日期变更人批准日期批准人v1.0C创建学习笔记2015.7.31余红v1.0A新增3.1~3.2节2015.8.5余红v1.0A新增3.2.4~3.2.5节2015.8.6余红v1.0A新增4.1~4.2节2015.8.7余红v1.0A新增理解回归和用线性回归预测医疗费用2015.8.19余红v1.1A新增理CART算法的应用2015.11.30余红*变化状态:C――创建,A——增加,M——修改,D—

2、—删除132机器学习与R语言学习笔记目录1机器学习简介71.1机器学习的起源71.2机器如何学习71.2.1抽象化和知识表达71.2.2一般化81.2.3评估学习的成功性81.3将机器学习应用于数据中的步骤81.4选择机器学习算法81.4.1考虑输入的数据81.4.2考虑机器学习算法的类型81.4.3为数据匹配合适的算法92数据的管理和理解92.1R数据结构102.1.1向量102.1.2因子102.1.3列表112.1.4数据框112.2用R管理数据122.2.1保存和加载R数据结构122.2.2用CVS文件导入和保存数据122.3探索和理解数

3、据122.3.1探索数据的结构122.3.2探索数值型变量132.3.2.1测量中心趋势-平均数和中位数132.3.2.2测量数据分散程度-四分位数和五数汇总142.3.2.3数值型变量可视化-箱图152.3.2.4数值型变量可视化-直方图162.3.2.5了解数值型数据-均匀分布和正态分布162.3.2.6衡量数据的分散程度-方差和标准差172.3.3探索分类变量172.3.4探索变量之间的关系182.3.4.1变量之间关系的可视化-散点图182.3.4.2检验变量之间的关系-双向交叉表183概率学习--朴素贝叶斯分类193.1理解朴素贝叶斯2

4、03.1.1贝叶斯方法的基本概念203.1.2朴素贝叶斯算法213.1.2.1朴素贝叶斯分类213.1.2.2拉普拉斯估计213.1.2.3在朴素贝叶斯算法中使用数值特征223.2例子-基于贝叶斯算法的收集垃圾短信过滤224分而治之-应用决策树和规则进行分类224.1理解决策树234.1.1分而治之234.1.1.1rpart函数244.1.1.2prune.rpart函数244.1.1.3rpart.plot、post及draw.tree函数25132机器学习与R语言学习笔记4.1.1.4J48函数254.1.2C5.0决策树算法254.1.2

5、.1选择最佳的分割254.1.2.2修剪决策树264.2例子-使用C5.0决策树识别高风险银行贷款264.2.1第1步-收集数据274.2.2第2步-探索和准备数据274.2.2.1数据探索274.2.2.2数据准备-创建随机的训练数据集和测试数据集284.2.3第3步-基于数据训练模型284.2.4第4步-评估模型性能354.2.5第5步-提高模型的性能364.2.5.1提高决策树的准确性364.2.5.2犯一些比其他错误更严重的错误664.3例子-CART算法建立汽车油耗预测模型674.3.1第1步-收集数据674.3.1.1数据集概况674

6、.3.1.2数据预处理684.3.2第2步-基于数据训练模型694.3.2.1对“油耗”变量建立回归树-数字结果694.3.2.2对“油耗”变量建立回归树-树形结果704.3.2.3对“分组油耗”变量建立分类树704.3.3第3步-对测试集预测目标变量评估模型性能705预测数值型数据-回归方法715.1理解回归725.1.1简单线性回归725.1.2普通最小二乘法725.1.3相关系数735.1.4多元线性回归735.2例子-应用线性回归预测医疗费用745.2.1第1步-收集数据745.2.2第2步-探索和准备数据755.2.2.1探索特征之间的

7、关系-相关系数矩阵765.2.2.2可视化特征之间的关系-散点图矩阵765.2.3第3步-基于数据训练模型775.2.4第4步-评估模型性能785.2.5第5步-提高模型性能795.2.5.1模型的设定-添加非线性关系795.2.5.2转换-将一个数值型变量转换为一个二进制指标795.2.5.3模型的设定-加入相互作用的影响805.2.5.4全部放在一一个改进的回归模型805.3理解回归树和模型树815.4例子-用回归树和模型树估计葡萄酒的质量815.4.1第1步:收集数据815.4.2第2步:探索和准备数据815.4.3第3步:基于数据训练模型

8、835.4.4第4步:评估模型的性能845.4.4.1用相关系数比较预测值和真实值的接近程度855.4.4.2用平均绝对误差(MeanA

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。