欢迎来到天天文库
浏览记录
ID:12513488
大小:694.50 KB
页数:22页
时间:2018-07-17
《 种机器学习算法的要点(附 python 和 r 代码)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、前言谷歌董事长施密特曾说过:虽然谷歌的无人驾驶汽车和机器人受到了许多媒体关注,但是这家公司真正的未来在于机器学习,一种让计算机更聪明、更个性化的技术。也许我们生活在人类历史上最关键的时期:从使用大型计算机,到个人电脑,再到现在的云计算。关键的不是过去发生了什么,而是将来会有什么发生。工具和技术的民主化,让像我这样的人对这个时期兴奋不已。计算的蓬勃发展也是一样。如今,作为一名数据科学家,用复杂的算法建立数据处理机器一小时能赚到好几美金。但能做到这个程度可并不简单!我也曾有过无数黑暗的日日夜夜。谁能从这篇指南里受益最多?
2、我今天所给出的,也许是我这辈子写下的最有价值的指南。这篇指南的目的,是为那些有追求的数据科学家和机器学习狂热者们,简化学习旅途。这篇指南会让你动手解决机器学习的问题,并从实践中获得真知。我提供的是几个机器学习算法的高水平理解,以及运行这些算法的R和Python代码。这些应该足以让你亲自试一试了。我特地跳过了这些技术背后的数据,因为一开始你并不需要理解这些。如果你想从数据层面上理解这些算法,你应该去别处找找。但如果你想要在开始一个机器学习项目之前做些准备,你会喜欢这篇文章的。广义来说,有三种机器学习算法1、?监督式学习
3、工作机制:这个算法由一个目标变量或结果变量(或因变量)组成。这些变量由已知的一系列预示变量(自变量)预测而来。利用这一系列变量,我们生成一个将输入值映射到期望输出值的函数。这个训练过程会一直持续,直到模型在训练数据上获得期望的精确度。监督式学习的例子有:回归、决策树、随机森林、K–近邻算法、逻辑回归等。2、非监督式学习工作机制:在这个算法中,没有任何目标变量或结果变量要预测或估计。这个算法用在不同的组内聚类分析。这种分析方式被广泛地用来细分客户,根据干预的方式分为不同的用户组。非监督式学习的例子有:关联算法和K–均值
4、算法。3、强化学习工作机制:这个算法训练机器进行决策。它是这样工作的:机器被放在一个能让它通过反复试错来训练自己的环境中。机器从过去的经验中进行学习,并且尝试利用了解最透彻的知识作出精确的商业判断。强化学习的例子有马尔可夫决策过程。常见机器学习算法名单这里是一个常用的机器学习算法名单。这些算法几乎可以用在所有的数据问题上:1.线性回归2.逻辑回归3.决策树4.SVM5.朴素贝叶斯6.K最近邻算法7.K均值算法8.随机森林算法9.降维算法10.GradientBoost和Adaboost算法1、线性回归线性回归通常用于
5、根据连续变量估计实际数值(房价、呼叫次数、总销售额等)。我们通过拟合最佳直线来建立自变量和因变量的关系。这条最佳直线叫做回归线,并且用Y=a*X+b这条线性等式来表示。理解线性回归的最好办法是回顾一下童年。假设在不问对方体重的情况下,让一个五年级的孩子按体重从轻到重的顺序对班上的同学排序,你觉得这个孩子会怎么做?他(她)很可能会目测人们的身高和体型,综合这些可见的参数来排列他们。这是现实生活中使用线性回归的例子。实际上,这个孩子发现了身高和体型与体重有一定的关系,这个关系看起来很像上面的等式。在这个等式中:·Y:因变
6、量·a:斜率·x:自变量·b:截距系数a和b可以通过最小二乘法获得。参见下例。我们找出最佳拟合直线?y=0.2811x+13.9。已知人的身高,我们可以通过这条等式求出体重。线性回归的两种主要类型是一元线性回归和多元线性回归。一元线性回归的特点是只有一个自变量。多元线性回归的特点正如其名,存在多个自变量。找最佳拟合直线的时候,你可以拟合到多项或者曲线回归。这些就被叫做多项或曲线回归。Python代码Python12345#ImportLibrary#Importothernecessarylibrarieslikep
7、andas,numpy...fromsklearnimportlinear_model #LoadTrainandTestdatasets67891011121314151617181920212223#Identifyfeatureandresponsevariable(s)andvaluesmustbenumericandnumpyarraysx_train=input_variables_values_training_datasetsy_train=target_variables_values_traini
8、ng_datasetsx_test=input_variables_values_test_datasets #Createlinearregressionobjectlinear=linear_model.LinearRegression() #Trainthemodelusingthetrainingsetsandcheckscorelin
此文档下载收益归作者所有