机器学习算法之旅.docx

ID：59185279

大小：36.40 KB

页数：4页

时间：2020-09-10

资源描述：

《机器学习算法之旅.docx》由会员上传分享，免费在线阅读，更多相关内容在教育资源-天天文库。

1、机器学习算法之旅在理解了我们需要解决的机器学习问题之后，我们可以思考一下我们需要收集什么数据以及我们可以用什么算法。本文我们会过一遍最流行的机器学习算法，大致了解哪些方法可用，很有帮助。机器学习领域有很多算法，然后每种算法又有很多延伸，所以对于一个特定问题，如何确定一个正确的算法是很困难的。本文中我想给你们两种方法来归纳在现实中会遇到的算法。学习方式根据如何处理经验、环境或者任何我们称之为输入的数据，算法分为不同种类。机器学习和人工智能课本通常先考虑算法可以适应的学习方式。这里只讨论几个主要的学习风格或学习模型，并且有几个基本的例子。这种分类或者组织的方法很好，

2、因为它迫使你去思考输入数据的角色和模型准备的过程，然后选择一个最适合你的问题的算法，从而得到最佳的结果。·监督学习：输入数据被称为训练数据，并且有已知的结果或被标记。比如说一封邮件是否是垃圾邮件，或者说一段时间内的股价。模型做出预测，如果错了就会被修正，这个过程一直持续到对于训练数据它能够达到一定的正确标准。问题例子包括分类和回归问题，算法例子包括逻辑回归和反向神经网络。·无监督学习：输入数据没有被标记，也没有确定的结果。模型对数据的结构和数值进行归纳。问题例子包括Associationrulelearning和聚类问题，算法例子包括Apriori算法和K-均值

3、算法。·半监督学习：输入数据是被标记的和不被标记的数据的混合，有一些预测问题但是模型也必须学习数据的结构和组成。问题例子包括分类和回归问题，算法例子基本上是无监督学习算法的延伸。·增强学习：输入数据可以刺激模型并且使模型做出反应。反馈不仅从监督学习的学习过程中得到，还从环境中的奖励或惩罚中得到。问题例子是机器人控制，算法例子包括Q-learning以及Temporaldifferencelearning。当整合数据模拟商业决策时，大多数会用到监督学习和无监督学习的方法。当下一个热门话题是半监督学习，比如图像分类问题，这中问题中有一个大的数据库，但是只有一小部分图

4、片做了标记。增强学习多半还是用在机器人控制和其他控制系统的开发上。算法相似性算法基本上从功能或者形式上来分类。比如，基于树的算法，神经网络算法。这是一个很有用的分类方式，但并不完美。因为有许多算法可以轻易地被分到两类中去，比如说LearningVectorQuantization就同时是神经网络类的算法和基于实例的方法。正如机器学习算法本身没有完美的模型一样，算法的分类方法也没有完美的。在这一部分我列出了我认为最直观的方法归类的算法。我并没有穷尽算法或者分类方法，但是我想对于让读者有一个大致了解很有帮助。如果有你了解的我没有列出来，欢迎留言分享。现在我们开始！R

5、egressionRegression(回归分析)关心的是变量之间的关系。它应用的是统计方法，几个算法的例子包括：·OrdinaryLeastSquares·LogisticRegression·StepwiseRegression·MultivariateAdaptiveRegressionSplines(MARS)·LocallyEstimatedScatterplotSmoothing(LOESS)Instance-basedMethodsInstancebasedlearning(基于实例的学习)模拟了一个决策问题，所使用的实例或者例子是对模型非常重要的

6、。这种方法对现有数据建立一个数据库然后把新数据加进去，再用一个相似性测量方法从而在数据库里找出一个最优匹配，进行一个预测。由于这个原因，这种方法也被称为胜者为王方法和基于内存的方法。现在关注的焦点在存储数据的表现形式和相似性测量方法。·k-NearestNeighbour(kNN)·LearningVectorQuantization(LVQ)·Self-OrganizingMap(SOM)RegularizationMethods这是一个对其他方法的延伸（通常是回归方法），这个延伸对越简单的模型越有利，并且更擅长归纳。我在这里列出它是因为它的流行和强大。·Ri

7、dgeRegression·LeastAbsoluteShrinkageandSelectionOperator(LASSO)·ElasticNetDecisionTreeLearningDecisiontreemethods(决策树方法)建立了一个根据数据中实际值决策的模型。决策树用来解决归纳和回归问题。·ClassificationandRegressionTree(CART)·IterativeDichotomiser3(ID3)·C4.5·Chi-squaredAutomaticInteractionDetection(CHAID)·DecisionSt

8、ump·RandomFo

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 / 4



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

机器学习算法之旅.docx

机器学习算法之旅.docx

相关文章

相关标签