“机器学习基石”笔记

“机器学习基石”笔记

ID:41154458

大小:3.37 MB

页数:158页

时间:2019-08-17

“机器学习基石”笔记_第1页
“机器学习基石”笔记_第2页
“机器学习基石”笔记_第3页
“机器学习基石”笔记_第4页
“机器学习基石”笔记_第5页
资源描述:

《“机器学习基石”笔记》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、先简单介绍下这门课程,这门课是在著名的MOOC(MassiveOnlineOpenCourse大型在线公开课)Coursera上的一门关于机器学习领域的课程,由国立台湾大学的年轻老师林轩田讲授。这门叫做机器学习基石的课程,共8周的课程为整个机器学习课程的上半部分,更偏重于理论和思想而非算法,主要分为四大部分来讲授。WhencanMachineLearn?在何时可以使用机器学习?WhycanMachineLearn?为什么机器可以学习?HowcanMachineLearn?机器可以怎样学习?HowcanMachineLearnBett

2、er?怎样能使机器学习更好?每一大块又分为几周来讲授,每周的课时分为两个大课,每个大课一般又分为四个小块来教学,一个小块一般在十分钟到二十分钟之间。以VCbound(VC限制)作为总线将整个基础课程贯通讲解了包括PLA(Perceptronlearningalgorithm感知器)、pocket、二元分类、线性回归(linearregression)、logistic回归(logisticregression)等等。以下不用大课小课来叙述了,写起来感觉怪怪的,就用章节来分别代表大课时和小课时。一、Thelearningproblem

3、机器学习问题。1.CourseIntroduction课程简介。第一小节的内容就是课程简介,如上已进行了详细的介绍,这里就不多赘述。1.2WhatisMachineLearning什么是机器学习?在搞清这个问题之前,先要搞清什么是学习。学习可以是人或者动物通过观察思考获得一定的技巧过程。而机器学习与之类似,是计算机通过数据和计算获得一定技巧的过程。注意这一对比,学习是通过观察而机器学习是通过数据(是计算机的一种观察)。对比图如图1-1。(本笔记的图和公式如不加说明皆是出自林老师的课件,下文不会对此在做说明)图1-1学习与机器学习对比

4、图a)学习b)机器学习那么紧接着就是要解决上述中出现的一个新的名词"技巧"(skill)。什么是技巧呢?技巧是一些能力表现的更加出色。机器学习中的技巧如预测(prediction)、识别(recognition)。来一个例子:从股票的数据中获得收益增多的这种技巧,这就是一种机器学习的例子。那既然人也可以通过观察获得一个技巧,为什么还需要机器学习呢?这就是为什么需要机器学习,简单来说,就是两大原因:一些数据或者信息,人来无法获取,可能是一些人无法识别的事物,或是数据信息量特别大;另一个原因是人的处理满足不了需求,比如:定义很多很多的规

5、则满足物体识别或者其他需求;在短时间内通过大量信息做出判断等等。上面说的是为什么使用机器学习,那么什么情况下使用机器学习呢?是不是所有的情况都使用机器学习呢?这里给出了三个ML(机器学习的英文缩写)的关键要素:1、存在一个模式或者说表现可以让我们对它进行改进提高;2、规则并不容易那么定义;3、需要有数据。1.3ApplicationsofMachineLearning机器学习的应用。这一小节主要介绍的就是机器学习能用在哪些方面。个人感觉不是理论介绍的重点(不是说应用不重要,刚好相反,其实个人认为机器学习甚至整个计算机学科最重要的还是

6、应用),就简述下机器学习可以应用在在衣食住行育乐,包含了人类生活的方方面面,所以机器学习的应用场景很广泛很有市场。1.4ComponentsofMachineLearning机器学习的组成部分。这一小节是第一章的重点,因为它将机器学习的理论应用符号及数学知识进行表示,而以下各章内容也都是在这小节内容的基础上展开的。从一个银行是否会发信用卡给用户的例子引出了机器学习可以分为哪几个部分(组件)。1.输入(input):x∈X(代表银行所掌握的用户信息)2.输出(output):y∈Y(是否会发信用卡给用户)3.未知的函数,即目标函数(t

7、argetfunction):f:X→Y(理想的信用卡发放公式)4.数据或者叫做资料(data),即训练样本(trainingexamples):D={(),(),…,()}(银行的历史记录)5.假设(hypothesis),即前面提到的技能,能够具有更好地表现:g:X→Y(能够学习到的公式)可以通过一个简单的流程图表示,如图1-2所示。图1-2机器学习的简单流程图从图中可以清楚机器学习就是从我们未知但是却存在的一个规则或者公式f中得到大量的数据或者说资料(训练样本),在这些资料的基础上得到一个近似于未知规则g的过程。这么说还是有点

8、抽象,特别是目标函数f又是未知的,那为什么还能找到一个假设g能够接近f呢?还是以一个更加详细的流程图来说明这一问题,如图1-3。图1-3详细的机器学习流程图这个流程图和图1-2有些不同,其中ML被更详细的定义为机器学习算法(learn

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。