欢迎来到天天文库
浏览记录
ID:48453868
大小:4.30 MB
页数:10页
时间:2020-01-31
《七步精通Python机器学习.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、.word格式.七步精通Python机器学习主题数据挖掘Python开始。这是最容易令人丧失斗志的两个字。迈出第一步通常最艰难。当可以选择的方向太多时,就更让人两腿发软了。从哪里开始?本文旨在通过七个步骤,使用全部免费的线上资料,帮助新人获取最基本的Python机器学习知识,直至成为博学的机器学习实践者。这篇概述的主要目的是带领读者接触众多免费的学习资源。这些资源有很多,但哪些是最好的?哪些相互补充?怎样的学习顺序才最好?我假定本文的读者不是以下任何领域的专家:▪ 机器学习▪ Python ▪ 任何Python的机器学习、科学计算、数据分析库如果你有前两个领域其一或全部的基础知识,可
2、能会很有帮助,但这些也不是必需的。在下面几个步骤中的前几项多花点时间就可以弥补。第一步:基本Python技能 如果要使用Python进行机器学习,拥有对Python有基础的理解非常关键。幸运的是,Python是当前普遍使用的流行语言,并纳入了科学计算和机器学习的内容,所以找到入门教程并不困难。在选择起点时,很大程度上要取决于你之前的Python经验和编程经验。首先要安装Python。由于我们要使用机器学习和科学计算的packages,这里建议安装Anaconda。Anaconda是一个可在Linux,OSX,Windows上运行的Python实现工具,拥有所需的机器学习packages,包
3、括numpy,scikit-learn,matplotlib。它还包含iPython.专业.专注..word格式.Notebook,一个带有许多教程的交互式环境。这里推荐使用Python2.7,不是因为特殊原因,只是因为它是目前安装版本中的主流。如果你之前没有编程知识,建议你阅读这本免费电子书,然后再接触其他学习材料:▪ PythonTheHardWay作者ZedA.Shaw 如果你之前有编程知识,但不是Python的,又或者你的Python水平很基础,推荐下列一种或几种教程:▪ GoogleDevelopersPythonCourse((强烈推荐给视觉型学习者)▪ AnIntrod
4、uctiontoPythonforScientificComputing(fromUCSBEngineering)作者M.ScottShell(一个很好的Python科学计算简介,60页) 对于想要速成课程的人,这里有:▪ LearnXinYMinutes(X=Python)当然,如果你是个经验丰富的Python程序员,可以跳过这一步。尽管如此,还是建议你把通俗易懂的 Pythondocumentation 放在手边。 第二步:机器学习基础技能KDnuggets的ZacharyLipton.专业.专注..word格式.指出,人们对于“数据科学家”的认知千差万别。这实际上是对机器学习领域的
5、反映。数据科学家在不同程度上使用计算学习算法。要建立和使用支持向量机模型,熟知核函数方法是否是必需的?答案当然不是。就像现实生活中的许多事情一样,所需要的理论深入程度与具体的实际应用有关。获取对机器学习算法的深入理解不是本文的讨论范围,而且这通常需要在学术领域投入大量时间,或者至少要通过密集的自学才能达到。好消息是,你不必拥有博士级别的机器学习理论能力才能进行实践,就如同不是所有程序员都必须接受计算机理论教育才能写好代码。吴恩达在Coursera的课程饱受赞誉。但我的建议是去看看一名以前的学生做的笔记。略过那些针对Octave(一个与Python无关的,类Matlab语言)的内容。需要注意
6、,这些不是“官方”的笔记,虽然看起来的确抓住了吴恩达课程材料的相关内容。如果你有时间,可以自己去Coursera完成这个课程 :AndrewNg'sMachineLearningcourse。▪ 非官方课程笔记链接 除了吴恩达的课程以外,还有很多其他视频教程。我是TomMitchell的粉丝,下面是他(与Maria-FlorinaBalcan共同完成的)最新的课程视频,对学习者非常友好:▪TomMitchellMachineLearningLectures你不需要现在看完全部的笔记和视频。比较好的策略是向前推进,去做下面的练习,需要的时候再查阅笔记和视频。比如,你要做一个回归模型,就可以
7、去查阅吴恩达课程有关回归的笔记以及/或者Mitchell的视频。 第三步:科学计算Pythonpackages一览 好了。现在我们有了Python编程经验,并对机器学习有所了解。Python有很多为机器学习提供便利的开源库。通常它们被称为Python科学库(scientificPythonlibraries),用以执行基本的数据科学任务(这里有一点程度主观色彩):▪numpy- 主要用于N维数组▪pandas-Pytho
此文档下载收益归作者所有