欢迎来到天天文库
浏览记录
ID:31610375
大小:5.40 MB
页数:112页
时间:2019-01-15
《吴恩达《机器学习训练秘籍》完整中文版《Machine Learning Yearning》》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、机器学习训练秘籍属于deeplearning.ai项目.=======中文PDF相关信息=======项目地址:点击此处文件版本:0.5.0draft最后更新:2018/10/12译者水平有限,如有翻译不当之处,恳请读者指正,联系邮箱:acdoge.cao@gmail.com=========================©2018AndrewNg.AllRightsReserved.Page2MachineLearningYearning-DraftAndrewNg目录1机器学习为什么需要策略?2如何使用此书来帮助你的团队3先修知识与符号说明4规模
2、驱动机器学习发展5开发集和测试集的定义6开发集和测试集应该服从同一分布7开发集和测试集应该有多大??8使用单值评估指标进行优化9优化指标和满意度指标10通过开发集和度量指标加速迭代11何时修改开发集、测试集和指标12小结:建立开发集和测试集13快速构建并迭代你的第一个系统14误差分析:根据开发集样本评估想法15在误差分析时并行评估多个想法16清洗误标注的开发集和测试集样本17将大型开发集拆分为两个子集,专注其一18Eyeball和Blackbox开发集该设置多大?19小结:基础误差分析20偏差和方差:误差的两大来源21偏差和方差举例22与最优错误率比较
3、23处理偏差和方差24偏差和方差间的权衡25减少可避免偏差的技术Page3MachineLearningYearning-DraftAndrewNg26训练集误差分析27减少方差的技术28诊断偏差与方差:学习曲线29绘制训练误差曲线30解读学习曲线:高偏差31解读学习曲线:其它情况32绘制学习曲线33为何与人类表现水平进行对比34如何定义人类表现水平35超越人类表现水平36何时在不同的分布上训练与测试37如何决定是否使用你所有的数据38如何决定是否添加不一致的数据39给数据添加权重40从训练集泛化到开发集41辨别偏差、方差和数据不匹配误差42解决数据不
4、匹配问题43人工合成数据44优化验证测试45优化验证测试的一般形式46强化学习举例47端到端学习的兴起48端到端学习的更多例子49端到端学习的优缺点50流水线组件的选择:数据可用性51流水线组件的选择:任务简单性Page4MachineLearningYearning-DraftAndrewNg52直接学习更为丰富的输出53根据组件进行误差分析54误差归因至某个组件55误差归因的一般情况56组件误差分析与人类水平对比57发现有缺陷的机器学习流水线58建立超级英雄团队-让你的队友阅读这本书吧!Page5MachineLearningYearning-Dr
5、aftAndrewNg1机器学习为什么需要策略?机器学习(machinelearning)已然成为无数重要应用的基石——如今,在网络搜索、垃圾邮件检测、语音识别以及产品推荐等领域,你都能够发现它的身影。如果你或你的团队正在研发一款机器学习相关应用,并期待取得较快进展,那么这本书将会是你的得力助手。案例:建立猫咪图片初创公司想象一下,你正在建立一家初创公司,这家公司的产品目标是为猫咪爱好者们提供数不尽的猫咪图片,你打算应用神经网络(neuralnetwork)技术来构建一套计算机视觉系统,通过该系统来识别图片中的猫。但悲剧的是,目前你的学习算法准确度还不
6、够好。为了改进这个猫咪检测器,你正面临着巨大的压力。可你该怎么做呢?你的团队给出了许多建议,例如:●获取更多的数据,即收集更多的猫咪图片●收集更加多样化的训练数据集,图片中猫的位置可能不常见,也有可能颜色奇异,或者拍摄时使用不同的相机参数●通过增加梯度下降的迭代次数,使算法训练得久一些●尝试一个拥有更多层/更多隐藏元/更多参数的,规模更大的神经网络●尝试一个更小的神经网络●尝试加入正则化(例如L2正则化)Page6MachineLearningYearning-DraftAndrewNg●改变神经网络的架构(激活函数,隐藏元数量等等)●...在上面众多
7、的方向中,如果你做出了正确的选择,就将建立起一个效果领先的猫咪图片识别平台,并带领你的公司取得成功。但如果你选择了一个糟糕的方向,则可能因此浪费掉几个月的时间。那么你该如何做出决定呢?这本书将告诉你应该怎么做。众多的机器学习问题会留下一些线索,告诉你什么样的尝试有用,什么样的没用。而学会解读这些线索将会节省你几个月甚至几年的开发时间。Page7MachineLearningYearning-DraftAndrewNg2如何使用此书来帮助你的团队完成本书的阅读后,你将进一步理解如何为一个机器学习项目设定技术方向,但团队成员可能不理解你为何要推荐某个特定的
8、方向。有时你希望你的团队定义一个单值评估指标,但他们并不认可你的想法,此时你将如何说服他们?这
此文档下载收益归作者所有