资源描述:
《周志华 机器学习ppt Chap01绪论课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、机器学习导论(2016春季学期)一、绪论机器学习机器学习是从人工智能中产生的一个重要学科分支,是实现智能化的关键机器学习机器学习(MachineLearning)究竟是什么东东?看个例子“文献筛选”的故事[C.Brodleyetal.,AIMagazine2012]在“循证医学”(evidence-basedmedicine)中,针对特定的临床问题,先要对相关研究报告进行详尽评估查询PubMed以获取候选摘要人工找出值得全文审读的文章“文献筛选”的故事在一项关于婴儿和儿童残疾的研究中,美国Tufts医学中心筛选了约33,000篇摘要尽管Tufts医
2、学中心的专家效率很高,对每篇摘要只需30秒钟,但该工作仍花费了250小时每项新的研究都要重复这个麻烦的过程!需筛选的文章数在不断显著增长!“文献筛选”的故事为了降低昂贵的成本,Tufts医学中心引入了机器学习技术邀请专家阅读少量摘要,标记为“有关”或“无关”分类模型对是否“有关”进行预测人类专家只需阅读50篇摘要,系统的自动筛选精度就达到93%人类专家阅读1,000篇摘要,则系统的自动筛选敏感度达到95%(人类专家以前需阅读33,000篇摘要才能获得此效果)色泽根蒂敲声好瓜青绿蜷缩浊响是乌黑蜷缩浊响是青绿硬挺清脆否乌黑稍蜷沉闷否决策树,神经网络,支
3、持向量机,Boosting,贝叶斯网,……模型训练数据(label)训练新数据样本(浅白,蜷缩,浊响,?)?=是类别标记未知典型的机器学习过程使用学习算法(learningalgorithm)类别标记机器学习与数据挖掘机器学习能做什么?我们可能每天都在用机器学习权16南京大学机器学习导论课程专用所有20保留机器学习模型搜索引擎机器学习技术正在支撑着各种搜索引擎搜索:南京大学例如:互联网搜索……有器学习导论课程专保留权用所2016南京大学机例如:自动汽车驾驶(即将改变人类生活)机器学习模型方向盘旋转幅度油门幅度刹车幅度车载摄像头车载雷达控制汽车美国在
4、20世纪80年代就开始研究基于机器学习的汽车自动驾驶技术DARPAGrandChallenge–20042016南京大学机器学习导论课程专用所有权保留机器学习能做什么?小数据上就已经很有用2016南京大学机器学习导论课程专用所有权保留例如:画作鉴别(艺术)画作鉴别(paintingauthentication):确定作品的真伪勃鲁盖尔(1525-1569)的作品?出自[J.Hughesetal.,PNAS2009]梵高(1853-1890)的作品?出自[C.Johnsonetal.,IEEE-SP,2008]机器学习导论2016南京大学课程专用所有
5、权保留例如:画作鉴别(艺术)除专用技术手段外,笔触分析(brushstrokeanalysis)是画作鉴定的重要工具;它旨在从视觉上判断画作中是否具有艺术家的特有“笔迹”。该工作对专业知识要求极高-具有较高的绘画艺术修养-掌握画家的特定绘画习惯只有少数专家花费很大精力才能完成分析工作!很难同时掌握不同时期、不同流派多位画家的绘画风格![C.Johnsonetal.,IEEE-SP,2008]论课程专用所有权16南京大学20机器学习导保留例如:画作鉴别(艺术)真迹+赝品特有“笔迹”待鉴定画作为了降低分析成本,机器学习技术被引入自动鉴定分类模型Kröl
6、lerMüller美术馆与Cornell等大学的学者对82幅梵高真迹和6幅赝品进行分析,自动鉴别精度达95%[C.Johnsonetal.,IEEE-SP,2008]Dartmouth学院、巴黎高师的学者对8幅勃鲁盖尔真迹和5幅赝品进行分析,自动鉴别精度达100%[J.Hughesetal.,PNAS2009][J.Mairaletal.,PAMI’12](对用户要求低、准确高效、适用范围广)2016南京大学机器学习导论课程专用所有权保留例如:古文献修复(文化)古文献是进行历史研究的重要素材,但是其中很多损毁严重DeadSeaScrolls(死海古
7、卷)-1947年出土-超过30,000个羊皮纸片段CairoGenizah-19世纪末被发现-超过300,000个片段-散布于全球多家博物馆高水平专家的大量精力被用于古文献修复[L.Wolfetal.,IJCV2011]2016南京大学机器学习导论课程专用所有权保留例如:古文献修复(文化)一个重要问题:原书籍已经变成分散且混杂的多个书页,如何拼接相邻的书页?人工完成书页拼接十分困难-书页数量大,且分布在多处-部分损毁较严重,字迹模糊-需要大量掌握古文字的专业人才近年来,古文献的数字化浪潮给自动文学修复提供了机会所有权保留2016南京大学机器学习导论
8、课程专用例如:古文献修复(文化)以色列特拉维夫大学的学者将机器学习用于自动的书页拼接已确定相邻已确定不相邻分类模型判断是否