周志华 机器学习ppt Chap02模型评估与选择课件.ppt

周志华 机器学习ppt Chap02模型评估与选择课件.ppt

ID:58230665

大小:4.14 MB

页数:28页

时间:2020-09-05

周志华 机器学习ppt Chap02模型评估与选择课件.ppt_第1页
周志华 机器学习ppt Chap02模型评估与选择课件.ppt_第2页
周志华 机器学习ppt Chap02模型评估与选择课件.ppt_第3页
周志华 机器学习ppt Chap02模型评估与选择课件.ppt_第4页
周志华 机器学习ppt Chap02模型评估与选择课件.ppt_第5页
资源描述:

《周志华 机器学习ppt Chap02模型评估与选择课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、2016南京大学机器学习导论课程专用所有权保留机器学习导论(2016春季学期)二、模型评估与选择主讲教师:周志华权学机16南京大保20器学习导论课程专用所有留典型的机器学习过程什么模型好?能很好地适用于unseeninstance泛化能力强!例如,错误率低、精度高然而,我们手上没有unseeninstance,……权所有2016南京大学机器学习导论课程专用保留泛化误差vs.经验误差泛化误差:在“未来”样本上的误差经验误差:在训练集上的误差,亦称“训练误差”泛化误差越小越好经验误差是否越小越好?NO!因为会出现“过拟合”(o

2、verfitting)2016南京大学机器学习导论课程专用所有权保留过拟合(overfitting)vs.欠拟合(underfitting)2016南京大学机器学习导论课程用专所有权保留模型选择(modelselection)三个关键问题:如何获得测试结果?如何评估性能优劣?如何判断实质差别?评估方法性能度量比较检验权专用2016南京大学机器学习导论课程所有保留评估方法关键:怎么获得“测试集”(testset)?测试集应该与训练集“互斥”常见方法:留出法(hold-out)交叉验证法(crossvalidation)

3、自助法(bootstrap)权2016南京大学机器学习导论课程专用所有保留训练集测试集留出法拥有的数据集注意:保持数据分布一致性(例如:分层采样)多次重复划分(例如:100次随机划分)测试集不能太大、不能太小(例如:1/5~1/3)2016南京大学机器学习导论课程专用所有权保留k-折交叉验证法若k=m,则得到“留一法”(leave-one-out,LOO)权保器学习导论课学机2016南京大程专用所有留自助法基于“自助采样”(bootsrapsampling)亦称“有放回采样”、“可重复采样”约有36.8%的样本不出现

4、训练集与原样本集同规模数据分布有所改变“包外估计”(out-of-bagestimation)权专用2016南京大学机器学习导论课程所有保留“调参”与最终模型算法的参数:一般由人工设定,亦称“超参数”模型的参数:一般由学习确定参数调得好不好对性能往往对最终性能有关键影响调参过程相似:先产生若干模型,然后基于某种评估方法进行选择区别:训练集vs.测试集vs.验证集(validationset)算法参数选定后,要用“训练集+验证集”重新训练最终模型2016南京大学机器学习导论课程用专所有权保留模型选择(modelselectio

5、n)三个关键问题:如何获得测试结果?如何评估性能优劣?如何判断实质差别?评估方法性能度量比较检验2016南京大学机器学习导论课程专用所有权保留性能度量性能度量(performancemeasure)是衡量模型泛化能力的评价标准,反映了任务需求使用不同的性能度量往往会导致不同的评判结果什么样的模型是“好”的,不仅取决于算法和数据,还取决于任务需求回归(regression)任务常用均方误差:2016南京大学机器学习导论课程专用所有权保留错误率vs.精度错误率:精度:权2016南京大学机器学习导论课程专用所有保留查准

6、率:查准率vs.查全率查全率:权所用专有程课机器学习导论大学2016南京保留(BEP)PR图:•学习器A优于学习器C•学习器B优于学习器C•学习器A??学习器BBEP:•学习器A优于学习器B•学习器A优于学习器C•学习器B优于学习器CPR图,BEP根据学习器的预测结果按正例可能性大小对样例进行排序,并逐个把样本作为正例进行预测权2016南京大学机器学习导论课程专用所有保留F1若对查准率/查全率有不同偏好:比BEP更常用的F1度量:权2016南京大学机器学习导论课程专用所有保留宏xxvs.微xx若能得到多个混淆矩阵:(例如多次

7、训练/测试的结果,多分类的两两混淆矩阵)宏(macro-)查准率、查全率、F1微(micro-)查准率、查全率、F1权保用导论课程2016南京大学机器学习专所有留ROCCurveROC,AUCAUC:AreaUndertheROCCurveROC(ReceiverOperatingCharacteristic)Curve[Green&Swets,Book66;Spackman,IWML’89]AreaUnderThebigger,thebetter权用程专所有2016南京大学机器学习导论课保留非均等代价犯不同的错误往往会造成不

8、同的损失此时需考虑“非均等代价”(unequalcost)代价敏感(cost-sensitive)错误率:2016南京大学机器学习导论课程用专所有权保留模型选择(modelselection)三个关键问题:如何获得测试结果?如何评估性能优劣?如何判断实质差别?评估方法

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。