在Excel中作ROC曲线教学教材.doc

在Excel中作ROC曲线教学教材.doc

ID:60806054

大小:130.00 KB

页数:4页

时间:2020-12-20

在Excel中作ROC曲线教学教材.doc_第1页
在Excel中作ROC曲线教学教材.doc_第2页
在Excel中作ROC曲线教学教材.doc_第3页
在Excel中作ROC曲线教学教材.doc_第4页
资源描述:

《在Excel中作ROC曲线教学教材.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、精品好文档,推荐学习交流在Excel中作ROC曲线分类模型尝试将各个实例(instance)划归到某个特定的类,而分类模型的结果一般是实数值,如逻辑回归,其结果是从0到1的实数值。这里就涉及到如何确定阈值(thresholdvalue),使得模型结果大于这个值,划为一类,小于这个值,划归为另一类。考虑一个二分问题,即将实例分成正类(positive)或负类(negative)。对一个二分问题来说,会出现四种情况。如果一个实例是正类并且也被预测成正类,即为真正类(Truepositive),如果实例是负类被预测成正类,称之为假正类(

2、Falsepositive)。相应地,如果实例是负类被预测成负类,称之为真负类(Truepositive),正类被预测成负类则为假负类(falsenegative)。列联表如下表所示,1代表正类,0代表负类。    预测      10合计实际1TruePositive(TP)FalseNegative(FN)ActualPositive(TP+FN)0FalsePositive(FP)TrueNegative(TN)ActualNegative(FP+TN)合计  PredictedPositive(TP+FP)Predicte

3、dNegative(FN+TN) TP+FP+FN+TN从列联表引入两个新名词。其一是真正类率(truepositiverate,TPR),计算公式为TPR=TP/(TP+FN),刻画的是分类器所识别出的正实例占所有正实例的比例。另外一个是负正类率(falsepositiverate,FPR),计算公式为FPR=FP/(FP+TN),计算的是分类器错认为正类的负实例占所有负实例的比例。还有一个真负类率(TrueNegativeRate,TNR),也称为specificity,计算公式为TNR=TN/(FP+TN)=1−FPR。在一

4、个二分类模型中,对于所得到的连续结果,假设已确定一个阀值,比如说0.6,大于这个值的实例划归为正类,小于这个值则划到负类中。如果减小阀值,减到0.5,固然能识别出更多的正类,也就是提高了识别出的正例占所有正例的比类,即TPR,但同时也将更多的负实例当作了正实例,即提高了FPR。为了形象化这一变化,在此引入ROC。ReceiverOperatingCharacteristic,翻译为"接受者操作特性曲线",够拗口的。曲线是由两个变量的组合,1-specificity和Sensitivity.由于1-specificity=FPR,即

5、负正类率。Sensitivity即是真正类率,Truepositiverate,反映了正类覆盖程度。这个组合以1-specificity对sensitivity,即是以代价(costs)对收益(benefits)。下表是一个逻辑回归得到的结果。将得到的实数值按大到小划分成10个个数相同的部分。Percentile实例数正例数1-特异度(%)敏感度(%)10618048792.7334.6420618028049.8054.55仅供学习与交流,如有侵权请联系网站删除谢谢4精品好文档,推荐学习交流306180216518.2269.9

6、2406180150628.0180.6250618098738.9087.6260618052950.7491.3870618036562.9393.9780618029475.2696.0690618029787.5998.171006177258100.00100.00其正例数为此部分里实际的正类数。也就是说,将逻辑回归得到的结果按从大到小排列,倘若以前10%的数值作为阀值,即将前10%的实例都划归为正类,6180个。其中,正确的个数为4879个,占所有正类的4879/14084*100%=34.64%,即敏感度;另外,有6

7、180-4879=1301个负实例被错划为正类,占所有负类的1301/47713*100%=2.73%,即1-特异度。以这两组值分别作为x值和y值,在excel中作散点图。得到ROC曲线如下对角线反映的是随机选择的结果,此对角线作为对照线。到底该怎样选择阀值呢,这涉及到了AUC(AreaUndertheROCCurve,ROC曲线下的面积)。中国医科大学2013年1月考试《开放英语1》在线作业及答案试卷总分:100    测试时间:--    试卷得分:100、单选题(共 50 道试题,共 100 分。)    得分:1001. 

8、 Mymotherisadoctor.Sheis()medicine.A.from仅供学习与交流,如有侵权请联系网站删除谢谢4精品好文档,推荐学习交流B.atC.in      满分:2  分  得分:22.  Youcanpaintthewall

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。