欢迎来到天天文库
浏览记录
ID:27484285
大小:158.50 KB
页数:12页
时间:2018-12-04
《AUC是否可以直接用作损失函数去优化呢?.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、AUC是否可以直接用作损失函数去优化呢? 引言 CTR问题我们有两种角度去理解,一种是分类的角度,即将点击和未点击作为两种类别。另一种是回归的角度,将点击和未点击作为回归的值。不管是分类问题还是回归问题,一般在预估的时候都是得到一个[0,1]之间的概率值,代表点击的可能性的大小。 如果将CTR预估问题当作回归问题,我们经常使用的损失函数是MSE;如果当作二分类问题,我们经常使用的损失函数是LogLoss。而对于一个训练好的模型,我们往往需要评估一下模型的效果,或者说泛化能力,MSE和LogLoss当然也可以作为我们的评价指标,但除此之外,我们最常用的还是AUC。 想
2、到这里,我想到一个问题,AUC是否可以直接用作损失函数去优化呢? 说了这么多,我们还不知道AUC是什么呢?不着急,我们从二分类的评估指标慢慢说起,提醒一下,本文二分类的类别均为0和1,1代表正例,0代表负例。 1、从二分类评估指标说起 1.1混淆矩阵 我们首先来看一下混淆矩阵,对于二分类问题,真实的样本标签有两类,我们学习器预测的类别有两类,那么根据二者的类别组合可以划分为四组,如下表所示: 上表即为混淆矩阵,其中,行表示预测的label值,列表示真实label值。TP,FP,FN,TN分别表示如下意思: TP(truepositive):表示样本的真实类别
3、为正,最后预测得到的结果也为正;FP(falsepositive):表示样本的真实类别为负,最后预测得到的结果却为正;FN(falsenegative):表示样本的真实类别为正,最后预测得到的结果却为负;TN(truenegative):表示样本的真实类别为负,最后预测得到的结果也为负. 可以看到,TP和TN是我们预测准确的样本,而FP和FN为我们预测错误的样本。 1.2准确率Accruacy 准确率表示的是分类正确的样本数占样本总数的比例,假设我们预测了10条样本,有8条的预测正确,那么准确率即为80%。 用混淆矩阵计算的话,准确率可以表示为: 虽然准确率可
4、以在一定程度上评价我们的分类器的性能,不过对于二分类问题或者说CTR预估问题,样本是极其不平衡的。对于大数据集来说,标签为1的正样本数据往往不足10%,那么如果分类器将所有样本判别为负样本,那么仍然可以达到90%以上的分类准确率,但这个分类器的性能显然是非常差的。 1.3精确率Precision和召回率Recall 为了衡量分类器对正样本的预测能力,我们引入了精确率Precision和召回率Recall。 精确率表示预测结果中,预测为正样本的样本中,正确预测为正样本的概率;召回率表示在原始样本的正样本中,最后被正确预测为正样本的概率; 二者用混淆矩阵计算如下:
5、 精确率和召回率往往是一对矛盾的指标。在CTR预估问题中,预测结果往往表示会被点击的概率。如果我们对所有的预测结果进行降序排序,排在前面的是学习器认为最可能被点击的样本,排在后面的是学习期认为最不可能被点击的样本。 如果我们设定一个阈值,在这个阈值之上的学习器认为是正样本,阈值之下的学习器认为是负样本。可以想象到的是,当阈值很高时,预测为正样本的是分类器最有把握的一批样本,此时精确率往往很高,但是召回率一般较低。相反,当阈值很低时,分类器把很多拿不准的样本都预测为了正样本,此时召回率很高,但是精确率却往往偏低。 1.4F-1Score 为了折中精确率和召回率的结果,我
6、们又引入了F-1Score,计算公式如下: 对于F1Score有很多的变化形式,感兴趣的话大家可以参考一下周志华老师的西瓜书,我们这里就不再介绍了。 1.5ROC与AUC 在许多分类学习器中,产生的是一个概率预测值,然后将这个概率预测值与一个提前设定好的分类阈值进行比较,大于该阈值则认为是正例,小于该阈值则认为是负例。如果对所有的排序结果按照概率值进行降序排序,那么阈值可以将结果截断为两部分,前面的认为是正例,后面的认为是负例。 我们可以根据实际任务的需要选取不同的阈值。如果重视精确率,我们可以设定一个很高的阈值,如果更重视召回率,可以设定一个很低的阈值。 到
7、这里,我们会抛出两个问题:1)设定阈值然后再来计算精确率,召回率和F1-Score太麻烦了,这个阈值到底该设定为多少呢?有没有可以不设定阈值来直接评价我们的模型性能的方法呢? 2)排序结果很重要呀,不管预测值是多少,只要正例的预测概率都大于负例的就好了呀。 没错,ROC和AUC便可以解决我们上面抛出的两个问题。 ROC全称是“受试者工作特征”,(receiveroperatingcharacteristic)。我们根据学习器的预测结果进行排序,然后按此顺序逐个把样本作为正例进行预测,每次计算出两个重要的值,分
此文档下载收益归作者所有