人工智能系列之十三:人工智能选股之损失函数的改进

人工智能系列之十三:人工智能选股之损失函数的改进

ID:18981439

大小:495.07 KB

页数:20页

时间:2018-09-27

人工智能系列之十三:人工智能选股之损失函数的改进_第1页
人工智能系列之十三:人工智能选股之损失函数的改进_第2页
人工智能系列之十三:人工智能选股之损失函数的改进_第3页
人工智能系列之十三:人工智能选股之损失函数的改进_第4页
人工智能系列之十三:人工智能选股之损失函数的改进_第5页
资源描述:

《人工智能系列之十三:人工智能选股之损失函数的改进》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、正文目录本文研究导读4对数损失函数5对数损失函数的推导5对数损失函数的意义解释6对数损失函数的改进6改进方案1:加权损失函数6改进方案2:广义损失函数6改进损失函数的测试流程8改进损失函数的测试结果11改进方案1(加权损失函数)测试结果11改进方案2(广义损失函数)测试结果14总结和展望16附录1:XGBoost损失函数的修改及推导过程17附录2:分类模型的评价指标20风险提示21若出现排版错误,可凭借下载记录,加微信535600147,获取PDF版本图表目录图表1:逻辑回归模型5图表2:λ值对训练结果的影响7图表3:测试流程图8图表4:改进方案1的样本标注方法9图表5:选股模

2、型中涉及的全部因子及其描述10图表6:改进方案1中各种情况下模型选股指标对比(全A选股,回测期:20110131~20180727)11图表7:加权损失函数和普通损失函数超额收益表现(全A选股,中证500行业中性)........................................................................................................................................12图表8:加权损失函数和普通损失函数回测分析表(中证500行业中性,回测期:20110131~2

3、0180727)12图表9:加权损失函数和普通损失函数回测分析表(个股等权,回测期:20110131~20180727)13图表10:加权损失函数和普通损失函数的分类指标对比13图表11:广义损失函数和普通损失函数2011年以来详细回测绩效(全A选股,中证500行业市值中性,回测期:20110131~20180727)14图表12:广义损失函数和普通损失函数超额收益表现(全A选股,中证500行业市值中性)14图表13:广义损失函数和普通损失函数RankIC相关指标15图表14:广义损失函数和普通损失函数RankIC值累积曲线15图表15:普通对数损失函数的Python实现代码1

4、7图表16:加权对数损失函数的Python实现代码18图表17:广义对数损失函数的Python实现代码19若出现排版错误,可凭借下载记录,加微信535600147,获取PDF版本本文研究导读在机器学习领域,损失函数(lossfunction)是衡量样本预测值和真实值之间差距的函数,在机器学习模型的训练过程中决定了模型的优化方向,具有较高的研究价值。在前期华泰金工人工智能系列报告中,我们曾对各种损失函数进行了简要介绍。在本文中,我们将针对分类模型中最常用的损失函数——对数损失函数(logloss)进行详细讨论。本文主要内容如下:1)对数损失函数如何推导而来?如何形象地解释它的意义

5、?2)如何改进对数损失函数使得其更加适合多因子选股领域的应用?3)如何评价改进后的损失函数对机器模型性能和多因子选股应用的影响?若出现排版错误,可凭借下载记录,加微信535600147,获取PDF版本对数损失函数对数损失函数是二分类模型的一个经典损失函数,最早应用于逻辑回归,之后又被应用到了神经网络、XGBoost等模型上。其标准形式如下:?1()()()若出现排版错误,可凭借下载记录,加微信535600147,获取PDF版本Loss=−?∑(??log(???)+?=11−??log(1−???))若出现排版错误,可凭借下载记录,加微信535600147,获取PDF版本其

6、中,?为训练样本数量,??为第i个训练样本的特征值向量,??为第i个训练样本的标签(???{0,1}),?(??)为某种机器学习模型的预测值。粗看下来,对数损失函数相比平方损失函数较难理解。接下来我们首先推导对数损失函数,再对其意义进行形象解释。对数损失函数的推导对数损失函数由逻辑回归的极大似然估计过程推导而来,逻辑回归模型如图表1所示。图表1:逻辑回归模型资料来源:华泰证券研究所若出现排版错误,可凭借下载记录,加微信535600147,获取PDF版本逻辑回归的标准形式如下式:?(?)=11+?−?若出现排版错误,可凭借下载记录,加微信535600147,获取PDF版本?(?

7、)的值域为(0,1),对于二分类问题,假设?代表分类的概率值,则有两种计算?的情况,分别对应标签为1和0:?(?=1

8、?=?)=1=?(?)?1+?−????(?=0

9、?=?)=1−1=1−?(?)?1+?−???根据极大似然估计的原理,可以写出逻辑回归的似然函数为:??L=∏?(?=??

10、?=??)=∏?(??)??[1−?(??)]1−??若出现排版错误,可凭借下载记录,加微信535600147,获取PDF版本?=1对似然函数取对数,可得??=1若出现排版错误,可凭借下载记录,加微信5

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。