量化|破局低信噪比:基于深度学习的因子优化研究
来源:金融界网 2021-11-23 09:24:52
以收益率为拟合目标的低信噪比问题极大地限制了深度学习在低频量化策略上的应用。本文将合成因子与收益的相关系数作为优化目标,并采用深度网络实现映射关系的学习,构建了深度相关模型(Deep Correlation Model,DCM)。回测结果显示基于相关性的目标函数较直接拟合收益,年化超额收益提升了7.41%,信息率提升了0.9。
▍投资聚焦:重设目标函数,破局低信噪比。
在偏高频的量化投资中,深度学习已经有了较好的应用,但在偏低频的策略上深度学习一方面提升效果不够明显,另一方面还有稳定性弱,解释性差等缺点。导致深度学习不再“强大”的最大困难还是训练数据的低信噪比,尤其是将拟合目标设为收益率的情况下。收益率本身的低信噪比使得产生的错误信号(Error Signal)信噪比也较低。为了解决这一问题,我们将优化目标设为合成因子与收益率的相关系数,以提升错误信号的信噪比。
▍传统的因子合成方法简介:
1)等权法,将所有因子标准化后直接等权加总;
2)将所有因子最近一段时期内因子的信息系数(IC)作为权重进行加权;
3)通过优化合成因子的IC_IR得到权重进行加权;
4)通过优化合成因子的IC得到权重进行加权。线性框架下,方法3和4有形式相近的解析解。
▍模型设计:将优化IC作为目标函数。
1)以IC为优化目标,一是更关注合成因子的相对大小关系,二是对同一期所有样本计算错误信号,信噪比会更高。
2)进一步改进IC为Weighted IC,可有效避免局部排序与整体相悖的“陷阱”,更好地适应多头选股的任务。
3)神经网络设计:包含两层32个单元的全连接层,和两层批标准化层。
4)损失函数:计算Weighted IC需要按合成因子的大小进行排序,与权重的顺序对应。对多期的损失计算指数衰减权重加权的结果作为最终的损失。
5)因子数据及其处理流程。采用了基本面、估值等共计21个因子。因子和下期收益均转化为行业市值中性化的排序分位数。
▍模型测试:有效提升测试集IC。
1)5种基线系统。构造了等权加权、历史IC加权、最大化历史IC、最大化IC_IR、和Loss1神经网络5个基线系统用于比较。
2)策略历史表现。在2012年1月1日至2021年10月26日的测试区间上,该策略实现了16.50%的年化超额收益,信息率2.31,超额最大回撤6.76%。回测结果显示基于相关性的目标函数较直接拟合收益年化超额收益提升了7.41%,信息比率提升了0.9。
3)策略分析:DCM在基准模型Weighted IC为负的时候,会带来显著的提升。
▍结论与投资建议:
设计更加合理的目标函数是一种通过提升错误信号的信噪比,从而提升策略性能的有效手段。基于相关性的目标函数较直接拟合收益年化超额收益提升了7.41%,信息比率提升了0.9。
▍风险因素:
训练的随机性风险、因子效果衰减风险、历史业绩不代表未来表现
猜你喜欢
今日头条
图文推荐
精彩文章
随机推荐