图 2.2 CART 决策树示意 图中对 A, B, C, …, L 这些人进行了分类。蓝色的节点被称为分裂点,橙色的节点被称为叶片。叶片的数量也就决定了这一棵决策树最终将样本分成了几类。在本文的算法中,考虑到样本数量不是很多,最大叶片数可以设置为 5,即最多将样本分为 5 份,单个叶片包含最小样本量为总体的 16%。 计算完所有因子以及收益率后,在每天零点取一个样本加入训练集,总计获得 174 个样本。 lspr 移动平均值 过去 24 小时 lspr 均值对未来 72 小时收益率有显著反向影响。f_ma_sd 观测值越大,未来 72 小时内越可能下跌,反之亦然。这与前文的假设一致,具有极强的逻辑解释性。如下图所示,将样本按照因子大小升序分为 5 份,进行分组统计。其中,第 0 组中,因子均值为 1 左右,对应的平均收益率略大于 0;而第 4 组中因子均值超过 1.5,对应的平均收益率小于-2%。且均分较低的组平均收益率显著大于得分较高的组。 图 2.3 f_ma_sd 分组结果 过去 72 小时 lspr 均值也在训练集中展现出类似的性质,在此不再赘述。 图 2.4 f_ma_ld 分组结果 lspr 变动率 在训练集中,通过观察 f_roc 的分组结果,可以发现:f_roc 大幅减少确实意味着未来 72 小时更可能上涨,而 f_roc 大幅上涨对于多头来说却不是什么好迹象。如果当前 lspr 较 3 天前大幅上升,那么多头处于不利地位。若当前 lspr 较 3 天前大幅下降,那做多的预期收益可能会更高。不过,当变动率接近零时,这个因子对未来收益率的预测能力则几乎很弱。详情请见下图: 图 2.5 f_roc_sd 分组结果 图 2.6 f_roc_ld 分组结果 lspr 波动率 现在,我们得以回答上一节中提出的问题。资金层面上多空双方的「焦灼」更可能预示着未来的下跌,而 lspr 的「躁动」,实则是新一轮行情的预兆。 (责任编辑:admin) |