衍生因子介绍为了充分提取 lspr 中蕴含的信息,同时兼顾可观测样本的限制,我们设计了长短两个时间维度,三个统计维度,总计六个因子: 表 2.1 衍生因子 lspr 移动平均值 通过计算 lspr 的移动平均,可以一定程度上消除极端值的影响,从而获得更加稳定的 lspr 值。其中,f_ma_ld 为过去 72 小时的 lspr 平均值,f_ma_sd 为过去 24 小时的平均值。两者反映了近一段时间内 lspr 的绝对水平。下文将探索当 lspr 处于不同水平时,标的未来一段时间内涨跌表现是否存在不同。 lspr 变动率 lspr 变动率衡量了近期 lspr 变动情况。当 lspr 下降时,这一指标则为负值,反之亦然。其中,f_roc_ld 为当前 lspr 值较 72 小时前值的变动率,f_roc_sd 为当前 lspr 较 24 小时前值的变动率。当 lspr 值开始上升,可能意味着资金量较小的交易者开始做多,或者拥有资金和信息优势的交易方开始加仓押注未来即将下跌,那么 lspr 的变动率便可以直观地描述这一现象,为投资者提供变盘的信号。 lspr 波动率 相比上述两个因子,lspr 波动率的计算可能稍有复杂。主观上分析,若 lspr 波动率较低,那么意味着这一段时间内多空持仓陷入了焦灼的状态,双方相持难下;反之,若 lspr 波动率较高,则说明资金博弈层面上,资金量较小的交易者的资金在多空两边反复横跳,这种情形可以被描述为「躁动」。而「躁动」和「焦灼」分别对应了未来的哪一种行情,则需要定量地进行分析。下面,我们分别对过去 72 小时和 24 小时内的 lspr 计算其变异系数(Coefficient of Variation),作为其波动率的估计量。 衍生因子表现出于经验考虑,预测标的选择为未来 72 小时,即未来三天的收益率。训练集时间段内,BTC 未来 72 小时的涨跌幅如下图所示,基本涵盖了震荡和趋势的行情。 图 2.1 BTC 未来 72h 收益率序列 一般而言,在对各个因子进行加工之后,首先需要对衍生因子的预测能力做一个快速、初步的评估。在本研究中,将不同因子从小到大排序,并且通过 CART 决策树算法确定切分阈值,将样本分为若干个区间。进而计算每个区间内因子的平均值,以及对应的收益率的平均值,从而直观的判断各个因子对收益率的影响。 CART 决策树算法,大多数情况下,是使用二叉树对数据进行分类或回归的算法。如图所示: (责任编辑:admin) |