分片插值用低阶多项式拟合大量的数据点。由于我们只使用低阶多项式,我们消除了过度的振荡和非收敛性。 给定一组数据点,分片插值的工作原理是在每一部分数据中使用不同的多项式。 特别是,我们使用连接的分片多项式,也称为样条。 样条的一个例子是下面的截断线性函数。它在4的左边是平的,称为函数的结。 给定几个结点,我们可以将多个线性基函数组合起来,并将其拟合到非线性数据中。 为了检测加密货币价格中存在的高度曲线关系,我使用了一个截断的三次函数,也叫三次样条。 使用三次样条,我们将数据分割成块,并对每个块拟合一个三次样条。每个样条函数在结点处连接到下一个函数。 三次样条是加密货币价格变化的一个非常好的选择,因为连接是平滑的。三次样条的斜率和它们的第一和第二导数都是匹配的。三次样条是3阶的多项式函数,它仍然足够小,以避免差异性。 三次B-样条是三次样条的一个更容易的变体,用于高效计算,因为最多有5个基函数参与贡献插值。下面我们可以看到三次B-样条在Litecoin价格上的表现,将结点放在四分位数上之后。 通过手动选择结点,即在我们有一堆数据点的情况下,与根据四分位数放置结点时的值相比,我们在测试数据集上实现了更好的R2。 在边界附近的三次样条可能表现得很奇怪,你能够在上面的红色图中注意到。所谓的自然三次样条通过在每个极限处将一个三次多项式改为线性来强制要求函数在极限结点之外是线性的。 自然三次样条需要选择一个自由度。对于Litecoin的价格,我通过交叉验证找到了最佳自由度:挑选了合适的174个结点的量子作为预测器的日期。结果与三次B-样条相比,边缘的差异性更小,但测试数据集的R2略差。 最后,我实现了平滑样条,在惩罚价格变化的同时,使均方误差最小化。 平滑样条似乎是Litecoin价格最合适的分片插值。该模型在测试数据集上实现了迄今为止获得的最佳R2值。 三次样条模型令人兴奋的部分是如何超越用于训练模型的数据范围进行推断。 (责任编辑:admin) |