特别是在有离群值的区域(图的中间部分),高阶多项式往往会向这些离群值的方向发展。因此,80 阶多项式的模型具有最高的方差。 它在训练数据上的偏差也是最低的,这体现在最高的 R2 值上,相比之下,低阶多项式的 R2 更低,意味着更高的偏差但更低的方差。低阶多项式对训练数据的敏感性较低。 分片插值我发现一个更灵活的方法是使用片断多项式来预测加密货币价格。 分片插值用低阶多项式拟合大量的数据点。由于我们只使用低阶多项式,我们消除了过度的振荡和非收敛性。 给定一组数据点,分片插值的工作原理是在每一部分数据中使用不同的多项式。 特别是,我们使用连接的分片多项式,也称为样条。 样条的一个例子是下面的截断线性函数。它在 4 的左边是平的,称为函数的结。 给定几个结点,我们可以将多个线性基函数组合起来,并将其拟合到非线性数据中。 为了检测加密货币价格中存在的高度曲线关系,我使用了一个截断的三次函数,也叫三次样条。 使用三次样条,我们将数据分割成块,并对每个块拟合一个三次样条。每个样条函数在结点处连接到下一个函数。 三次样条是加密货币价格变化的一个非常好的选择,因为连接是平滑的。三次样条的斜率和它们的第一和第二导数都是匹配的。三次样条是 3 阶的多项式函数,它仍然足够小,以避免差异性。 三次 B-样条是三次样条的一个更容易的变体,用于高效计算,因为最多有 5 个基函数参与贡献插值。下面我们可以看到三次 B-样条在 Litecoin 价格上的表现,将结点放在四分位数上之后。 通过手动选择结点,即在我们有一堆数据点的情况下,与根据四分位数放置结点时的值相比,我们在测试数据集上实现了更好的 R2。 (责任编辑:admin) |