作者:Michel Kana, Ph.D,翻译:Jeremy 这份实用指南提供了你预测加密货币价格飞速上涨所需的基础知识。 十五年前,我开始探索数字货币的世界,并为一个只使用短信的点对点移动货币平台做了原型。 最近,我的一位合作者问我,人工智能是否可以预测加密货币的价格。她对区块链的炒作很好奇。 经过研究,我发现预测加密货币价格是一个可以解决的问题,但绝对不是针对所有市场条件。 加密资产的典型预测模型将利用时间序列预测(如ARIMA、Facebook Prophet)、机器学习(如随机森林算法、线性回归)或深度学习方法(如LSTM)。 在本文中,我研究了在预测给定日期的Litecoin平均价格时,片断插值的表现如何。 数据 我们将关注2013年4月至2021年2月期间Litecoin的历史价格。这些数据取自coinmarketcap,并且是可以免费使用的。我将数据分为80%的训练数据集和20%的测试数据集。后者用于评估我们预测收盘价的准确性。 加密货币Litecoin的价格历史 (Source: Kaggle) 短暂的探索性数据分析显示,平均收盘价在年初和年末是最高的。10月份最低。 多项式回归 你可能听说过多项式回归,这可以说是创建一个阶数为d的基础来近似一个非线性函数(在我们的例子中,加密货币价格波动)的最简单例子。 我对Litecoin的历史价格进行了简单的多项式回归,使用5、25和80的阶数。在每种情况下,R2值将提供一些关于模型在测试数据集上的拟合度好坏的信息。 从下面的蓝线与训练数据的拟合度来看,我们可以观察到随着多项式阶数的增加,曲线越来越陡峭。这是由于模型复杂性增加,因为高阶多项式试图追逐训练集中的每一个单一数据点。 第0天代表2013年4月30日,第2800天代表2021年2月28日。 特别是在有离群值的区域(图的中间部分),高阶多项式往往会向这些离群值的方向发展。因此,80阶多项式的模型具有最高的方差。 它在训练数据上的偏差也是最低的,这体现在最高的R2值上,相比之下,低阶多项式的R2更低,意味着更高的偏差但更低的方差。低阶多项式对训练数据的敏感性较低。 分片插值 我发现一个更灵活的方法是使用片断多项式来预测加密货币价格。 (责任编辑:admin) |