加密货币:机器学习能否预测加密货币的价格?

这份实用指南提供了你预测加密货币价格飞速上涨所需的基础知识。

十五年前,我开始探索数字货币的世界,并为一个只使用短信的点对点移动货币平台做了原型。

最近,我的一位合作者问我,人工智能是否可以预测加密货币的价格。她对区块链的炒作很好奇。

经过研究,我发现预测加密货币价格是一个可以解决的问题,但绝对不是针对所有市场条件。

加密资产的典型预测模型将利用时间序列预测(如ARIMA、Facebook Prophet)、机器学习(如随机森林算法、线性回归)或深度学习方法(如LSTM)。

在本文中,我研究了在预测给定日期的Litecoin平均价格时,片断插值的表现如何。

我们将关注2013年4月至2021年2月期间Litecoin的历史价格。这些数据取自coinmarketcap,并且是可以免费使用的。我将数据分为80%的训练数据集和20%的测试数据集。后者用于评估我们预测收盘价的准确性。

Dune Analytics:逾66,000名用户通过Dex机器人进行了超过1.494亿美元的交易:金色财经报道,根据Dune Analytics的数据,迄今为止,已有超过66,000名加密货币所有者通过Dex机器人服务进行了总计超过1.494亿美元的交易。与此同时,分析师警告称,他们的计算存在重大风险,例如Telegram 上的加密交易机器人Unibot、Swipe、WagieBot 和 Bolt,尽管它们以友好的界面和易用性而著称,但专家表示,用户实际上将自己的资产安全责任转移给了第三方,由于大多数机器人都是闭源且未通过安全审核,这一事实加剧了这种情况,这可能会导致资产损失,并且无法避免黑客攻击。[2023/7/29 16:05:20]

加密货币Litecoin的价格历史 (Source: Kaggle)

数字玩具公司Cryptoys计划将AI聊天机器人集成到NFT中:7月12日消息,数字玩具公司Cryptoys计划将儿童友好的AI聊天机器人集成到其基于角色的数字收藏品中。Cryptoys计划集成的AI软件ChatGuardian拥有聊天过滤器,家长可以自定义该过滤器,以确保孩子与NFT角色进行安全、适当的对话。[2023/7/12 10:51:03]

短暂的探索性数据分析显示,平均收盘价在年初和年末是最高的。10月份最低。

你可能听说过多项式回归,这可以说是创建一个阶数为d的基础来近似一个非线性函数(在我们的例子中,加密货币价格波动)的最简单例子。

我对Litecoin的历史价格进行了简单的多项式回归,使用5、25和80的阶数。在每种情况下,R2值将提供一些关于模型在测试数据集上的拟合度好坏的信息。

银保监会陈伟钢:区块链制造信任的机器 未来发展需要法律规范:9月10日消息,在《寻找区块链力量》节目中,中国银保监会重点金融机构监事会监事陈伟钢表示,区块链是一个制造信任的一种机器。有很多行业很多产业在慢慢向数字化进程中,它已经注意到了一些数字化积累,但原来有一些资产是没有数字化的,还需要去挖掘。总体来说,未来要数字化的话就需要有数字化过程,可以用数字描述的过程。与此同时,陈伟钢表示,未来区块链发展到一定程度以后就要有法律去规范。他称,法律方面,因为以前没有这个东西,什么可为,什么不可为,没有用法律的东西去规范,未来区块链到一定程度以后就要有法律的东西,这件事不能做,或这件事是可做的,需要有法律层面的,现在还没有。(新浪财经)[2020/9/10]

从下面的蓝线与训练数据的拟合度来看,我们可以观察到随着多项式阶数的增加,曲线越来越陡峭。这是由于模型复杂性增加,因为高阶多项式试图追逐训练集中的每一个单一数据点。

第0天代表2013年4月30日,第2800天代表2021年2月28日。

声音 | Gold Bullion International联合创始人:比特币是一台真理机器:Gold Bullion International联合创始人Dan Tapiero分析了比特币的价值,认为它是一台真理机器。“这是一项发明,我认为它应该被称为一项发明,而不是所有其他的东西。……这是一台真理机,是一种根除人类所有欺诈或谎言的方法。” 他还指出,这个系统现在已经有十年的历史,并且有着良好的记录。他总结道:“比特币实际上只是矿工为保证网络框架安全而获得的奖励,这就是比特币。”(Cointelegraph)[2019/9/10]

特别是在有离群值的区域(图的中间部分),高阶多项式往往会向这些离群值的方向发展。因此,80阶多项式的模型具有最高的方差。

非营利组织“机器情报研究所”接受加密货币捐赠 收到Vitalik Buterin763,970美元的捐赠:非营利组织“机器情报研究所”(Machine Intelligence Research Institute)最近发布了一份筹款统计数据,显示了对加密货币社区的大力支持。该机构是一家非盈利组织,负责调查与人类高级人工智能(AI)相关的安全问题。他们在2017年的年度募款活动筹集了250多万美元,是125万美元目标的两倍多。非营利组织透露,在这次筹款活动中捐赠的资金有66%(大约166万美元)是用加密货币(主要是比特币和以太坊)进行的。事实上,最大的捐赠是在筹款活动结束的时候,从Vitalik Buterin那里获得了价值763,970美元的捐赠。Vitalik的捐赠是迄今为止研究机构在所有筹款活动中所收到的第三大捐款。[2018/2/22]

它在训练数据上的偏差也是最低的,这体现在最高的R2值上,相比之下,低阶多项式的R2更低,意味着更高的偏差但更低的方差。低阶多项式对训练数据的敏感性较低。

我发现一个更灵活的方法是使用片断多项式来预测加密货币价格。

分片插值用低阶多项式拟合大量的数据点。由于我们只使用低阶多项式,我们消除了过度的振荡和非收敛性。

给定一组数据点,分片插值的工作原理是在每一部分数据中使用不同的多项式。

特别是,我们使用连接的分片多项式,也称为样条。

样条的一个例子是下面的截断线性函数。它在4的左边是平的,称为函数的结。

给定几个结点,我们可以将多个线性基函数组合起来,并将其拟合到非线性数据中。

为了检测加密货币价格中存在的高度曲线关系,我使用了一个截断的三次函数,也叫三次样条。

使用三次样条,我们将数据分割成块,并对每个块拟合一个三次样条。每个样条函数在结点处连接到下一个函数。

三次样条是加密货币价格变化的一个非常好的选择,因为连接是平滑的。三次样条的斜率和它们的第一和第二导数都是匹配的。三次样条是3阶的多项式函数,它仍然足够小,以避免差异性。

三次B-样条是三次样条的一个更容易的变体,用于高效计算,因为最多有5个基函数参与贡献插值。下面我们可以看到三次B-样条在Litecoin价格上的表现,将结点放在四分位数上之后。

通过手动选择结点,即在我们有一堆数据点的情况下,与根据四分位数放置结点时的值相比,我们在测试数据集上实现了更好的R2。

在边界附近的三次样条可能表现得很奇怪,你能够在上面的红色图中注意到。所谓的自然三次样条通过在每个极限处将一个三次多项式改为线性来强制要求函数在极限结点之外是线性的。

自然三次样条需要选择一个自由度。对于Litecoin的价格,我通过交叉验证找到了最佳自由度:挑选了合适的174个结点的量子作为预测器的日期。结果与三次B-样条相比,边缘的差异性更小,但测试数据集的R2略差。

最后,我实现了平滑样条,在惩罚价格变化的同时,使均方误差最小化。

平滑样条似乎是Litecoin价格最合适的分片插值。该模型在测试数据集上实现了迄今为止获得的最佳R2值。

三次样条模型令人兴奋的部分是如何超越用于训练模型的数据范围进行推断。

根据以预测和时间序列工作而闻名的著名统计学家Rob Jhyndman的说法,三次平滑样条模型在预测方面可以作为与ARIMA模型等效的模型,但其参数空间受到限制。Rob声称,样条模型提供了一个平滑的历史趋势以及线性预测函数。

我邀请你进一步试验这个想法。我的计算机代码可以在网上以Jupyter Python/R Notebook形式查看。

本文中使用的Google Colab Notebook 

数字货币和加密货币,如Litecoin,是现代全球经济中最具争议和最复杂的技术创新。本文旨在使用一种不太流行的方法:三次样条来预测Litecoin价格的变化。

Michel Kana, Ph.D   作者

Jeremy   翻译

Jeremy   编辑

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

地球链

BitcoinFIL:5大原因看懂Filecoin币价暴涨逻辑

最近几天,整个市场最火的项目莫过于Filecoin(FIL)。据欧易OKEx行情显示,FIL于3月26日一举突破100美元大关,此后两天续刷新高,最高触及139.687美元,较月内低点涨幅超30.

[0:31ms0-1:685ms