阶段式同步重构自Go-Ethereum的完全同步模式,以实现更好的性能。
阶段式同步需要进行大量读写操作。虽然我们的目标是能够在机械硬盘上同步节点,但是我们仍建议使用固态硬盘。
顾名思义,阶段式同步需要依次执行10个阶段。
阶段式同步是如何运作的
Turbo-Geth客户端会向每个对等节点了解该节点的HEAD区块,然后依次执行每个阶段、寻找本地HEAD区块和对等节点的HEAD区块之间缺失的区块。
第一个阶段会设置本地HEAD区块。
各阶段会按顺序执行。在每个阶段执行期间,只有节点本地的状态达到目标状态,该阶段才会结束。
也就是说,在理想情况下,每个阶段只需执行一次,即可完成初始同步。
最后一阶段结束后,整个同步流程会重新开始,寻找新的区块头下载。
Lido Finance计划支持直接在Layer 2上质押以太坊:7月18日消息,Lido Finance发布公告称将在Layer 2上支持stETH。Lido将首先支持wstETH在Layer2上的跨链和质押,并计划未来直接支持在Layer 2上质押以太坊。而无需跨链至以太坊主网。Lido表示,初期将仅支持wstETH以及Optimism和Arbitrum网络。[2022/7/19 2:21:39]
如果你在两个阶段之间重启应用,应用会从第一阶段开始重启。
如果你在某个阶段执行期间重启应用,应用会从当前阶段开始重启,以完成该阶段。
每个阶段需要耗时多久?
通过下方的饼状图,我们可以看出每个阶段的耗时占比。虽然这些数据并不精确,但是足以作为参考。
重组/回退
如果区块链发生重组,我们需要“回退”部分同步数据。
数据:以太坊三个月的日隐含波动率达到2020年11月以来低点:4月22日消息,以太坊现货市场的低迷让交易员将注意力集中在衍生品上,一些人发现在这种低隐含波动率的环境下,期权更便宜。
根据Skew提供的数据,无方向性价格走势和去中心化金融期权财库的爆炸性增长,将以太坊三个月的日隐含波动率(IV)或价格波动预期推至3.5%,为2020年11月以来的最低水平。(CoinDesk)[2022/4/22 14:42:15]
回退指的是从最后一个阶段倒退回第一个阶段。但是,需要注意的一点是,我们执行完回退之后才会更新交易池,因此我们知道新的nonce。
回退的阶段顺序如下例所示。
state.unwindOrder=*Stage{
??//Unwindingoftxpool(reinjectingtransactionsintothepoolneedstohappenafterunwindingexecution)
以太坊未确认交易为186,241笔:金色财经消息,据OKLink数据显示,以太坊未确认交易186,241笔,当前全网算力为599.19TH/s,全网难度为8.00P,当前持币地址为61,255,330个,同比增加117,209个,24h链上交易量为3,091,777.56ETH,当前平均出块时间为13s。[2021/8/24 22:34:41]
??stages,stages,stages,stages,stages,stages,stages,stages,stages,stages,
?}
通过?ETL?进行预处理
在将数据插入数据库之前,一些阶段会使用我们的ETL框架根据键值对数据进行排序。
这样就可以极大减少数据库写入放大的情况。
因此,当我们生成索引或者说哈希值化状态时,我们会执行一个多步骤流程。
Deribit上线行权价为6000美元和7000美元的以太坊期权产品:据官方消息,加密货币衍生品交易所Deribit已上线3款新的以太坊期权产品,其中,两款行权价格为6000美元,到期时间分别是2021年9月21日和2021年12月21日,另一款行权价格为7000美元,到期时间是2021年12月21日。[2021/1/4 16:22:07]
将处理过的数据写入位于数据目录的几个临时文件中;
然后使用一个堆栈把临时文件中的数据插入到数据库中,并且使按照能够最小化数据库写入放大现象的顺序插入数据。
这种优化有时会将写入速度提高几个数量级。
各阶段
每个阶段都包含两个函数,分别是向前推进阶段的ExecFunc?和向后回退阶段的?UnwindFunc。
从理论上来说,部分阶段可以离线工作,但是当前版本并未实现这一功能。
以太坊2.0存款合约地址余额突破140万ETH:据欧科云链OKLink数据显示,当前以太坊2.0存款合约地址已收到1400001.0 ETH,有43750个地址完成32 ETH的抵押。[2020/12/12 14:58:18]
阶段1:下载区块头
在这一阶段,我们会下载本地HEAD区块和对等节点的HEAD区块之间的所有区块头。
这一阶段是CPU密集型的,适合使用多核处理器,因为要验证区块头的工作量证明。
由于区块链重组,大多数回退都是在这一阶段开始的。
这一阶段会推动本地HEAD的指针。
阶段2:区块哈希值
从区块头中抽取出一个从区块哈希值映射成区块号的索引表,以支持更快速的查找功能,并让同步过程对机械硬盘更为友好。
阶段3:下载区块体
在这一阶段,我们会将上一阶段已下载区块头的区块体也下载下来。
这一阶段需要保持良好的联网连接。绝大多数数据都在这一阶段下载。
阶段4:复原发送者
这一阶段会复原出并存储每个已下载区块中的每笔交易的发送者。
这一阶段同样是CPU密集型的,适合使用多核处理器。
这一阶段不需要联网。
阶段5:执行区块
在这一阶段,我们会执行之前下载的所有区块中的每一笔交易。
需要注意的一点是,在执行区块的过程中,我们不会验证根哈希,甚至不会创建默克尔树。
这一阶段是单线程的,无需联网,需占用大量磁盘空间。如果区块执行失败,可以回退该阶段。
阶段6:计算状态根
这一阶段会构建默克尔树,并验证当前状态的根哈希。
这一阶段也会构建中间哈希值,并将它们存储到数据库中。
如果之前没有存储任何中间哈希值,这一阶段会构建出完整的默克尔树及其根哈希。
如果数据库中没有中间哈希值,这一阶段就会利用区块的历史记录来弄清楚哪些哈希值已经过时,哪些哈希值是最新的,然后使用最新的哈希值来构建部分默克尔树,只重构过时的哈希值。
如果根哈希无法匹配,就会向后回退一个区块。
这一阶段不需要联网。
阶段7:生成哈希值化状态
在执行期间,Turbo-Geth使用无格式状态存储。
无格式状态:在标准状态中,账户和存储项的地址是?keccak256(address)?,但是在一般状态中,二者的地址就是?address?。
尽管如此,为了确保一些API能够正常运作并与其它客户端保持兼容,我们也会生成哈希值化状态。
如果哈希值化状态不是空值,我们会查看历史记录变更集,并且只更新已更改的项。
这个阶段不需要联网。
阶段8、9、10?:生成索引
同步期间会生成3个索引。
这3个索引可能会被禁用,因为所有API都不使用它们。
这一阶段不需要联网。
交易查询索引
该索引表由从交易哈希值到区块号的映射构成。
账户历史索引
该索引存储了从账户地址到区块列表的映射。
存储历史索引
该索引存储了从存储项地址到区块列表的映射。
阶段11:交易池
在这一阶段,我们会启动交易池或更新其状态。例如,如果我们已下载的区块中包含了某些交易,就把这些交易从交易池中移除。
在回退时,我们会将被回退的区块中的交易重新添加到交易池中。
这个阶段不需要联网。
原文链接:
https://github.com/ledgerwatch/turbo-geth/tree/master/eth/stagedsync
作者:?AlexSharov
翻译&校对:闵敏?&?阿剑
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。