ETH:Kintsugi 事件报告

这篇文章内容涵盖Kintsugi事件的全面总结、它的后果,还有在主网合并前的具体行动计划。

概要

合并测试网Kintsugi在几个客户端上发生了问题。一个fuzzer创建了一个无效区块,但客户端Nethermind和Besu因为缺少一项检查而把该区块视为有效。这个无效区块导致网络分成了三部分——一部分包含无效区块、一部分不包含无效区块,还有一部分进入了OptimisticSync模式。尽管修复程序已经部署了,该fuzzer又创建了另一个区块,在客户端Geth触发了进一步的问题——无法加入正确的分叉。当我们修复了Geth的问题,我们就能够把所有的节点带回到相同的正确的分叉,区块链重新开始做最终敲定。

总结

合并测试网Kintsugi在前几周的运行中遇到了一系列问题,暴露了多个客户端的几个漏洞。问题主要是由开发者Marius开发的fuzzer引发的,这个fuzzer旨在创建有意思的区块并在网络里对区块进行广播。

一个这样的区块的blockHash被替换为它的parentHash(父块哈希)。engine_executePayload?具备了所有构建一个区块和构建该区块的blockHash所需的所有参数。EL(执行层)?客户端应该根据这些参数来构建区块,并根据通过的blockHash进行验证。这个特定区块正确无误地没有通过Geth的检查,但通过了Nethermind和Besu的验证。该区块之所以在Nethermind被错误地通过验证是因为缓存问题,而Besu则完全没有这项检查。由此,该区块被一个Lighthouse-Besu节点提议,并导致区块链分叉为两部分,在执行层与Nethermind或Besu连接的验证者在一个分叉上,而月Geth连接的验证者则在另一个分叉上。

Nansen:以太坊Unstaking提款请求需等待17天以上:4月19日消息,据Nansen数据显示,上海升级后,提出提款请求的以太坊验证者将不得不等待17天以上才能取回他们抵押的ETH。上周Unstaking大约需要14天,但随着来自区块链上验证者的越来越多的退出请求涌入,退出等待时间已经延长。(CoinDesk)[2023/4/19 14:12:24]

请注意,检查当前区块的blockHash是合并新增的要求,因此在某些客户端上会存在缺少或不准确的验证。

Geth的一个问题是当执行错误的负载时,它返回的是一个?JSON-RPC错误而不是INVALID(无效),而Teku的问题是(此时已修复但还未部署)认为那些错误在optimisticsync模式下是可通过的。因此,Teku-Geth节点在遇到无效负载时还是进入了optimisticsync模式。由于该区块本身是有效的,已连接的Geth节点是从网络而不是engineAPI获取数据的,因此现在的?Teku-Geth节点是在无效的分叉链上的。由于Teku节点还在有很多漏洞的旧版本上,Teku-Geth节点保持在optimisticsync模式,并在区块链停止做最终敲定的期间拒绝提议区块。我们现在处于这样的一个情况——共识层客户端(lighthouse、prysm、nimbus和lodestar)-Geth(占大约46%)与共识层客户端-Nethermind/Besu(占大约19%)在不同的分叉上,其他运行Teku-Geth(大约占35%)的验证者则处于optimisticsync模式。

Octopus Network推出2.0版本,计划实现Restaking和NEAR IBC Port功能:4月17日消息,Near生态多链网络Octopus Network推出2.0版本,计划在第二季度推出NEAR IBCPort,实现与Cosmos链的连接,支持跨链资产转移。在第三季度上线NEARRestaking,为Cosmos链提供共享安全服务。

此前报道,Octopus Network的40%核心团队成员离职,团队代币激励无限期暂停。该措施旨在让Octopus Network度过加密冬天,团队将以Near和IBC作为重点建设的战略基石。[2023/4/17 14:07:54]

在找到和部署了Nethermind和Besu节点的修复程序后,我们就能够让它们重新连上正确的链。Teku-Geth节点的更新导致了另一个与无效内存访问相关的问题,它由Geth上与区块排序验证相关的问题引起。这个具体的漏洞也是由Marius的fuzzer触发的,这个fuzzer产出了一个parentRoot是有效且block_number=1的区块。在Geth执行一个区块前,它需要查看它的父块,看看它们是否需要同步。这样做的一种方式是在缓存里检查parentHash?或在database里检查parentHash和blockNumber。由于Teku是同时执行所有分叉里的所有负载,缓存就不再包含?parentHash。因此,Geth试图在它的database里通过parentHash和blockNumber?查找其父块。然而,database并没有这个blockNumber的哈希(这个区块是fuzzer构建的)。Geth会推断,由于它没有父块,它需要开启同步。但是,这样触发的同步会试图同步比权威链更短的的链,这就违反了Geth中的某些条件,这导致Geth进程错误,节点关闭,导致Teku-Geth节点一直处于不健康的状态。

Sinohope Staking今日宣布其首个ATOM节点已完成:金色财经报道,新火科技(1611.HK)旗下去中心化Staking技术支持服务——Sinohope Staking今日宣布其首个ATOM节点已完成,并已经成为验证节点成功出块。预计将陆续开通ETH等多个公链的Staking业务,其团队成员和商务BD也在招募当中。[2023/2/1 11:41:22]

在上述问题的调试中,Geth团队还在合并的代码库里发现了一个触发错误的竞争条件。此外,我们还遇到其他问题——Nimbus出现与执行层重新连接相关的错误,Lodestar降低拒绝出块的对等点分数。

客户端推出了所有的修复,且让所有节点都进行升级。当所有的修复都生效时,区块链会有很多小分叉,每个的参与率都很低。对一些节点进行重新同步可以减少一些分叉。一旦有足够多的节点完成重新同步,我们会看到有越来越多的节点通过重组回到这个分叉上,这使我们能跨过最终确定性所需的66%的阈值。

FAQ

币安Staking今晚20点上线IOST Staking:据官方消息,币安Staking平台将于2021年04月13日20:00开启第二期IOST“春季锁仓”,单个用户申请额度下限10 IOST上限5000 IOST,计息周期为锁仓成功的次日上午8:00起至相应定期产品周期结束。

币安Staking将全方位地融入并支持IOST生态发展,发布基于IOST的Staking挖矿服务,双方将携手共创Staking经济体系。[2021/4/13 20:14:24]

Q:这个测试网死了吗?

A:没有。在我们部署修复程序并重新同步一些停滞的节点后,链最终又开始做最终敲定了。当链恢复最终敲定,它就可以如常运行。目前,Kintsugi的参与率是大约99%,这表明所有客户端的漏洞已经得到修补,且网络也运行良好。交易和智能合约交互继续如常运作。

Q:为什么这条链这么长时间不做最终敲定?

A:虽然我们很早就找到了根本原因,我们想要让链保持非最终敲定状态,让客户端团队调试他们的代码。此外,我们想要收集非最终敲定期间的客户端表现数据。

手机免费即时通讯软件Kik发表与Ethereum和Stellar共同开发Kin代币:在周三的博客文章中,Kik开发人员Gadi Srebnik表示Kik公司加强了生态系统内的及时兑换现金功能和效率性,并宣布了如何通过多个区块链来扩展虚拟货币。Srebnik说道,尽管Ethereum为Kin持有者提供兑换现金的功能,但加载时间和费用却无法达到消费者的日常需求。通过添加Steller,可以在更快,更高效,低手续费的基础上运营Kin生态系统。[2018/3/27]

Q:在分叉链上的验证者会被罚没吗?

A:不会。每个验证者都包含一个slashingprotection(罚没保护)database,确保验证者不会对可罚没的信息签名。在“错误”分叉的验证者只会被视为在“正确”分叉上处于inactive状态。一旦它们重组到“正确”分叉上,罚没database会阻止它们对可罚没信息签名。

Q:这会如何影响主网发布?会有新的延迟吗?

A:我们认为这件事不会影响主网发布计划。在规范本身上没有发现严重的问题。测试网的目的是发现漏洞,我们认为?Kintsugi在发现客户端实现的边缘情况方面表现很好。这事件是对多个客户端组合的一次很好的压力测试。我们有一个公开的清单,它将指引我们何时准备好在主网实现合并。

Q:这会如何影响测试计划?

A:我们将研究创建几个强制处于非最终敲定状态的测试网。对这些非最终敲定的测试网进行持续测试使我们可以触发更多边缘情况,和改进工具。在这次事故中发现的漏洞将被添加为静态测试用例,以确保我们会通过回归测试。

对验证者、基础设施提供商和工具开发者的重要启示:

测试网上的非最终敲定时期加强了最糟糕情况硬件要求的一些假设。在非最终敲定期,验证者应该预期:

由于需要对多个分叉选择规则进行评估,CPU负载会增加(有时达到100%)

在非最终敲定期由于不会有修剪,硬盘使用量会增加

RAM使用量会有边际增长

这意味着,在同一台机器上运行的任何额外工具或监测都会遇到资源争用问题。Kintsugi测试网的工具(区块浏览器、水龙头、RPC)在具有3个节点的Kubernetes集群上运行。这个集群还运行多个工具使用的信标节点。由于信标节点使用的资源比预置的要多得多,因此我们的工具经常由于资源不足而以降级的方式运行。对于基础设施提供商来说,谨慎的做法是在不同的机器上运行它们的共识层和执行层,或有严格的资源使用定义。

合并意味着每个共识层客户端都需要运行自己的执行层客户端。(主网上的)执行层客户端现在需要很大的磁盘容量。在非最终敲定期间,CL的磁盘使用量也会激增,这会由于磁盘空间不足而导致崩溃。所有验证者应该确保他们有足够大的缓冲磁盘空间来应对这种问题。

依赖于最终确定性的工具开发者应该为非最终敲定时期多做考虑。一种可能的方式是显示optimistic信息,同时传达该信息在用户界面是会变化的。

来源|?notes.ethereum.org

作者|?parithosh

点击“阅读原文”获取文章内部链接!

原文链接:https://notes.ethereum.org/@ExXcnR0-SJGthjz1dwkA1A/BkkdHWXTY

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

地球链

以太坊交易NFT:NFT使著作权更健全还是更脆弱?

NFT是利用区块链的加密技术,将JPG档案或影片加上独一无二的识别代码的新型数位资产。将数位档案的所有权资讯储存在区块链,即可防止伪造或窜改,并可透过NFT判断数位作品的真伪,因此越来越多人将其.

Pol币CIA:虚拟货币交易的合同效力及风险防范

2021年9月3日施行的《国家发展改革委等部门关于整治虚拟货币“挖矿”活动的通知》对国内虚拟货币挖矿打击较大,不仅意味着继续在国内挖矿将会受到行政处罚,同时还会面临相应的民事刑事风险.

[0:0ms0-1:58ms