TER:NNS 20461提案是如何通过不增加物理设备优化IC内存系统性能

?

InternetComputer上运行的所有开放网络服务、DeFi、Dapp、NFT等泛平台都是通过Canisters组成,Canisters的自主服务和多元化可组合特性推动非凡的网络效应,基于这种特性是开发者可以在IC上重新构想任何去中心化应用。自5月IC主网上线至今已有数W个Canisters被创建托管,在这数W个Canisters中的许多Canisters组成了完整的Web3.0Dapp。

?

随着IC链上Canisters和用户的快速增长,IC子网的性能需求也在逐渐增长:最近内存密集型Canisters的增长表明IC的内存系统在重负载下存在性能瓶颈。这篇博文描述了NNS20461提案的性能是如何优化IC的内存系统内存的详细信息)。

Bertelsmann India Investments新基金完成5亿美元募资,将专注Web3等领域:6月28日消息,贝塔斯曼旗下风险投资公司Bertelsmann India Investments宣布推出一支专注于印度市场的新基金,该基金已完成5亿美元募资,并计划在2022-2023年间重点投资金融科技、企业科技、Web3和深度科技等颠覆性领域。

贝塔斯曼印度公司是总部位于德国的媒体公司Bertelsmann SE & Co. KGaA的战略投资部门,它本身并没有专门的印度基金,而是通过资产负债表进行投资。(VCCircle)[2022/6/28 1:36:29]

?NNS20461提案详情:https://dashboard.internetcomputer.org/proposal/20461

Layer2 互操作性协议 Connext支持波卡生态的Moonriver:11月17日消息,Layer2 互操作性协议 Connext 宣布支持Moonbeam的先行网络Moonriver,Moonriver是Connext支持的第一个波卡生态的项目。此前Connext已上线主网并支持了以太坊、BSC、xDAI、Polygon、Fantom、Arbitrum和Avalanche的资产跨链功能,支持ETH、USDC、USDT和DAI。[2021/11/17 21:58:10]

提案功能升级后的优化结果:

在9月14日NNS20461提案被受理之后,提案中的优化功能逐步部署到所有InternetComputer子网中,图1-3显示了升级时优化对重负载子网的影响,你可以看到以下两个主要改进;

1、增加和更稳定的区块终结:断断续续的终结率从每秒0.5个区块恢复到1个区块的预期水平。

2、改进消息执行时间:执行消息的平均时间提高了约3倍,最大值提高了约10倍。

Civic创始人Vinny Lingham:比特币在2021年可能达到10万美元:Civic创始人Vinny Lingham发推表示,比特币在2021年可能达到10万美元。Vinny Lingham对比特币的预测并不总是乐观,但他仍认为比特币的价格在今年年底可以达到6位数。[2021/6/28 0:11:20]

?图?1.?优化推出前后的区块终结率。红线之后是优化升级后的区块终结率。

?图2.优化推出前后的消息执行平均时间。

GoldConnect电信服务提供商接受加密货币支付:拉丁美洲和加勒比地区领先的电信批发供应商GoldConnect今天宣布,该公司现在通过他们与世界上最大的比特币和加密货币支付服务提供商BitPay的新LatamConnect平台接受加密货币支付。(prnewswire)[2021/6/15 23:38:42]

?图3.优化推出前后的最长消息执行持续时间。

Canisters正交持久化:

Canisters可以接收和执行两种类型的消息:查询调用和更新调用,查询调用只是执行一个读取当前Canisters的状态操作而不更改该Canisters的函数的调用,并且查询调用在Wasm内存中执行的所有修改都会被丢弃。而更新调用消息允许更改Canisters的状态并保留更改,并且更新调用消息的执行会自动保留所有内存更改,并使用它们可用于后续更新消息和查询消息,这个概念被称为正交持久化。

任何正交持久化的实现都必须解决两个问题:

如何将持久内存映射到Wasm内存中;如何跟踪Wasm内存中的所有修改,以便以后可以持久保存。IC当前正交持久化的实现使用页面保护来解决这两个问题,当消息开始执行时,我们将Wasm内存的整个地址范围划分为4KiB块,称为页面。最初使用操作系统的页面保护标志将所有页面标记为不可访问,这意味着第一次内存访问会触发页面错误、暂停执行并调用我们的信号处理程序。然后信号处理程序从持久内存中获取相应的页面并将该页面标记为只读之后,对该页面的后续读取访问将会成功,无需信号处理程序的任何帮助。然而第一次写入访问将触发另一个页面错误,并允许信号处理程序记住该页面已修改,并将该页面标记为可读和可写,这意味着对该页面的所有后续访问都将成功,无需调用信号处理程序。

Nutbox CMO Sunny:未来数字企业一定是DAO的形态:Nutbox CMO Sunny 在“波卡生态中国行”上表示:未来数字企业一定是DAO的形态。DAO是加密世界最重要的创新之一,Polkadot生态社区、平行链等DAO最终会接管整个经济体中的大部分,让其“Link to Web 3.0”。Sunny还提到,Nutbox Slot Auction即将发布,已与BML、Crust、Plasm、Darwinia、Phala、Bifrost、TokenPocket等达成合作,全力支持各方参与Kusama/Polkadot平行链插槽拍卖。[2021/6/6 23:16:07]

页面保护详情:https://www.gnu.org/software/libc/manual/html_node/Memory-Protection.html

调用信号处理程序和更改页面保护标志是昂贵的操作,读取和写入大块内存的消息会导致此类操作的风暴,从而降低整个系统的吸能。这是在目前在重负载下观察到的性能瓶颈。请注意,信号处理程序是在InternetComputer推出之前编写的,其主要优先事项正确性而不是性能。

Canisters并发查询执行:

Canisters是按照顺序一个接一个执行更新消息,相比之下,查询消息可以相互并发运行并更新消息,对并发执行的支持使得内存实现更具有挑战性,例如:一个Canisters正在H区块高度执行更新消息,同时仍然有一个长时间运行的查询消息,该查询消息更早在区块高度H-K处开始。这意味着同一个Canisters可以同时激活多个版本的内存。

这个问题的一个简单解决方案是在每个更新消息后复制整个内存,这个过程会漫长,并且会使用大量的存储空间,因此当前IC的内存实现采用不同的路线:该路线将修改的内存页面保存在名为PageDelta持久树数据结构中,该结构基于FastMergeableIntegerMaps。每隔一定时间,每N轮都会有一个检查点时间,在克隆文件以保留其先前版本后,将修改的页面提交到检查点文件,在克隆文件以保留其先前版本后,将修改的页面提交到检查点文件中,图4显示了Wasm内存是如何PageDelta和检查点文件构建的。

图?4.a)?检查点文件存储最后一个检查点的?Wasm?内存。b)?自上次检查点以来修改的页面存储在称为?PageDelta?的持久数据结构中。c)Wasm?内存是由信号处理程序通过复制检查点文件页面和修改页面来构建的。

PageDelta详情:https://en.wikipedia.org/wiki/Persistent_data_structure

优化1:内存映射检查点文件

第一个优化是将内存映射到检查点文件页,这通过在同时运行的多个消息之间共享页来减少内存使用,这种优化还通过避免读取访问时的页复制来提高性能。因为信号处理程序调用次数与之前保持一致,经过内存映射检查点优化后信号风暴问题仍然存在。

优化2:查询中的页面跟踪

查询修改所有内存页在执行后都会被丢弃,这意味着信号处理程序不必跟踪查询的修改页面,但是信号处理程序的没有实现区分更新消息和查询消息,我们为查询引入了快速路径,在第一次访问时将页面标记为可读和可写,这种简易的优化使查询速度平均提高了1.5到2倍。

优化3:分摊预取页面

最有影响力的优化背后的想法很简单:如果我们想减少页面错误的数量,那么我们需要为每个信号处理程序调用做更多的事情。新的信号处理程序不是一次获取一个页面,而是尝试推测性的获取更多页面,此处需要适当的平衡,因为预获取太多页面可能会降低仅访问少数页面的小消息性能。优化计算紧接在当前页面之前的访问页面的最大连续范围,它使用范围大小为做预取更多页面的的提示,通过这种方式,预取的成本由以前访问的页面分摊,因此优化将内存密集型消息中的页面错误数量减少了一个轻量级。

总结:最初的信号处理程序是在InternetComputer之前编写的,重点是正确性而不是性能,该区域需要针对性能进行优化也就不足为奇了,然而InternetComputer的快速增长需要比预期更早的进行优化,这些优化不仅消除了一个不需要增加物理设备的性能瓶颈,也为未来更多部署在ICDapp和增长用户做出承载准备。

?

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

地球链

[0:0ms0-1:505ms