在这篇文章中,我们深入研究了数据可用性问题的细节以及它如何影响以太坊的扩展。
什么是数据可用性问题?
数据可用性(DA)问题:区块链网络中的节点如何确保新提议区块的所有数据实际上是可用的?如果数据不可用,则该块可能包含被块生产者隐藏的恶意交易。
举个例子,假设 Alice 是 ZK-Rollup (ZKR) 的运营商。她在以太坊上提交了经过验证的 ZK 证明。如果她没有在以太坊上提交所有交易数据,尽管她的证据证明rollup中进行的所有状态转换都是有效的,但rollup的用户仍然可能对其当前账户余额一无所知。由于提交的证明的零知识性质,提交的证明没有说明当前状态。
Optimistic Rollup (OPR) 设置中有一个类似的例子,Alice 在以太坊上提交了一个断言,但 OPR 的任何参与者都不能挑战它,因为交易数据不可用,因此他们无法重新计算或挑战该断言 .
模块化区块链网络Celestia推出OPStack模块化数据可用性接口Beta版本:6月2日消息,模块化区块链网络 Celestia 宣布推出 OP Stack 模块化数据可用性(DA)接口的 Beta 版本,允许开发人员定义 DA 层并从任何区块链继承安全性,包括以太坊、Celestia 和比特币。Rollup 平台 Caldera 将很快发布 Taro 测试网,允许开发人员和用户使用模块化 DA 试用 OP Stack 的第一个公共测试网。[2023/6/2 11:54:19]
为了应对上述情况,OPR 和 ZKR 的设计都要求operator将以太坊上的所有交易细节作为“calldata”提交。虽然这使他们在短期内避免了 DA 问题,但随着rollup内部交易数量的增长,需要提交的数据量也会增加,从而限制了这些rollup可以提供的扩展量。
信通院TBI成立首个专项研究组 建设基于区块链的数据可信协作应用体系:金色财经报道,3月29日,中国信通院可信区块链推进计划(TBI)第十一次全会在杭州召开。会上,中电长城网际系统应用有限公司、贵阳大数据交易所、蚂蚁链三方牵头成立数据可信流通项目组,面向数据要素流通探索融合技术、应用体系和典型场景,建立数据可信流通的相关标准和技术规范。
据中电长城网际数字场景科技研究院院长朱江介绍,TBI数据可信流通项目组接下来将着力推进三项工作,包括制定区块链数据可信协作标准,建设基于区块链的数据可信协作应用体系,以及建立区块链可信数据协作人才培养体系。(新浪)[2023/4/1 13:39:29]
这对如今的区块链有何影响?
为了回答这个问题,让我们首先回顾一下类似以太坊的区块链的一般区块结构以及任何区块链网络上存在的客户端类型。
高通CEO安蒙:5G将助力AI扩展,使数据可与其他设备及云端共享:3月25日消息,高通公司总裁兼CEO安蒙在中国发展高层论坛2023年会“推进数字经济与实体经济融合”专场上演讲称,5G是实现数字社会的重要基础设施,此外,5G还将助力AI扩展,为边缘计算和端侧人工智能带来诸多益处。
安蒙认为,数字化转型将实现人与万物智能互联。这也意味着超高速、可靠连接随时随地、始终连接到云端,具有嵌入式处理器和人工智能(AI)的一系列设备,以及数字孪生的普及。(澎湃)[2023/3/25 13:26:29]
一个块可以分为两个主要部分:
区块头:一个小区块头包含与区块中包含的交易相关的摘要和元数据。
块体:它包含所有交易数据并占块大小的大部分。
在传统的区块链协议中,所有节点都被视为同步整个区块并验证所有状态转换的完整节点。所有节点花费大量资源来检查交易有效性并存储区块。从好的方面来说,这些节点不会接受任何无效的交易。
黄奇帆:基于人工智能和区块链技术建立数据可追溯系统:10月24日,复旦大学特聘教授、重庆市原市长黄奇帆在第三届外滩金融峰会上表示,合理分配好数据的管辖权、交易权、所有权、使用权、财产分配权,能够有效促进数据资源转化为数据资产,有利于保护数据主体权益并维护数据安全。
他进一步表示,各类数据活动具有公共产品的特性,它的管辖权、交易权应当归属于国家,内部的任何数据活动都应该遵循国家数据安全法规。国家可以成立中央数据部门对国内的数据活动进行统一管理,在确立总的管理规则后,主要城市可以设立定点数据交易所,类似在北京、上海、深圳设立的证券交易所,而其他的一般省会城市、地级市不能设立。
“同时基于人工智能和区块链技术建立数据可追溯系统,对数据无论是交易、使用、财产分配,有全息的可追溯过程,并且保证是不可更改的,从而保证数据交易安全有序。”(中国证券网)[2021/10/25 20:53:41]
可能还有另一类节点没有(或不想花费)资源来验证每笔交易。相反,他们主要对了解区块链的当前状态以及与他们相关的某些交易是否包含在链中感兴趣。这些轻客户端依靠全节点来检查所有交易是否有效。因此,在安全性方面,它们依赖于可信的全节点。
声音 | ALabs负责人王增新:改进后的零知识证明是解决数据可用性问题的可行方案:今日,在日本东京举办的SmartBlock2018国际学术会议上,区块链研究院ALabs负责人王增新做了关于区块链安全隐私及扩展性的学术分享,他认为数据可用性问题是区块链广泛应用的瓶颈,改进后的零知识证明是解决数据可用性问题的可行方案,即将共识的复杂程度降低到对数级别,提高数据的交换与验证效率。ALabs将围绕这个方向进行探索,推动区块链行业应用发展。 SmartBlock2018国际学术峰会由Springer、早稻田大学、哥伦比亚大学、北京理工大学、伯明翰城市大学等顶尖学术院校联合主办,会议围绕前沿科技趋势进行探讨,包括人工智能、大数据、区块链等前沿技术,数百名学术大拿及企业高管出席活动。[2018/12/11]
但是如果区块生产者没有透露区块背后的全部数据呢?这可以防止全节点验证所有交易。这反过来又阻止了轻节点绝对确定它所看到的由所有合法交易支持的区块头。
为了解决这个问题,我们需要一种轻客户端机制来验证数据可用性。这将确保区块生产者无法通过说服轻客户端来隐藏数据。它还将迫使区块生产者公开部分数据,使整个网络以协作的方式访问整个区块。
让我们借助一个例子更深入地探讨这个问题。假设区块生产者 Alice 用交易 tx1、tx2、……、txn 构造了一个区块 B。让我们假设 tx1 是恶意交易。如果 tx1 被广播,任何完整节点都可以验证它是恶意的,并将其发送给轻客户端,轻客户端会立即知道该块是不可接受的。但是,如果 Alice 想隐藏 tx1,她会显示标头和除 tx1 之外的所有交易数据。全节点无法验证 tx1 的正确性。让轻节点查询任意一笔交易,均匀随机。轻客户端查询 tx1 的概率为 1n。因此,Alice 能够以压倒性的可能性轻客户端接受恶意交易。由于不可归因的性质,全节点无法以任何方式证明 tx1 不可用。
那么,我们该怎么办呢?
该问题的解决方案在于在块中引入冗余。总的来说,有大量关于编码理论的文献,特别是擦除编码,可以帮助我们解决这个问题。
简而言之,纠删码允许我们将任何 n 个数据块扩展为 2 个数据块,其中 2n 个数据块中的任何一个都足以重建原始数据块(参数是可调的,但为了简单起见,我们在这里考虑了这一点)。
如果我们强制区块生产者擦除交易 tx1、tx2、...、txn 的代码,然后隐藏单个交易,则需要隐藏 n+1 个交易,因为任何足以构建整个交易集的交易。在这种情况下,恒定数量的查询使轻客户端足以确信底层数据确实可用。
哇,原来如此?
不。虽然这个简单的技巧使隐藏工作变得更加困难,但区块生产者仍有可能故意以错误的方式执行擦除编码。然而,一个完整的节点可以验证这个擦除编码是否正确完成,如果没有,它可以向轻客户端证明这一点。这被称为欺诈证明。有趣的是,轻客户端需要有一个诚实的全节点邻居才能确定如果编码错误,那么它将收到欺诈证明。这确保了轻客户端以极高的概率访问没有恶意交易的链。
但是存在一个问题!如果简单地实现,欺诈证明的大小可以按照块本身的大小排序。但我们对轻客户端的资源预设禁止我们使用这样的设计。通过使用多维擦除编码技术,可以在这方面有所改进,该技术以可接受的大小减少欺诈证明的大小。为简洁起见,我们不涉及这些,但该文献(https://arxiv.org/abs/1809.09044)对其进行了详细分析。
基于欺诈证明的解决方案的问题在于,轻客户端永远无法完全确定尚未收到欺诈证明的任何块。此外,他们一直相信其全节点对等方是诚实的。还需要激励诚实的节点不断保持审计区块。
有没有办法避免欺诈证明?
最近,向量承诺重新引起了区块链领域的关注。这些向量承诺,尤其是对多项式的恒定大小的 KZG/Kate 承诺,可用于设计简洁的 DA 方案,而无需欺诈证明。简而言之,Kate 承诺允许我们使用单个组元素提交多项式。此外,该方案支持我们证明在某个点 i 使用恒定大小的见证,多项式评估为(i)。承诺方案在计算上是隐藏和绑定的,也是同态的,使我们能够巧妙地避免欺诈证明。
我们强制块生产者获取原始交易数据并将其排列在大小为 n,m 的二维矩阵中。它使用多项式插值将大小为 n 的每一列扩展为大小为 2n 的列。对于这个扩展矩阵的每一行,它都会生成一个多项式承诺,并将这些承诺作为区块头的一部分发送。下面给出了该块的示意图。
轻客户端查询这个扩展矩阵的任何单元格以获得见证,这使它能够立即根据块头验证它。恒定大小的成员证明使抽样非常有效。承诺的同态性质确保只有在正确构造块的情况下才验证证明,并且多项式插值确保成功样本的恒定数量意味着数据以非常高的概率可用。
该方案的更精细细节以及进一步的优化和成本估算超出了本文的范围。
其他选择是什么,以及进一步变更是什么?
更高维的擦除代码和 Kate 承诺并不是解决 DA 问题的唯一方法。我们在这里跳过了其他方法,如编码默克尔树、编码交错树、基于 FRI 和 STARK 的方法,但每种方法都有其优点和缺点。
我们在 Polygon,一直在使用 Kate 承诺开发数据可用性解决方案。在后面的文章中,我们将介绍实现细节、您现在可以如何使用它以及我们如何致力于转变 DA 问题空间。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。