比特币:“无奈”的中本聪与梅克尔树的“多余”

导读

数字货币本质上是一串特殊的字符串,可以无限复制。如果一名矿工短暂控制了超过50%的算力,向交易所发起转账,同时把同一笔数字货币转账给自己。因为手头有足够的算力,所以两笔交易都被写进区块,成为合法交易,这就是“双花攻击”。

比特币网络自诞生以来并稳健运行至今,已证明:在没有结算中心的对等网络,点对点交易也能拒绝双花攻击。所有的比特币交易记录都被保存在区块链上,2008年在中本聪描述比特币原型的论文里提到,他使用了一种名为梅克尔树(MerkleTree,缩写MT)的数据结构对每一个区块里的所有交易做一次简略记录,梅克尔树能够用较少的字节去表达极大量的信息。

梅克尔树的结构是个满二叉树,因此要求交易数量必须是2n。中本聪通过引入“无效却必要的”多余信息来解决这个问题,所付出代价是此多余信息可能会被攻击者利用,实施双花攻击。

本文先介绍梅克尔树的基本结构,生成节点的规则,然后用一个例子来说明如何为比特币交易构造梅克尔树,最后解释了比特币如何通过UTXO的唯一编号来避免因梅克尔树可能引起的双花威胁。

加密巨鲸J1mmy.eth以888.98 ETH购入8只“无聊猿”BAYC:金色财经报道,加密巨鲸J1mmy.eth在社交媒体上宣布以888.98 ETH购入8只“无聊猿”BAYC,价值超过 138.3万美元,在购买完 BAYC # 5718 后,J1mmy.eth 更新了其社交媒体头像并发文:“新的 pfp,谁反对。”截至目前,J1mmy_Vault 钱包中拥有 64 只无聊猿、86 只变异猿、33 只Bored Ape Kennel Club Dog和 133 个Otherdeeds。[2022/11/8 12:32:44]

知识点1:

哈希函数是由数学家或者密码学家精心设计的一种数学运算规则,它可以输入任意长度的数据,而输出结果(即哈希值)的长度保持不变,并且满足:

1)单向运算:只能计算输入得到输出,不能逆向计算输出得到输入;

2)冲突避免:无法找到两个不一样的输入,而它们的哈希值却相同。

哈希函数可以说是区块链最最核心的技术之一,另外一个是非对称加密。正是这二个性质确保了比特币像黄金一样难以获得,经过大量的运算才能得到某个正确的哈希值,使得该哈希值比其它字符串更加珍贵,从而获得价值属性。这是哈希函数在比特币挖矿中的应用,但这并不是本文的重点。

NFT项目“无聊猿”BAYC向乌克兰官方以太坊钱包捐款100万美元:金色财经报道,3 月 9 日,Bored Ape Yacht Club (BAYC) 在其官方社交媒体账户上宣布,已向乌克兰官方以太坊钱包地址捐赠了388.999 ETH(约合 100 万美元)。根据 NFT 市场 OpenSea 的排名数据显示,BAYC 是目前交易额第二大的 NFT 集合,已注册二级市场销售额超过 417,000 ETH(10 亿美元)。另据 Merkle Science 整理的数据,迄今为止,乌克兰已收到价值超过 8800 万美元的加密货币捐赠,其中 ETH 价值约约 700 万美元。[2022/3/9 13:45:50]

知识点2:

梅克尔树又被称作哈希树,因为在这种树状数据结构中,每个节点的标签(或称作值)都是一串哈希值。按照从左向右的顺序,将所有子节点的哈希串联成一个新的长字符串,结果作为哈希函数的输入,经计算得到父节点的标签。

哈希树的概念得名于RalphMerkle,他在1979年9月5号提交文件申请注册了该项专利。当然,等到中本聪使用梅克尔树作为比特币的底层数据结构时,此专利保护期已经结束了。不然的话,中本聪得向梅克尔先生支付专利授权费,这样做也许他的身份就被曝光,而整个区块链行业都需要缴纳一笔不菲的费用。

诺贝尔经济学奖得主克鲁格曼:比特币崇拜可以“无限期地”生存:诺贝尔经济学奖得主保罗·克鲁格曼(Paul Krugman)自比特币诞生之日起就对它进行了猛烈抨击,他的最新推文显示,他现在已经放弃了预测比特币“即将消亡”的想法。克鲁格曼认为,这种受人崇拜的数字货币总是能够找到新的信徒,确保它无限期地生存下去。克鲁格曼重申了他关于比特币是“自由主义derp”和“技术胡扯”的结合的观点,声称自2009年以来,比特币没有任何法律上的使用案例设计。(U.Today)[2021/5/20 22:23:20]

另外多说一句,比特币并没有凭空创造任何新型技术,而是巧妙地使用了若干个已有的密码学工具,组合之后便是区块链这种从未见过的系统。这种创新需要极强的系统性思维,往往独自一人很难拥有这般思考的深度和广度,也就有人推测中本聪其人背后其实并不是某一个人,有可能是一群密码学专家。

梅克尔树的基本结构

言归正传,梅克尔树是一棵满二叉树,其结构如图所示。

每个叶子节点的标签都是其所记录内容的哈希值,而将两个兄弟节点的标签串联起来,作为哈希函数的输入,经过计算得到父节点的哈希,如此重复直到最后只剩下一个节点,即根节点,又称作梅克尔树根。

动态 | 交易所CoinPulse将于2月7日起进行“无限期维护”:据bitcoin.com消息,加密货币交易所CoinPulse近期发布紧急公告称:我们一直在与幕后投资者合作,以保持CoinPulse的运营,然而花费的时间比想象中更长,所以我们将不得不从2019年2月1日起暂停所有交易和存款,提款业务将截止到2019年2月7日,届时我们将对CoinPulse进行维护,直至另行通知为止。在接下来的一周内,希望所有用户将资金从CoinPulse钱包中转移到个人钱包或其他交易所,以避免资产在维护期间被锁定。[2019/2/3]

中本聪设计了一种区块结构,其区块头的某个字段就是梅克尔树根。梅克尔树根源自区块里记录的每一笔交易,交易可以理解成转账,例如类似「A转给B某某数额的比特币」的格式。将有着固定格式的一笔转账记录做序列化之后,就能作为输入tx,交由哈希函数运算,得到的结果就是叶子节点的标签L。

L=Hash(tx)

而每二个叶子节点的哈希,便可以串联起来作为输入,得到父节点的哈希P。

声音 | INE熊羽睿:正确理解“无币区块链”:近日,INE熊羽睿表示,区块链的核心价值之一,是“可信账本”,这个账本上记录的东西一定不要是扰乱全球社会秩序的黑产,而是世界、区域、国家有共识的价值。目前数字货币、加密货币、数字证券等等模糊概念的东西,正在被真正的人类罪恶所利用,走向光明正大还有很长的征程,而区块链要能顺利落地运用,必须规避传统法币秩序、证劵流通、税收等红线,借助区块链的可信账本,打造“可信积分”体系,设置流通边界,用于“价值循环、使用权通证、税外价值激励、中间渠道摩擦成本、系统燃料、产能租用、税后资源流通”等等提高价值流通的经济作用。可以预见的未来,基于技术稳定的公链基础上的数字资产,将针对不同国家体系、不同运用领域特征的子母TOKEN体系同步运行。[2018/12/25]

P=Hash(L0L1)?//''meansconcatenation

区块可以记录的交易内容长度有限,在中本聪的设计里,严格限制了一个区块内所有交易的总长不超过1MB。而交易的长度又随交易的复杂度而变化,可以简单理解成越复杂的交易,其内容越长。为了有效利用区块,挣更多的手续费,矿工们总是希望尽可能往区块里面记录更多的交易。

观察梅克尔树的结构,可以发现其总是一棵满二叉树,这意味着叶子节点的数量总为2n。当待记录的交易数量不足2n,又或者等于2n?时所有交易的总长度超过1MB限制,此时区块能够记录的交易数量不能恰好等于一棵满二叉树的叶子数量。这种情况出现时,该怎么计算梅克尔树根呢?

中本聪如何为比特币交易构造梅克尔树?

以一个简单的例子来说明这个问题。

假设某区块里面记录了一共5笔交易,那么其初始叶子节点仅有5个。每2个叶子节点生成1个父节点,在产生父节点的过程中,却遇到了最后1个叶子节点没有兄弟节点的情况,这时候需要构造出来另外一个节点与其匹配。中本聪的做法是:直接重复该节点本身作为其兄弟节点,然后再按照前述方法得到父节点。这个重复的节点,就是原始交易记录里没有但是梅克尔树上却存在的多余信息。

此时,在梅克尔树结构里面出现了3个父节点,然后再依据这3个节点继续往上构造父节点。同样的问题又出现了,这一层仅有3个节点,最后1个节点必须重复自身以满足兄弟节点成对出现的要求,这样又出现了新的多余信息。最后,再高一层又出现了2个父节点,继续合并,得到最后唯一的节点,即根节点。

在交易数量为5的情况下,由此构造出来的梅克尔树的结构如下图所示。

比特币如何避免

因梅克尔树可能引起的双花威胁?

中本聪的这种做法也许会让读者产生疑惑:既然最后一个叶子节点会被重复,从其父节点的角度看,它有两个具有相同哈希的叶子节点。根据哈希函数的冲突避免性质可以判断,此二个叶子节点所代表的内容完全相同。也就意味着,假设区块里面还能再添加一笔完全相同的交易记录,计算得到的梅克尔树根的值保持不变。这种做法岂不是会导致双花攻击的问题?

比特币网络是如何避免不诚实节点故意在同一区块内记录完全相同的二笔交易?这个疑惑需要借助比特币交易的基本单位UTXO来解释。

在比特币网络里面,并没有「账户」这种东西,也就没有所谓「余额」等衍生概念,因此无法像传统银行系统一样,通过检查账户余额来判断用户有没有可继续花费的资产。所有的比特币都是以UTXO(UnspendTransactionOutput)的形式存在,交易消耗已经存在的UTXO(称作输入,Input),产生新的UTXO(称作输出,Output),被消耗的UTXO便不再有效。

每一个UTXO都拥有一个锁定脚本(ScriptPubKey),用来保护该UTXO不会被除了其拥有者以外的其它人使用,目前还没有人可以解锁不属于自己的UTXO。UTXO能被花费的前提条件是,其锁定脚本被正确地解锁。通常某UTXO的锁定脚本会指定其拥有者的公钥信息,当该UTXO被花费的时候,只有出示与该公钥匹配的私钥所生成的数字签名,即解锁脚本(ScriptSig),才能成功解锁UTXO。

在比特币的设计中,使用交易ID和UTXO在该交易的输出序号来作为UTXO的唯一标识,所有可用的UTXO都保存在一个名为UTXOset的数据集合里面。

这意味着,可以实现:将每一个还未被花费的UTXO都存储在数据库里并向全网公开,将已经被消耗的UTXO销毁并从数据库中删去。那么当攻击者故意构造第二笔交易并试图再一次花费相同的UTXO时,会发现无法在数据库中找到拥有相同ID的那个UTXO。这就相当于,某人花掉了手中真实存在的物理货币以后,便没法再使用一遍。

因为每个UTXO都拥有独一无二的标示,所以在一个区块内,节点很容易判断每笔交易所消耗的UTXO是否相同:如果存在两笔交易的输入为具有相同ID的UTXO,即能判断第二笔交易无效,此区块无法被诚实节点验证通过。

因此,虽然梅克尔树在交易数量不等于2n的情况下,理论上会出现重复哈希值的问题,但实际中在真实区块里面无法再伪造具有相同内容的交易,双花问题得到避免。

注:以上图片来自于Onchain

参考资料:

?比特币原始论文?Bitcoin:APeer-to-PeerElectronicCashSystem

?梅克尔树原始专利文件

本文由PolyEnterprise团队出品

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

地球链

瑞波币ASH:“币虎世界大探险”—解谜

“币虎世界大探险”—解谜Step1:CoinTiger管理员回复“探险”开始解谜第一关关键词:“朋友圈”“合约”“12月7日”“最高币种”Step2:回复答案“ZEC”给CoinTiger管理员.

[0:15ms0-0:494ms