比特币:往事:开创者揭秘比特大陆S9如何成为“一代机皇”

作者:比特大陆前技术总监谢丹

来源:吴说区块链

前言:随着大算力矿机集体入场,一代机皇蚂蚁矿机S9将要退出历史舞台。回顾历史,作者认为,成都团队通过动态触发器,实现了对竞争对手的跨代优势,也是S9成功的主要原因。S9的设计是比特币矿机的奇迹,成为了比特币矿机中生产最多的矿机,生命周期三年多,被称为机皇。文章观点为作者个人意见,不代表吴说区块链立场。

2014年8月,我在成都开了一家后端设计服务公司,我想做有增值价值的后端设计服务。在找客户的时候,我上网搜索了一下,觉得做比特币矿机的公司应该有着这方面的需求,于是给当时比特大陆的网站上的邮箱写了封电邮:

当时,我给很多家集成电路设计公司都写过邮件,而比特大陆是最快回复的一家。后来聊天的时候了解到,这个邮箱当时是吴忌寒吴总在使用,比特大陆那时正好也在寻找提高芯片竞争力的方案。于是吴忌寒把这个邮件转给詹克团詹总,詹总九月路过成都和我见面了。詹总和我面谈了两次,大家聊得不错。詹总觉得这个项目时间很长,风险较大,且存在知识产权的顾虑,建议我解散公司,带领团队加入比特大陆。

Nansen:自6月份Elementals推出以来,Azuki NFT底价暴跌65%:金色财经报道,根据 Nansen 的数据,自 6 月份Elementals推出以来, Azuki NFT的低价已下跌65%。6月26日,即Elementals发布的前一天,Azuki价格徘徊在15ETH(28,250 美元)左右。在接下来的一个月里,截至7月27日,底价暴跌至5 ETH(9,724 美元),Azuki本月交易量也下降了78%。

金色财经曾报道,Azuki于 6月27日推出了名为Elementals的新NFT系列,向现有 Azuki 品牌持有者空投了10,000个动漫风格的头像。另外10,000件将进行拍卖,但在公众有机会购买NFT之前,该系列已售罄。Azuki承认在发布过程中存在失误,并表示“我们没有达到目标”。[2023/7/28 16:03:00]

2014年10月,我带着两个人的小团队正式加入比特大陆,成为比特大陆的全定制部门。最初的方向就是邮件中讲的多米诺逻辑。

多米诺逻辑是一种比较成熟的动态逻辑结构,其主要形态是这样的:

观点:比特币不是通货膨胀的对冲工具:金色财经报道,Ecoinometrics发推表示,比特币不是通货膨胀的对冲工具。在2020年美联储注入数万亿美元时购买比特币的任何人都面临着通货膨胀的压力。[2023/7/10 10:12:41]

多米诺逻辑电路相对于对应的静态电路,有着以下优点和缺点:

因为信号只需要驱动N管,所以电容较小,速度较快。

因为A点是动态点,所以最后的反向器M3/M4是必须的。

A点存在charge-sharing的问题。

M1,M2,M3,M4为新增器件,PMOS为减少器件

因为M1、M2为时钟信号驱动,所以它的功耗至少是其它普通信号的2倍以上。

欧洲央行希望银行在加密立法前遵守巴塞尔规则:金色财经报道,欧洲中央银行?(ECB) 发布了巴塞尔委员会 (BCBS)?于 2022 年 12 月发布的加密资产规则摘要。此外,上周欧盟委员会发布了巴塞尔规则的草案文本?,称银行应对待加密资产风险权重为 1250% 的资产作为临时措施,直到实施详细的立法。欧洲央行的声明暗示银行不应等待立法通过。

欧洲央行表示,在欧盟进行转换之前,BCBS标准尚不具有法律约束力。然而,如果银行希望进入这个市场,他们应该遵守该标准,并在其业务和资本规划中考虑到这一点。巴塞尔委员会为各司法管辖区采用加密资产规则设定了 2025 年 1 月的最后期限。

同时,欧盟规则的当前草案版本预计将进行修订,因为 1250% 的风险权重参考并未区分合规安全令牌(常规风险权重)与加密货币的加密资产。[2023/2/16 12:11:22]

所以,从功耗上考虑,M1与M2因为是时钟信号,它的功耗至少按照两倍信号的功耗算,则M1+M2+M3+M4的功耗是增加了6个MOS管的功耗,对于一般逻辑来说,超过12个MOS管的标准单元库并不多。从面积上讲,M2+M4增加了2个NMOS管的面积,而PMOS虽然少了,但在版图上很难把这节省的面积体现出来。也就是说:多米诺逻辑虽然会加快芯片速度,但是面积与功耗都稍有增加。

DeFi借贷协议Alchemix已完成V2版本迁移:10月14日消息,DeFi借贷协议Alchemix昨日发推称,已完成V1到V2版本头寸的迁移。V1合约已被正式弃用,如果用户仍在V1合约中持有头寸,可以使用此前推出的迁移工具进行迁移。[2022/10/14 14:27:49]

当我们2015年1月把结论提交的时候,基本确认了多米诺逻辑是不适应矿机芯片的。比特币矿机芯片因为纯并行运算,速度并不那么重要。矿机最大的成本在于电费,所以,功耗是最重要的。我们在进行面积与功耗的大拇指规则评估时,功耗的权重是面积和速度的3倍以上。

我们多米诺逻辑尝试的失败,并没有打击我们的探索,因为我们发现了一种适合动态逻辑其积大管子多的标准单元,而这种标准单元有一个很明显的例子,就是触发器Flip-flop。于是我们重回开始,以动态的触发器做为攻坚目标。

在集成电路的开始,上个世纪的七十年代,因为每个晶体管的成本高,所以,那个时候的触发器都是动态的,无论是dominoflip-flop,C2MOSedge-triggeredflip-flop,还是TSPCpositive-edgeFlip-flop等,都是当时的产物。我们从中发现了宝库。

安全团队:LegendaryOwls项目Discord服务器遭到攻击:金色财经消息,据CertiK监测,LegendaryOwls项目Discord服务器遭到攻击,其发布的azukiz[.].com是一个钓鱼网站。请社区用户不要点击、铸造或批准任何交易。[2022/8/17 12:30:55]

比如一个TSPCpositive-edgeFlip-flop,它的逻辑如下:

仍然按照我们clockgate算作两个gate的话,这个flip-flop总共就是4*2+7=15个gate等价。

而我们之前最常用的静态触发器的结构是这样的:

再加上clk的反向器,这个我们加一起就是?8*2+12+4=32个gate等价。静态逻辑的触发器等价管子数功耗比动态逻辑多1倍以上。

同样的,从面积上看,动态逻辑是11个器件,而静态逻辑是22个器件,正好是一倍的面积。

我们在确认了采用动态逻辑的触发器之后,接下来就是如果融入我们的设计流程。我们最后在静态逻辑的触发器的功能描述上,增加了部分时间的约束,以防止动态逻辑中漏电流导致动态电容点漏电。并且在时序和功耗提库时,用静态触发器的一些参数进行套用。简单说,我们在动态逻辑上加了一个外框,让它在前端设计人员看来,就是一个正常的静态触发器,对于前端设计与综合,没有任何的不同。

完成了对动态触发器的提库,我们相当于有一个面积为原来一半,且功耗为原来一半,时序几乎类似的新的触发器了。因为比特币需要不停地计算,所以静态触发器需要保存较长时间的数据就没有必要。当我们在完成动态触发器之后,比特币这种分布运算以及完全流水线的逻辑就特别适合动态触发器了。对于pipeline流水线来说,它的结构是这样的:

我们可以直接改为:

考虑到现在新的动态触发器的面积和功耗只有原来的一半,新的流水线在相同面积和相同功耗下,增加了一倍的速度。在我们比特币的矿机芯片,就是自己从32级流水线改为了64级流水线,增加一倍算力。

我们在2015年中完成对28nm的BM1385芯片设计,并且在2015年年底完成对16nm的BM1387芯片设计。在性能体现上,我们的28nm几乎和对手的16nm相同的性能,而我们的16nm芯片则是对手的一半成本。通过动态触发器,我们实现了对竞争对手的跨代优势。特别是S9的设计,是比特币矿机的奇迹,成为了比特币矿机中生产最多的矿机,生命周期三年多,被称为机皇。

在几乎不需要软件环境的数字货币挖矿行业,一件产品只有竞争对手一半的成本,这是非常大的竞争优势,这意味你可以进行随心所欲的价格战优势。因为你卖到对手不挣钱了,而比特大陆还有50%以上的毛利率。正是凭借着动态逻辑这个秘密武器,依靠S7与S9的销量成功,让比特大陆从不到20%市场份额的群雄纷争局面一举变成一家独大。

比特大陆崛起的一个直接现象,就是国外比特币芯片公司的退出市场,2014年和2015年高调的KNC、bitfury、Spondoolies-Tech、21Inc.都很快宣布破产或者退出矿机芯片市场。

随着比特大陆一些员工的离开,动态触发器这个技术逐渐地传播到国内其它的芯片开发商那里,但是这个技术基本还是约束在国内了。2017年日本GMO还在12nm以及7nm试图进入这个领域,从这家公司的宣传上看,他们还是采用的静态触发器的结构,再加上遇上了2018年的熊市周期,一年后就亏损退出这个市场,是可以预期的。

在16nm之前,新一代工艺mask在数百万美元以内,而重新设计动态逻辑的技术、人力与风险显然是高于数百万美元的,所以动态逻辑的优势无法体现。然而16nm之后,新的10/7nm,以及将来的5nm的成本都数千万美元了。动态逻辑能够超越一个制程节点的性能就会让它显得更加优势,焕发出新的生命力。我期待着更多的应用动态逻辑的公司出现,让这个古老的设计艺术重现在我们时代。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

地球链

[0:46ms0-0:954ms