2022?年?11?月,OpenAI?推出了创新的人工智能项目。
除了可用于进行文章的撰写和总结、笑话和诗歌的创作以外,ChatGPT?还可以用来调试和生成代码。
2022?年全年,Web3.0??领域因黑客攻击和欺诈等事件造成的资产损失超过了?37?亿美元,这样巨额损失不禁让业内人思考:如?ChatGPT?这样的新技术是否可以用以改善智能合约代码的安全性。
ZKasino?是一个去中心化的平台,近期通过?ChatGPT?进行了一次预审计。
ZKasino?希望在?CertiK?开展全面审计的同时,让?CertiK?为?ChatGPT?所得出的结果进行一个初步的审查,以测试?ChatGPT?作为?AI「智能合约审计师」的能力。
那么?ChatGPT?的测试结果如何呢?
其是否已经准备好接替人工代码审计专家的工作?
或者说它仍不足以完全替代人工?
阿里版ChatGPT内测已在进行:4月4日消息,知情人士表示,2023阿里云峰会将于4月11日在北京召开,包括阿里巴巴董事局主席兼CEO张勇,阿里云智能首席技术官周靖人、阿里云智能全球商业总裁蔡英华在内的主要负责人将出席主论坛。2023阿里云峰会上将正式推出阿里大模型,接下来还有各类的行业应用类模型会面世。阿里11日推出大模型,18日推出行业应用类模型。之前,有博主测试了天猫精灵,发现已经上线了阿里版ChatGPT语音助手版。 (钱江晚报)[2023/4/4 13:44:11]
2022?年?12?月?23?日,ZKasino「聘请」了?ChatGPT?来识别智能合约中潜在的安全风险。该工具也的确提出了几个表面上听起来很合理的风险担忧。
然而,尽管?ChatGPT?不可否认地为Web3.0?安全社区提供了一些有价值的服务,但是我们发现其仍有相当大的改进空间——ChatGPT?遗漏了一些严重或关键性的漏洞,同时又「误伤」了那些没问题的代码。在此,我们希望?CertiK?安全专家的深度数据和建议能够助力?ChatGPT?成为一个更强大的Web3.0?应用安全工具。
“大空头”Michael Burry:我们将看到另一个通货膨胀高峰:金色财经报道,对冲基金经理、电影《大空头》原型Michael Burry发布推文表示,美国通货膨胀达到顶峰,但这不是这个周期的最后一个高峰。他在推文中警告道,我们很可能会看到CPI走低,2023年下半年可能为负值,而且无论从哪个定义来看,美国都将陷入衰退。美联储将降息,政府将刺激。我们将有另一个通货膨胀高峰,这并不难。
美联储将于2023年 1 月 4 日发布其联邦公开市场委员会 (FOMC) 会议纪要,为未来的政策提供指导。[2023/1/3 22:21:13]
下文,我们将为大家详细介绍此次事件中?ChatGPT?的两类错误发现。
ChatGPT?发现了合约中的哪些问题?
ChatGPT?遗漏了什么
ChatGPT?提到了在许多智能合约实现中都会存在的几个常见安全问题。
但是,它未能识别某些严重的风险,包括:
TrustToken利用Chainlink提供TUSD链上储备证明:稳定币发行机构TrustToken宣布与Armanino会计师事务所合作,将集成Chainlink推出其TUSD担保级别储备金证明系统。(Coindesk)[2020/11/12 12:22:06]
项目特定的逻辑漏洞
不准确的数学计算和统计模型
代码实现和项目设计的不一致
漏洞#1?:项目特定的逻辑问题
ChatGPT?未能识别出一个关键漏洞,该漏洞会导致攻击者可以不断地赢取并耗尽?Bankroll?合约中用户的资金。玩家可以通过调用可验证随机函数加入游戏,Chainlink?的?VRF?会使用随机数触发?fulfillRandomWords()函数以完成游戏。
ZKasino?的代码允许用户在?fulfillRandomWords()?调用失败的情况下将资金取回。
在?CertiK?对同一智能合约代码的审查中,发现了一个潜在且有害的_transferPayout()调用,该函数被设计为可将赢取的资金转移至玩家的账户。
美股区块链概念股Riot blockchain盘前大涨23%:行情显示,美股区块链概念股Riot blockchain盘前大涨23%,嘉楠科技盘前涨10%。[2020/7/27]
然而攻击者可以在输了的时候调用_transferPayout()使其回滚,导致整个?fulfillRandomWords()调用失败——这会使其进入长为?100?个区块的等待期,继而触发?CoinFlip_Refund()进行退款,这意味着攻击者相当于永远不会输钱。
虽然?ChatGPT?认识到了调用失败的问题,但却未能发现在这个项目中利用调用失败的攻击手法。
因此,ChatGPT?没有发现该漏洞与项目逻辑相结合所产生的影响。有关具体攻击流程的描述,请参阅?ZKasino?的完整审计报告。
漏洞#2?:不准确的数学计算和统计模型
确保满足合理预期的随机性和结果在任何游戏项目中都至关重要。为了证实这一点,需要在审计过程中对所有游戏结果的随机性进行全面评估。
Blockstream发布Lightning Charge 已应用于Blockstream商店小额支付:近日,Blockstream发布了Lightning Charge,这是一个用node.js写成的小额支付处理系统,目前已经接入到Blockstream在线商店中。用户可以通过其使用闪电网络来进行小额支付。在Blockstream商店,用户可以在比特币主网上使用闪电网络支付来购买一些贴纸和T恤。但Blockstream提示,目前闪电网络仍在测试中,存在已知和未知的bug,请用户谨慎使用该商店功能,自行承担风险。[2018/1/17]
尽管?ChatGPT?同样「认同」这一点的重要性,但它并未发现任何不公平的游戏结果。它提出了?VRF?的使用,以及如果?VRF?合约被破坏或被操纵,可能会出现不公平的结果:
“如果?VRF?合约不安全或被操纵,则可能会导致游戏出现不公平的结果。”
然而,这个结论仅仅只是一个结论,并没有真正解决导致游戏结果不公平的根本原因。而且我们在审计过程中也发现了一些关于随机性的潜在风险问题。
不公平的随机性
发现的其中一个关于随机性的中等级别风险是?VideoPoker?游戏中不公平的随机数使用问题,玩家获得某些牌的机会较少。
小数截断
另一个风险问题是在骰子类游戏中发现的,它允许玩家选择特定的倍数来使他们的预期收益最大化。
漏洞#3?:代码实现和项目设计的不一致
ChatGPT?往往能够理解单一函数的实现,却无法理解这样写的根本原因。
例如,它可能了解某个函数在技术层面是怎样执行的,但他无法理解在整个智能合约中,该函数有着什么样的目的。
为了确保?ChatGPT?在编码中不出问题,它需要更好地理解智能合约的代码逻辑。
就目前的情况而言,ChatGPT?提供的是对代码的表面阅读。为了使其审计工作和水平更上一层楼,它必须学会从一个函数反向推导出其初始逻辑——这点非常重要。
不正确的输入验证
我们在?Plinko?合约中发现了一个输入验证问题,导致倍数设置不正确。
根据?ZKasino?的说法,Plinko?中使用的行数应该是?8?到?16?。但是,由于以下检查中的错误,Bankroll?合约所有者可以通过函数?setPlinkoMultipliers()设置一个超出预期范围的行数值。
代码显示,如果?numRows?和?risk?均不满足条件,该流程将被回滚。
但是,如果两个条件中只有一个不满足,那么检查仍然会通过,并且代码不会被回滚。
ChatGPT?在回答第二个问题时给出了不同的答案:该函数检查“numRows”的值是否在?8?到?16?之间,以及“risk”的值是不是小于?3?。如果不满足上述任一条件,函数将返回错误“InvalidNumberToSet”。
ChatGPT?似乎理解了这个函数的目的。然而,它并不具备相应的应用程序知识,在没有额外信息的情况下也无法识别真正的漏洞。
值更新的不一致
在?Slots?合约中,发现了与?totalValue?更新不一致相关的问题,这可能导致游戏过早结束。totalValue?用于监控用户的输赢,但它只跟踪了支付情况,却未从实际游戏中扣除,导致用户的损益计算错误。
写在最后
尽管经过了相应培训,但?ChatGPT?在其审计中还是遗漏了某些关键性的安全问题。这是由于人工智能在充分理解代码的复杂性和细微差别方面的局限性,以及其缺乏在现实场景中的实践经验。
正如其官网所述,ChatGPT?是一个依赖自然语言处理进行对话的研究版本。它通常无法像人类审计专家那样去理解代码背后的意图和逻辑推理。
因此,重要的是需要通过经验丰富的安全专家的手动审计来补充?ChatGPT?分析的不足之处,以确保全面的准确性。
下图强调了基于人工的服务以及?ChatGPT?在各种标准上的优势和劣势。
就像是我们使用百度翻译一样,英文翻译结果的准确性往往取决于我们的中文措辞——ChatGPT?回答的有效性在很大程度上取决于?prompt的格式。
在本文中,我们将?ZKasino?与?ChatGPT?交互的预审计结果和?CertiK?专家执行的最终审计结果进行了比较。
随着技术的进步和对?prompt?工程的更清晰的理解,工程师将能够更好地利用ChatGPT。
在?CertiK?官方公众号接下来发布的内容中,我们将会就如何向?ChatGPT?提出有效问题来与大家探讨?prompt?工程的更多深入性内容。
但是现在,ChatGPT?甚至已经可以帮助我们参加夺旗比赛了:欢迎大家点击阅读!
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。