SHA:区块链深度学习系列|什么是哈希?

Comunion是一个去中心化的(DAO)组织协作网络,提供面向数字时代的全新商业基础设施和价值转化机制,致力于让劳动价值像资本一样自由流通、交易和积累。

本系列内容包含:基本概念及原理、密码学、共识算法、钱包及节点原理、挖矿原理及实现。

发展史

哈希算法是为了检测数据在传输的过程当中是否被篡改而诞生的。

比如特工A和特工B在进行信息交换,为了防止数据在传输的过程中没有被丢失或者被篡改,这个时候可以使用哈希算法。

特工A将其所发的信息进行哈希,然后将信息和哈希码一起传给特工B,特工B收到之后,也可以对文本进行哈希,然后和这个哈希码进行匹配,如果匹配上的话,说明信息在传播的过程当中没有丢失或者被篡改。

最开始诞生的是MD4和MD5。1990年,工作于麻省理工学院的教授RonaldRivest设计了一种信息摘要算法,这就是MD4,次年MD5诞生。

教育部:构建数字认证体系,推动区块链学历认证和学分互认:教育部近日印发《关于加强新时代教育管理信息化工作的通知》,其中指出构建数字认证体系完善教育数字认证基础支撑体系总体规划,建立统一的教育系统密码基础设施和支撑平台。探索推动区块链技术在招生考试、学历认证、学分互认、求职就业等领域的应用,提高数字认证可信性。(教育部官网)[2021/3/31 19:32:17]

说到MD4,大家可能听说过,我们国家的王小云院士曾经将其攻破过,这是一个很重要的研究成果。普通破解MD4法,需要计算2的55次方,而王院士把时间复杂度给降低了,他只需要2的10次方~20方,就把MD4破解了,这就把破解所需的量级降低了很多。

沿着时间顺序后面诞生了SHA-0、SHA-1、SHA-2、SHA-3。

广州市政府:围绕区块链等核心技术塑造数字经济发展新优势:广州市政府印发《广州市坚决打赢新冠肺炎疫情防控阻击战 努力实现全年经济社会发展目标任务的若干措施》,出台48条举措,涵盖物资供给、企业复工复产、重点项目建设等领域。文件表示,围绕人工智能、大数据、区块链、云计算等数字经济核心技术,突破一批“卡脖子”关键技术,打造一批科学技术创新研究平台,提供一批创新应用场景,培育一批数字经济龙头企业,形成一批创新示范高地,塑造数字经济发展新优势。(上证报)[2020/3/3]

目前来说SHA是一个安全的哈希算法,按版本来说才到了SHA-3,其中每个版本相当于一个家族,里面会包含很多不同的哈希算法。

MD4出现之后,美国国家标准技术研究院,开始进行一个公开的算法募集。

1997年左右,SHA-0家族开始全球性征集算法,任何人有好的算法都可以提交。这其实是一个全球的算法竞争,其目的是收录全球公认能最好的算法,以此扩充家族。

动态 | MEDSiS与区块链公司Ternio达成合作 将在美国和欧洲推出Maxwell稳定币:美国一家身份管理和金融服务公司MEDSiS International已与区块链和支付公司Ternio结成联盟,将在美国和欧洲推出Maxwell稳定币。该合作计划在Maxwell锚定资产中增加第三和第四种货币——美元和欧元。这将完成该公司计划的第一阶段,即为其稳定币提供主要货币作为支持。(Verdict)[2019/8/26]

随着时间的推移,产生了SHA-2,我们之前所说比特币里面使用的算法SHA-256,就是隶属于SHA-2家族里面的算法。SHA-2家族里面包含众多算法,比如:SHA-168、SHA-512等,都有不同的尾缀。拿SHA-256来说,256是指算法输出的字符长度。

提到SHA-256,大家可能会想一下我们前文提到的问题:中本聪为什么选择用SHA-266,而不是其他的哈希算法呢?

动态 | 国内一家区块链追溯牛肉体验店落户上海:据搜狐网消息,近日,一家牛排体验店在上海浦东新区陆家嘴开业。这家店使用的食材从肉牛繁育、饲养到运输、屠宰加工、零售所有环节引入区块链技术,实现产品全程可追溯。[2018/12/25]

刚才我们也说过SHA家族的成长是按照时间顺序来的,当中本聪使用这个算法是在2008年,那个时候SHA-2家族里面的算法在当时是比较盛行的,虽然当时SHA-3也出来了,但是还不太成熟。

所以中本聪采用了SHA-2里面的SHA-256算法,应用到比特币系统里面去。

沿着时间顺序往下走,我们会看到以太坊里面使用的哈希算法,就不是SHA-2家族里面的了,而是SHA-3家族里面的。这是因为到2014年的时候,SHA-3里的算法已经稳定下来了,并且其性能远优于SHA-2里的算法。

版权商业生态环境将被区块链重塑:中国版权保护中心数字版权登记部主任张建东近日表示,“利用区块链技术可以可信记录版权内容生产、传播和消费的每一个环节,形成完整的版权证据链,并可公开查证,确保了版权内容在流通过程中权属的清晰可信。”[2018/4/19]

开发者采用的算法也是根据哈希算法的成熟度,来不断的去采用更成熟、更好的算法。

所以如果读者想设计一个区块链系统,如果里面涉及到使用哈希算法的话,那么一定要选择更好哈希算法,而不是一味模仿之前的系统,这些SHA算法仅仅是一个加密算法而已,没有我们想的那么神秘。

哈希函数

哈希函数最开始被称之为摘要函数,意思是消息摘要,下图是对它的定义:哈希函数是为了对于任意长的字符串产生一个消息摘要。

这段话其实有一些含义没有表达出来,对任意长的一个字符串进行哈希,可以产生一个哈希摘要,也就是产生一个由0和1组成的字符串。这个字符串如果给到SHA-256的话,那其产生的消息摘要会是一个256比特由0和1组成的数据串。

摘要函数是由一对ppt算法组成的,这两个算法需要满足两个性质。

ppt算法的意思是概率多项式时间算法,那么什么是概率多项式时间算法呢?

什么叫概率算法?

概率算法也叫随机算法,也就是算法在执行过程中随机地选择下一个计算步骤。其意义是,很大程度上降低算法的复杂度。

比如抛硬币,需要猜硬币是正面还是反面,那么解决这个问题的成功概率是50%,算法只需要重复正或者反就可以了。

什么是多项式?

假设我有一个问题,这个问题是有规模的,规模用参数λ来表示,再引入常数a和c,将其做成一个多项式:a乘以λ的C次方。其中λ是一个安全参数,如问题的规模,密码系统的安全级别,私钥长度等。

概率多项式时间算法组合起来通俗地说就是:当这个算法应用于某一项方案或者攻击一个密码系统,算法最多能运行a乘以λ的C次方的时间,在这个时间内能以多大的概率去解决这个问题或者攻破这个密码系统。

这样的设计使哈希算法非常高效。

需要满足的两个条件

上图第一句话,1λ是一个安全参数,即将安全参数输入到Gen算法中产生一个s。

我们上文讲了有很多哈希家族,每个哈希家族中又包含很多哈希算法,那么到底用哪个算法呢?这里的s就是表示选择的算法,比如选用了SHA-256,那么s就可以确定。

第二句话,最前面是一个自然数,后面的??x中x,指任意的字符串,这句话的意思是任意字符串可以任意长,并且用0和1来表示。

继续往下看,H上标s和x,由于第一句话的时候s确定了,那么此时H也就可以确定。

再往下走,对于任意两个消息m1和m2,如果这两个消息经过哈希函数产生的结果是一样的,那么此时就产生了一个碰撞。

我们通过简单分析哈希的定义,其实能发现一个特点:哈希算法能将任意长的输入数据压缩成固定长且短的数据。

例如SHA-256算法能够将任意长的一个字符串,哈希成一个256比特长的由0和1组成的数据串。

利用这个特点我们也就能返回去解释为什么在区块链当中会使用哈希算法。

下期预告:哈希碰撞原理

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

地球链

[0:15ms0-1:404ms