详解常用哈希函数（Keccak算法）

Keccak算法简介
美国国家标准与技术研究院(National Institute of Standards and Technology，NIST)于2007年公开征集SHA-3，要求：
能够直接替代SHA-2，这要求SHA–3必须也能够产生224，256，384，512比特的哈希值。
保持SHA-2的在线处理能力，这要求SHA-33必须能处理小的数据块(如512或1024比特)。
安全性：能够抵抗原像和碰撞攻击的能力，能够抵抗已有的或潜在的对于SHA-2的攻击。
效率：可在各种硬件平台上的实现，且是高效的和存储节省的。
灵活性：可设置可选参数以提供安全性与效率折中的选择，便于并行计算等。
2008年10月，有64个算法正式向NIST提交了方案，经过初步评价，共有51个算法进入第一轮评估，主要对算法的安全性、消耗、和实现特点等进行分析。
2009年7月24日宣布，其中14个算法通过第一轮评审进入第二轮；2010年12月9日宣布，其中5个算法(JH、Grstl、Blake、Keccak和Skein)通过第二轮评审进入第三轮。
2012年10月2日NIST公布了最终的优胜者，它就是由意法半导体公司的Guido Bertoai Bertoai、Jean Daemen Daemen、Gilles Van Assche Assche与恩智半导体公司的Micha Michaëël Peeters 联合设计的Keccak算法。
SHA-3成为NIST的新哈希函数标准算法(FIPS PUB 180–5)，Keccak算法的分析与实现详见：https://keccak.team/index.html
SHA-3的结构仍属于Merkle提出的迭代型哈希函数结。最大的创新点是采用了一种被称为海绵结构的新的迭代结构.。海绵结构又称为海绵函数。
在海绵函数中，输入数据被分为固定长度的数据分组。每个分组逐次作为迭代的输入，同时上轮迭代的输出也反馈至下轮的迭代中，最终产生输出哈希值。
海绵函数允许输入长度和输出长度都可变，具有灵活的性，能够用于设计哈希函数(固定输出长度)、伪随机数发生器，以及其他密码函数。
Keccak算法描述
其输入数据没有长度限制，输出哈希值的比特长度分为：224，256，384，512。
符号与函数
Keccak算法使用以下符号与函数：
符号
r：比特率(比特 rate)，其值为每个输入块的长度
c：容量(capacity)，其长度为输出长度的两倍

b：向量的长度，b=r+c，而b的值依赖于指数I，即b=25×2I

· 函数
Keccak算法用到了以下5个函数：θ(theta)、ρ(rho)、π(pi)、χ(chi)、ι(iota)
算法描述
Keccak算法对数据进行填充，然后迭代压缩生成哈希值。
· 填充
对数据填充的目的是使填充后的数据长度为r的整数倍.因为迭代压缩是对r位数据块进行的，如果数据的长度不是r的整数倍，最后一块数据将是短块，这将无法处理。
设消息m长度为l比特。首先将比特“1”添加到m的末尾，再添加k个“0”，其中，k是满足下式的最小非负整数：l+1+k=r-1modr；
然后再添加比特“1”添加到末尾. 填充后的消息m的比特长度一定为r的倍数。
以算法Keccak-256，信息“abc”为例显示补位的过程. a, b, c对应的ASCII码分别是97, 98, 99；于是原始信息的二进制编码为：01100001 01100010 01100011。此时r = 1088。
① 补一个“1” ：0110000101100010 01100011 1
② 补1062个“0”：
01100001 01100010 01100011 10000000 00000000 … 00000000
③ 补一个“1” ，得到1088比特的数据：
· 整体描述
Keccak算法采用海绵结构(Sponge Construction)，在预处理(padding并分成大小相同的块)后，海绵结构主要分成两部分：
吸入阶段(Absorbing Phase)：将块xi传入算法并处理。
挤出阶段(Squeezing Phase)：产生一个固定长度的输出。
Keccak算法的整体结构如下图：

· 吸入与挤出阶段

· 压缩函数

安全性与性能
安全性
可以抵御对哈希函数的所有现有攻击。
到目前为止，没有发现它有严重的安全弱点。
灵活性
可选参数配置，能够适应哈希函数的各种应用。
高效性
设计简单，软硬件实现方便.在效率方面，它是高效的。
尚未广泛应用，需要经过实践检验。
常用的Keccak算法就讲到这里啦，下节课我们将学习常用哈希函数SM3算法，敬请期待！