这篇我们要先介绍比特币使用到的密码学技术:Hash(哈希)。hash是什么,有点类似「洗牌」把牌洗乱的概念,只是洗的不是牌,而是一笔数据,这个「洗」的过程是经过严谨定义的,且产生的结果会是固定长度的。常见的hash算法有MD5、RIPEMD-160、SHA1、SHA256等,不同hash算法「洗」的过程都不同,产生出来hash值长度也不同,像是MD5不管喂进去的数据多大,最终都会产生128 bits的结果,而SHA256产生的hash值则会是256 bits。一个好的hash算法通常需要具备以下这些特性:
1.输入任意长度的数据,产生的hash值是固定长度的
2.取得hash值的计算过程是快速的
3.输入的数据有任何一点改变,产生的hash值会有很大的差异
4.具有单向性,可轻易输入数据取得hash值,但无法从hash值得知原始数据的内容
hash可以拿来做什么呢?假如今天阿牛在下班前打了一份500页的重要文件,因为文件很重要不能带离公司,那隔天他上班时如何得知是否有人趁晚上潜入公司偷改他的文件,有一个很简单的作法,就是取得整份文件的hash值,比如说用SHA256取得一个256bits的hash值,然后记在纸上或其他地方,隔天到公司时,只要对这份文件取得hash值,然后跟昨天下班前得到那个256bits的hash值比对,如果两者有差异,表示有人偷改这份文件,阿牛就要再仔细检查这份文件,如果两者一样,表示文件没有被修改过,阿牛可以安心的继续编辑他的文件。
再回来看为什么一个好的hash值需要上述的四点呢?
1.固定长度:因为结果是固定长度的,阿牛可以知道要准备多大张的纸来抄,而不会有时长有时短,也不方便比对。若是程序来说,设计者可以事先规划多大的空间放置hash值,不用担心Overflow的问题
2.快速得到结果:虽然输入的数据越大,计算hash的时间会相对增加,不过整体的过程还是不需要太复杂的计算,因此即便阿牛的文件是500页,也可以快速的得到hash值
3.任何改变产生的结果都截然不同:阿牛的整份500页文件即便有人多加了一个空格,隔天阿牛也可以明显的知道hash值不一样了,而第三个特性还有一个重要的原因,就是不能让原始数据与hash值可以看出什么关联性,因此即便是原始数据有任何一点改变,结果都是截然不同的
4.具有单向性:假如今天阿牛不小心将纸条掉落在电梯里,被其他人捡走也不会担心重要文件的信息会外流,因为无法从hash值回推原始数据的内容
hash应用非常广泛,比如说网站登入时会先将密码转成hash值,若有人撷取到信息,密码也不会外流。有些软件也会提供hash值,使用者下载后可以将档案hash比对,就能知道下载的软件是否有被窜改。而数位签章也是使用hash来减少需要加密的数据。不过有些hash算法像是MD5、SHA1已经不建议使用了。
那么hash值与比特币有什么关系呢?比特币所谓的「挖矿」,其实就是不断的计算hash
直到找到合法的hash值,这个合法的hash值就是我们上一篇说的「幸运草」。我们在第一篇文章里说到区块链的特性之一「难以窜改」就是利用hash值一笔一笔串接下去产生「链」的概念,其中任何数据被窜改,会让原本合法的hash值变成不合法,导致「链」断掉下一篇我们就来讲比特币的「区块」有哪些数据,「挖矿」是怎么计算hash值的,并将「区块」连成「区块链」。