这才是一个区块该有的样子

前言
上周的分享中,最后我们讲到了比特币是如何生成的。我们现在知道这里有一个叫做挖矿的过程。这是一个通过比特币特定算法不断产生新的正确的Block并延续Block Chain的过程。我们都知道区块链之所以叫区块链,是因为它由一串区块组成。那么,一个区块,它又是由什么组成的呢?
今天,请跟随我的脚步,让我们一起来领略一番。

区块由两部分组成,分别是区块头(Header)和区块体(Body),而区块头又包括了父哈希(Hash Used,也就是迁移区块的哈希)、时间戳、难度、目标数(The Target)、随机数(The Nonce)、默克尔树(Merkle Root),区块体则包含了具体的交易数据和交易数量,其决定了区块头中的Merkle根。

这才是一个区块该有的样子

下面我们来看一个区块。根据Blockchain.info 提供的信息,第590357个区块长下面这样。

这才是一个区块该有的样子

我们可以看到,这个区块包含2680笔交易,时间戳为2019年8月16日7点2分15秒,由F2Pool进行记账。区块大小为1122.474kB,随机数nounce为3271780214,矿工得到了12.5BTC的奖励。右边一栏的前两行显示了这个区块的Hash值以及上一区块的Hash值,第三行要求下一个区块的Hash不得大于00000000000000000004d3e0a106e318df54c3c478dd48b70f7101b88827a81d,最后一行则显示了此区块交易记录的Merkle根。
到这里,区块链的结构已经有个基础模型了。
在区块头中,父哈希、时间戳都还比较容易理解,都是字面意思,可是难度、目标数、随机数以及默克尔树可能就需要适当解释一下了。
1、难度
中本聪设计比特币时,为了使得比特币出块时间能理想的恒定在 10 分钟左右, 从而加入了挖矿难度调整机制。比特币协议规定每隔 2016 个区块,将根据过去最近 2016 个区块出块总时间调整,自动调整下一个 2016 个区块的挖矿难度。理想情况下 2016 个块需要两周(2016*10s)时间,如果实际用时不到两周则增加难度,如果超过两周就降低难度。
那么,难度是如何计算出来的呢?我们看看计算公式
难度值(difficulty) = 最大目标值(maximum_target) / 最小目标值(current_target)
(target是256位的大数字)
2、目标数
目标值是指挖矿时,数学难题的哈希值的闽值。矿工只能通过在该目标值范围内求得正确的随机数以得到该区块的记账权及区块奖励。当全网算力提升时,该目标值就会根据难度调整而降低并增加求数学解的难度。
【算力】在通过「挖矿」得到比特币的过程中,一个节点每秒钟能做多少次计算,就是算力的代表。单位写成 hash/s, 简写为 h/s。1 h/s 表示 1 秒钟能做 1 次 hash 碰撞。挖矿的每秒算力是以 Ghash/s 或 Thash/s 为单位计,矿机的 GHash (或 THash)值越高,能挖到的 BTC 就越多。
1 Khash/s = 1000 hash/s
1 Mhash/s = 1000 Khash/s
1 Ghash/s = 1000 Mhash/s
1 Shash/s = 1000 Ghash/s
1 PHash/s = 1000 Shash/s
3、随机数
在挖矿中是一种用于挖掘加密货币的自动生成的、毫无意义的随机数,在解决数学难题的问题中被使用一次之后,如果不能解决该难题则该随机数就会被拒绝。而一个新的Nonce也会被测试出来并且直到问题解决,当问题解决时矿工就会得到加密货币作为奖励。
在区块结构中,Nonce 是基于工作量证明所设计的随机数字,通过难度调整来增加或减少其计算时间。
矿工或矿池在使用计算软件的(即矿机)情况下可以每秒产生数百万次的哈希计算,直到找到正确的哈希值。随机数是只能用一次的密码数字。
如果一个矿工产生一个大于目标数的哈希值,那么他们需要选择新的随机数,重新进行计算。新的随机数会得到新的散列。直到找到小于或等于目标数的哈希值。
4、默克尔树(Merkle Tree)
Merkle Tree,是 header 部分的哈希值,代表了区块 body 部分所有的交易。Merkle Tree的叶子是数据块的hash值。非叶节点是其对应子节点串联字符串的hash。
在第一次分享时,我们就讲到,通过哈希函数,任意长度的数据最后都会输出一段固定长度的字符。
1)Hash List
在P2P网络中作数据传输的时候,会同时从多个机器上下载数据,而且很多机器可以认为是不稳定或者不可信的。为了校验数据的完整性,更好的办法是把大的文件分割成小的数据块。这样的好处是,如果小块数据在传输过程中损坏了,那么只要重新下载这一快数据就行了,不用重新下载整个文件。
现在问题来了,怎么确定刚刚说的小数据块没有损坏呢?
答案就是为每个数据块做Hash。BT下载的时候,在下载到真正数据之前,我们会先下载一个Hash列表。
那么问题又来了,怎么确定这个Hash列表本身是正确的?
答案是把每个小块数据的Hash值拼到一起,然后对这个长字符串在作一次Hash运算,这样就得到Hash列表的根Hash(Top Hash or Root Hash)。下载数据的时候,首先从可信的数据源得到正确的根Hash,就可以用它来校验Hash列表了,然后通过校验后的Hash列表校验数据块。 

这才是一个区块该有的样子

所以刚刚的过程就是把很多很多小数据块做Hash,得到很多很多哈希值,我们再把这些哈希值拼在一起形成一个长字符串,再做一次Hash,得到了Hash列表的根Hash。
2)Merkle Tree
如果把Hash List当作只有一个树干的小树苗的话,Merkle Tree更像是已经长出了几个树干的大树。同样的,在最底层,和哈希列表一样,我们把数据分成小的数据块,有相应地哈希和它对应。但稍有不同的是,这些哈希不是直接拼成一个长字符串运算根哈希,而是相邻的两个哈希合并成一个字符串,然后运算这个字符串的哈希。

这才是一个区块该有的样子

比特币区块链系统中的采用的Merkle Tree,它的作用主要是快速归纳和校验区块数据的完整性,它会将区块链中的数据分组进行哈希运算,向上不断递归运算产生新的哈希节点,最终只剩下一个Merkle根存入区块头中.
在区块链系统使用Merkle Tree有诸多优点。
首先,极大地提高了区块链的运行效率和可扩展性,区块头只需包含根哈希值而不必封装所有底层数据;其次,Merkle树可支持“简化支付验证协议”(SPV),即在不运行完整区块链网络节点的情况下,也能够对交易数据进行检验。