比特币钱包技术概述与细节

“钱包”一词在比特币中有多重含义。 广义上,钱包是一个应用程序,为用户提供交互界面。 钱包控制用户访问权限,管理密钥和地址,跟踪余额以及创建和签名交易。 狭义上,即从程序员的角度来看,“钱包”是指用于存储和管理用户密钥的数据结构。 我们将深入介绍第二层含义,本章中钱包是私钥的容器,一般是通过结构化文件或简单数据库来实现。
1. 钱包技术概述
在本节中,我们总结了各种技术,它们为用户构建起友好,安全和灵活的比特币钱包。
一个常见误解是,比特币钱包里含有比特币。 事实上,钱包里只含有钥匙。 “钱币”被记录在比特币网络的区块链中。 用户通过钱包中的密钥签名交易,从而来控制网络上的钱币。 在某种意义上,比特币钱包是密钥链。
提示比特币钱包只含有密钥,而不是钱币。 每个用户有一个包含多个密钥的钱包。 钱包只包含私钥/公钥对的密钥链(请参阅[私钥章节])。 用户用密钥签名交易,从而证明他们拥有交易输出(他们的钱币)。 钱币以交易输出的形式存储在区块链中(通常记为vout或txout)。
有两种主要类型的钱包,区别在于它们包含的多个密钥是否相互关联。
第一种类型是非确定性钱包(nondeterministic wallet),其中每个密钥都是从随机数独立生成的。密钥彼此无关。这种钱包也被称为“Just a Bunch Of Keys(一堆密钥)”,简称JBOK钱包。
第二种类型是确定性钱包(deterministic wallet),其中所有的密钥都是从一个主密钥派生出来,这个主密钥即为种子(seed)。该类型钱包中所有密钥都相互关联,如果有原始种子,则可以再次生成全部密钥。确定性钱包中使用了许多不同的密钥推导方法。最常用的推导方法是使用树状结构,称为分级确定性钱包或HD钱包。
确定性钱包由种子衍生创造。为了便于使用,种子被编码为英文单词,也称为助记词。
接下来的几节将深入介绍这些技术。
1.1 非确定性(随机)钱包
在最早的一批比特币客户端中( Bitcoin Core,现在称作比特币核心客户端),钱包只是随机生成的私钥集合。这种类型的钱包被称作零型非确定钱包。举个例子,比 特币核心客户端预先生成100个随机私钥,从最开始就生成足够多的私钥并且每个密钥只使用一次。这种钱包现在正在被确定性钱包替换,因为它们难以管理、 备份以及导入。随机密钥的缺点就是如果你生成很多私钥,你必须保存它们所有的副本。这就意味着这个钱包必须被经常性 地备份。每一个密钥都必须备份,否则一旦钱包不可访问时,钱包所控制的资金就付之东流。这种情况直接与避免地址重复使用的原则相冲突——每个比特币地址只能用一次交易。地址重复使用将多个交易和地址关联在一起,这会减少隐私。当你想避免重复使用地址时,零型非确定性钱包并不是好的选择,因为你要创造过多的私钥并且要保存它们。虽然比特币核心客户端包含零型钱包,但比特币的核心开发者并不鼓励大家使用。

图1展示的是一个非确定性钱包,其含有的随机密钥是个松散的集合。

比特币钱包技术概述与细节

提示除了简单的测试之外,不要使用非确定性钱包。 它们对于备份和使用来说太麻烦了。 相反,推荐使用基于行业标准的HD钱包,可以用种子助记词进行备份。
1.2 确定性(种子)钱包
确定性,或者“种子”钱包包含通过使用单项离散函数而可从公共的种子生成的私钥。种子是随机生成的数字。这个数字也含有比如索引号码或者可生成私钥的“链码”(参见“ 分层确定性钱包(BIP0032/BIP0044)”一节)。在确定性钱包中,种子足够恢复所有的已经产生的私钥,所以只用在初始创建时的一个简单备份就足以搞定。并且种子也足够让钱包导入或者导出。这就很容易允许使用者的私钥在钱包之间轻松转移。
图2展示了确定性钱包的逻辑图。

比特币钱包技术概述与细节

1.3 分层确定性钱包(HD Wallets (BIP-32/BIP-44))
确定性钱包被开发成更容易从单个“种子”中生成许多密钥。确定性钱包的最高级形式是通过BIP0032标准定义的HD钱包。HD钱包包含以树状结构衍生的密钥,使得父密钥可以衍生一系列子密钥,每个子密钥又可以衍生出一系列孙密钥,以此类推,无限衍生。图3展示了树状结构。

比特币钱包技术概述与细节

相比较随机(不确定性)密钥,HD钱包有两个主要的优势。第一,树状结构可以被用来表达额外的组织含义。比如当一个特定分支的子密钥被用来接收交易收入并且有另一个分支的子密钥用来负责支付花费。不同分支的密钥都可以被用在企业环境中,这就可以支配不同的分支部门、子公司、具体功能以及会计类别。
HD钱包的第二个好处就是它可以允许让使用者去建立一个公共密钥的序列而不需要访问相对应的私钥。这可允许HD钱包在不安全的服务器中使用或者在每笔交易中发行不同的公共钥匙。公共钥匙不需要被预先加载或者提前衍生,而在服务器中不需要可用来支付的私钥。
1.4种子和助记词(BIP-39)
HD钱包具有管理多个密钥和地址的强大机制。由一系列英文单词生成种子是个标准化的方法,这样易于在钱包中转移、导出和导入,如果HD钱包与这种方法相结合,将会更加有用。 这些英文单词被称为助记词,标准由BIP-39定义。 今天,大多数比特币钱包(以及其他加密货币的钱包)使用此标准,并可以使用可互操作的助记词导入和导出种子进行备份和恢复。
让我们从实际的角度来看以下哪种种子更容易抄录、阅读、导出以及导入。
16进制表示的种子: 0C1E24E5917779D297E14D45F14E1A1A
助记词表示的种子:
army van defense carry jealous true garbage claim echo media make crunch
1.5钱包最佳实践
由于比特币钱包技术已经成熟,出现了一些常见的行业标准,使得比特币钱包具备广泛互操作,易于使用,安全和灵活的特性。这些常用的标准是:
助记码,基于BIP-39
HD钱包,基于BIP-32
多用途HD钱包结构,基于BIP-43
多币种和多帐户钱包,基于BIP-44
这些标准可能会随着发展而改变或过时,但是现在它们形成了一套互锁技术,这些技术已成为比特币的事实上的钱包标准。
这些标准已被广泛的软件和硬件比特币钱包采用,使所有这些钱包互操作。用户可以导出在其中一个钱包上生成的助记符,并将其导入另一个钱包,实现恢复所有交易,密钥和地址。
列举支持这些标准的软件钱包,包括(按字母顺序排列)Breadwallet,Copay,Multibit HD和Mycelium。列举支持这些标准的硬件钱包,包括(按字母顺序排列)Keepkey,Ledger和Trezor。
以下部分将详细介绍这些技术。
提示如果您正准备开发一个比特币钱包,那么它应该被构建为一个HD钱包,一个种子被编码为助记词代码进行备份,遵循BIP-32,BIP-39,BIP-43和BIP-44标准,下面章节有所涉猎。
1.6使用比特币钱包
在[用户故事]中,我们介绍了Gabriel,里约热内卢是一个有进取心的少年,他正在经营一家简单的网络商店,销售比特币品牌的T恤,咖啡杯和贴纸。
Gabriel使用Trezor比特币硬件钱包(Trezor设备:硬件HD钱包)来安全地管理他的比特币。 Trezor是一个简单的USB设备,具有两个按钮,用于存储密钥(以HD钱包的形式)和签署交易。 Trezor钱包遵循本章讨论的所有行业标准,因此Gabriel不依赖于任何专有技术或单一供应商解决方案。

比特币钱包技术概述与细节

当Gabriel首次使用Trezor时,设备从内置的硬件随机数生成器生成助记词和种子。 在这个初始化阶段,钱包在屏幕上按顺序逐个显示单词。

比特币钱包技术概述与细节

通过写下这个助记符,Gabriel创建了一个备份(参见表1),可以在Trezor设备丢失或损坏的情况下用于恢复。 在新的Trezor钱包,或者任一种兼容的软件和硬件钱包中,助记词都可以用于恢复。 请注意,单词序列很重要,因此,记忆纸备份需要对每个单词都有空格。Gabriel必须仔细记录每个单词的编号,以保持正确的顺序。 表1Gabriel的助记器备份

比特币钱包技术概述与细节

提示为了简单起见,Gabriel的助记词记录中显示了一个12个词。 事实上,大多数硬件钱包生成更安全的24个词的助记符。 助记词以完全相同的方式使用,不管长度如何。
作为网店的第一次实践,Gabriel使用他的Trezor设备生成一个比特币地址。 所有客户的订单都使用此单一地址。 我们将看到,这种方法有一些缺点,不过可以使用HD钱包进行改进。
2. 钱包技术细节
现在我们来深入了解被众多比特币钱包所使用的重要的行业标准。
2.1助记码词汇(BIP-39)
助记码词汇是英文单词序列代表(编码)用作种子对应所确定性钱包的随机数。单词的序列足以重新创建种子,并且从 种子那里重新创造钱包以及所有私钥。在首次创建钱包时,带有助记码的,运行确定性钱包的钱包的应用程序将会向使用者展示一个12至24个词的顺序。单词的顺序就是钱包的备份。它也可以被用来恢复以及重新创造应用程序相同或者兼容的钱包的密钥。助记码词汇可以让使用者复制钱包更容易一些,因为相比较随机数字顺序来说,它们更容易地被阅读和正确抄写。
提示助记词经常与“脑钱包”混淆。 他们不一样。主要区别在于脑钱包由用户选择的单词组成,而助记符是由钱包随机创建的,并呈现给用户。 这个重要的区别使助记词更加安全,因为人类猜测随机数还是无能为力。
助记码被定义在比特币的改进建议39中。需要注意的是,BIP-39是助记码标准的一个实施方案。还有一个不同的标准,使用一组不同的单词,是由Electrum钱包使用,并且早于BIP-39。 BIP-39由Trezor硬件钱包背后的公司提出,与Electrum的实施不兼容。 然而,BIP-39现在已经在数十个可互操作的实践案例中获得了广泛的行业支持,应被视为事实上的行业标准。
BIP-39定义了助记符码和种子的创建,我们在这里描述了九个步骤。 为了清楚起见,该过程分为两部分:
1-6步是创建助记词,7-9步是从助记词到种子。

2.2创建助记词
助记词是由钱包使用BIP-39中定义的标准化过程自动生成的。 钱包从熵源开始,增加校验和,然后将熵映射到单词列表:
1、创建一个128到256位的随机序列(熵)。
2、提出SHA256哈希前几位(熵长/ 32),就可以创造一个随机序列的校验和。
3、将校验和添加到随机序列的末尾。
4、将序列划分为包含11位的不同部分。
5、将每个包含11位部分的值与一个已经预先定义2048个单词的字典做对应。
6、生成的有顺序的单词组就是助记码。
图6展示了熵如何生成助记词。

比特币钱包技术概述与细节

表2表示了熵数据的大小和助记词的长度之间的关系。

比特币钱包技术概述与细节

2.3从助记词生成种子
助记词表示长度为128至256位的熵。 通过使用密钥延伸函数PBKDF2,熵被用于导出较长的(512位)种子。将所得的种子用于构建确定性钱包并得到其密钥。
密钥延伸函数有两个参数:助记词和盐。其中盐的目的是增加构建能够进行暴力攻击的查找表的困难度。 在BIP-39标准中,盐具有另一目的,它允许引入密码短语(passphrase),作为保护种子的附加安全因素,我们将在BIP-39可选密码短语章节详细地描述。
创建助记词之后的7-9步是:
7、PBKDF2密钥延伸函数的第一个参数是从步骤6生成的助记符。
8、PBKDF2密钥延伸函数的第二个参数是盐。 由字符串常数“助记词”与可选的用户提供的密码字符串连接组成。
9、PBKDF2使用HMAC-SHA512算法,使用2048次哈希来延伸助记符和盐参数,产生一个512位的值作为其最终输出。 这个512位的值就是种子。
图5-7显示了从助记词如何生成种子 

比特币钱包技术概述与细节

提示 密钥延伸函数,使用2048次哈希是一种非常有效的保护,可以防止对助记词或密码短语的暴力攻击。 它使得攻击尝试非常昂贵(从计算的角度),需要尝试超过几千个密码和助记符组合,而这样可能产生的种子的数量是巨大的(2^512)。
表3、4和表5展示了一些助记码的例子和它所生成的种子。

比特币钱包技术概述与细节

2.4 BIP-39中的可选密码短语
BIP-39标准允许在推导种子时使用可选的密码短语。 如果没有使用密码短语,助记词是用由常量字符串“助记词”构成的盐进行延伸,从任何给定的助记词产生一个特定的512位种子。 如果使用密码短语,密钥延伸函数使用同样的助记词也会产生不同的种子。事实上,给予一个单一的助记词,每一个可能的密码短语都会导致不同的种子。 基本上没有“错误”的密码短语, 所有密码短语都是有效的,它们都会导致不同的种子,形成一大批可能未初始化的钱包。这批钱包非常之大(2^512),使用暴力破解或随机猜测基本不可能。
提示BIP-39中没有“错误的”密码短语。 每个密码都会导致一些钱包,只是未使用的钱包是空的。
可选密码短语带来两个重要功能:
(存储在大脑中的)密码短语成为第二个因素,使得助记词不能单独使用,避免了助记词备份盗取后被利用。 起到掩人耳目的效果,把密码短语指向有小额资金的钱包,分散攻击者注意力,使其不在关注拥有大额资金的“真实”钱包。
然而,需要注意的是,使用密码短语也会引起丢失的风险:
如果钱包所有者无行为能力或死亡,没有人知道密码,种子是无用的,所有存储在钱包中的资金都将永远丢失。相反,如果所有者将密码短语与种子备份在相同的地方,则违反了上述第二个因素的目的。虽然密码是非常有用的,但它们只能与仔细计划的备份和恢复流程结合使用,考虑到所有者个人风险的可能性,应该允许其家人恢复加密资产。
2.5使用助记符代码
BIP-39被做成函数库,支持多种编程语言:python-mnemonic
SatoshiLabs团队在Python中提出了BIP-39标准的参考实现
bitcoinjs/bip39
作为流行的bitcoinJS框架的一部分,在JavaScript中实现了BIP-39
libbitcoin/mnemonic
作为流行的Libbitcoin框架的一部分,在C ++中实现了BIP-39
还有一个BIP-39生成器在独立的网页中实现,对于测试和实验非常有用。图5-8展示一个独立的网页,可以生成助记词、种子和扩展私钥。

比特币钱包技术概述与细节

BIP-39生成器可以离线使用,也可以使用这个在线地址.地址转向到这儿了【还得科学上网。译者注】