区块链与数据/数据库/大数据的结合与应用

11月22号20:00,BlockMania  AMA直播第32期继续进行,本期主题为本期主题为「区块链/数据库/数据/大数据」,分享嘉宾为Intellishare CEO 、加州州立大学计算机硕士熊羽睿,他与社区成员共同探讨了关于区块链与大数据的相关问题。
以下为AMA全程回顾
一些人认为区块链就是分布式数据库,您认为区块链与分布式数据库之间有区别吗?
很多人将区块链理解为分布式数据库,其实是存在偏差的。区块链在我看来是一个分布式账本,它与分布式数据库的出发点是不同的。区块链主要是做交易的记录、数据的确权等等,而不是大规模数据的存储。分布式数据库之所以叫「数据库」,它提供的是数据存储的服务。因此,这两者解决的是两个不同的事情。
区块链要解决的是信任问题,因为人与人之间很难解决信任问题,所以它会假设每一个人,每一个节点都是可以作恶的。在整个基础上,形成制约和共识体系。区块链强调「去中心化」,实际上就是去掉对人的一个信任,改为相信机器。借用李笑来老师的一句话:「区块链就是达成机器与机器之间的共识」。而分布式数据库是通过多点架设,优化服务,提供冗余等等,提供更快地调取架构的设置,通过这种技术可以提高业务的吞吐量和数据的存储量。
此外,区块链与分布式数据库在存储技术上所采取的方式也不同。区块链是一个链式结构,它把一个一个区块连接起来,用哈希值不停地对前面一个账本进行认同。它形成的是一个账本结构,而非数据库,所以它没有办法把全部的数据存储起来。因此说,它与分布式数据库的技术方式是不一样的。
中心化数据库目前存在哪些问题或痛点?区块链能解决哪些问题,不能解决哪些问题?
中心化数据库最大的问题是它的数据不公开,所以一旦有人盗窃数据的话,普通人无法监管,也无能为力。而且目前关于数据库泄露的问题数不胜数。例如美国Facebook就出现过数据泄露的问题。所以这是中心化数据库最大的一个弊端,而这个问题,区块链可以提供一个解决方案。此外,中心化数据库的另一个问题就是有些企业或者中心化的机构可以利用你的数据去赚你的钱。他们通过采集你的个人信息,你的消费习惯,然后实现商业目的,进而赚到你的钱。
而相比于中心化的数据库,区块链可以将面部识别信息、身份证、相关资料变成一串哈希值。通过做一次确认,你的个人信息和敏感信息都可以全部隐藏,此后你走到任何一个地方,不需要再出示身份证去证明你是你。因为只需要去国家区块链数据库中心里调取,就可以验证身份了。对方不需要知道你的姓名、年龄、住址、身份证号等等,他只通过数据返回一个脱敏信息,证明你是真实存在的。所以这对个人隐私而言,起到了极大的保护。目前我们国家我知道有两支团队在专门负责这件事,并朝着这个方向去努力。
然而,在这个过程中,区块链也有无法解决的东西。因为共识体系相较于中心化而言,它的效率会相对差一点。区块链不适合去解决高并发、高容量的事情。例如今年双十一的淘宝。
我们很难想象这样一个双十一的狂欢可以在以太坊的链上或者说是任何一个公链上去完成。但是呢,这本身也不是区块链的特长。有很多朋友和我说区块链「颠覆」了世界。其实任何一个技术,都不应该用「颠覆」一词,它是一个逐渐改变的过程,而我个人认为,在很长一段时间内,在中心化与去中心化的两极中间,有各种各样的应用、落地项目在中间游离,处于「灰色地带」。大部分的项目或多或少都有点去中心化或者去中心化,一切都只是强和弱的差别。其实,无论是去中心化还是中心化,最重要的是这个东西能服务于人类,帮助人类解决问题,而并非作为一个抽象概念去说事。
此外,区块链还存在一个「不可能三角」的问题。它在「Scalability 延展性、Decentralization 去中心化、Security 安全性」三方面很难100%的都做好,它只能侧重两样。所以我觉得是在选择一个技术或者是在做一个项目落地的时候,我们首先要考虑项目本身的逻辑,再去考虑它有什么技术。而不是说用区块链技术能去解决什么,因为这是不符合逻辑的。
这就是我对中心化数据库和区块链的理解。
您认为区块链在数据流通领域有哪些应用呢?
谈到应用,我还想提提关于纯粹公链的项目。我们基本认为公链时代已经结束了,因为公链的发展可以分为四个阶段,第一个是信仰阶段,而第二个是公链阶段。其实今年很多人还在炒作公链,但是我们认为去年公链时代基本就定型了,而接下来拼的应该是应用。
如何在区块链的基础上搭建「杀手级」的应用,其实是现在大家应该需要考虑的。虽然现在很多应用已经开始尝试了,但是真正「杀手级」的应用我还没有看到。所以在区块链领域,尤其是在纯区块链领域(我自己有意强行划分了一下),因为还没出现「杀手级」的应用,所以就谈不上数据的流通。而我个人认为真正的数据流通应该是在第四个阶段,大概是在2~3年之后。真正的数据积累只有人们大规模的对这个圈子有深刻理解的基础上,那时候大家拼的就不是应用了。以前,别人更关注你的共识体系,现在很少有人去关注了。现在更多的是去关注Token经济模型的设计。
当这种形态出现后,我们看到政府开始大力支持,企业开始加大投资,但是真正地如何去落地,形成杀手级的应用,还有一段路要走。
一定要说数据应用的话,我个人认为现在纯粹的区块链在数据流动的应用,更多的还是用于私有链或者联盟链的结构上。
可能用在什么方面呢?这个话题太广泛了。它可以用于个人的数据交互上,可以用在票据的数据交互,农业溯源的数据交互,医疗领域的数据交互等等。
为什么我会觉得最快形成数据流通不是在公链项目上,而是在联盟链和私链结构上,也是有原因的,你比方说如果腾讯或者阿里巴巴这样的大型企业用联盟链的方式迅速地进入到数据流通领域中,它会比公链的数据领域流通要快的多,而且可能还更具有实际的意义。
但是当联盟链或者私链在数据流通领域发展,对于个人是否有帮助,这个问题我还没有想明白。
目前区块链和大数据都处于技术创新的前沿领域,您认为两种技术之间是否可以相互结合和促进?
我在网上见过一句话,虽然不是完全准确,但是是一个还算合理的解释,他认为大数据是一种生产资料,AI(人工智能)是一种生产力,而区块链是一种生产关系。区块链解决的是生产关系的问题。
大数据只是一个数据,对于大数据的处理才是技术创新前沿领域,没有大数据,人工智能是完不成的。因为只有不断地更新大数据,不断地去优化算法,不断地自我更新和学习,才可以得出比较正确的结论。但是呢,数据产生的越多,人工智能越发达,对我们个人而言有可能是一种伤害。
每个人所产生的数据,例如每天的生活轨迹,去过哪里,买过什么东西,花了多少钱,看了什么东西……这些数据都会被收集起来,用于人工智能分析,然后极有可能被用于商业目的。
所以这是件蛮可怕的事情,只需通过你的数据,就可以将你的个人画像描绘出来。所以在我看来,人工智能越发达,对个人其实是一种伤害。生产力不在个人手中,生产资料也不在个人手中,而生产关系还未建立,所以个人极有可能是个被剥削的角色。
但是非常幸运的是,「哪里有压迫,哪里就有反抗」。区块链之所以出现,就是为了解决数据确权的问题,而没有数据确权,就不存在所谓的数字资产。
所以区块链与大数据的结合可以称为「天作之合」,数据产生的源头能确权,每个人产生的数据是属于自己的。人工智能需要分析数据,也需要通过个人购买数据。所以区块链是为个人在服务,它去掉对人的信任感。在数学里面我们可以信靠,即 「In math we trust」,通过数学,通过机器的模型,抛开人为的因素。这就是区块链未来最大的一个用处,对个人隐私的保护,这才是有意义的。
在这之上的大数据的处理和人工智能,才可以为人所用,为个人服务。而不仅仅只是对某些中心化的机构服务,这才会使得个人感觉到安心。
您认为目前,区块链最可行的落地应用场景有哪些?
区块链最可行的落地应用场景蛮多的,可以分两个层次来说。一个就是公链的项目,一个是联盟链和私链的结构。近期区块链获得国家的战略支持,实际上是希望区块链更好地为实体服务,为实体赋能。利用区块链的去中心化特点,让企业与市场更好地连接,例如产品溯源、管理透明化、数据不可篡改等等。这些,正是老百姓能实实在在看到的。
在过去人们使用马车,而后来有了蒸汽机车。现在有两种办法,一是为蒸汽机车打造一个全新的道路系统,但是代价会很大。一是现有的马车系统非常成熟了,能否将蒸汽机车的一部分用在马车上,让马车效率提高。这是两种不同的思维,两种方法没有谁对谁错。
应用场景是从区块链的Token经济模型去看的。很多人不理解「Token」,Token的中文是通证,它不是币。比特币是「Bitcoin」,所以它是Coin,不是Token。它是一个为了支付功能而生,点对点支付的伟大实践。
Token是从以太坊开始形成的,而且它具有多重属性。它可以做各种各样的行为,特别是组织的行为,而区块链是用来记录和锁定你的整个行为。Token具有流通的功能、管理的功能、监督的功能、溯源、证券化等等。这就意味着Token最明显的特性,即不可篡改性、时效性、可溯源性都被称为金融属性。
所以区块链中一个非常可行的落地场景是用在供应链金融上。目前的供应链金融可以很好地解决信任传递的问题,也解决了普惠金融的问题。例如大型企业存在的票据贴现的现实问题可以很好地被解决。
溯源类的应用也有很多。但是区块链无法证明溯源的产品在上链之前的真假问题,所以还是需要依靠权威机构做认证和背书,之后再上链。这是一个典型的中心化和去中心化相结合的过程。很多产品,例如农产品、玉石的追溯等等,都有很多人利用区块链来做尝试。
此外,我们现在看的比较多的一个落地场景就是电子票据。例如在深圳,搭乘出租车,电子票据全部都上链,你可以通过自主查询打印发票,这是一个非常实用的落地场景。
此外还有一个可以落地的场景就是Mesh 网络,Mesh网络的一个落地场景最直接了当的就是提供网络。Mesh网络是一个自延展网络,与DAO组织有点相似,通过自组网络可以慢慢地合并成一个大的网络,然后慢慢去扩展。理论上可以形成一个平行网。
很多人对于Mesh网络寄予厚望。因为它不仅是一个在通讯协议的硬概念,还是组织结构上的一个软概念。区块链DAO组织形态可以对比Mesh网络的形态,通过一个个组织结构,慢慢地去扩展延展。
凯文凯利就提到过Mesh网络将是未来世界的一个组成部分,V神也曾经在2017和2018年提到过「Mesh网络是黑科技」,是最快能使用Token支付的落地应用。虽然现在我们离落地的目标还有一段距离,但是我们一直是朝这个方向努力的。
其他的落地应用场景,例如链商、货运等等。但是目前最能解决当下社会痛点的还是供应链金融。
Q&A
Q1:区块链的存储功能有限,其冗余特性限制了数据的储存。这是否意味着上链的数据需要筛选,如何将大数据应用于上呢?
这个问题的关键是什么样数据才能上链,以及如何上链。由于区块链的链式结构不能记录大量的数据,对于常规的大量数据是无法全部上链的,否则数据会十分臃肿,且改动也会很麻烦。区块链最核心的作用是对数据库里的数据进行确权,而不是简简单单的将数据库里的数据上链。简单地说,区块链是对数据库里产生的哈希值和账本进行简单的备份。
Q2:阿里腾讯形成联盟链可以更有效地解决业务问题,降低成本。但是对于个人而言,数据上链对个人的好处还没有体现,我个人觉得是因为数据的所有者不属于个人,您怎么看呢?
联盟链确实是更高效、更快捷,所以我个人觉得他们相对于公链结构,更适合解决供应链金融的问题。但是公链结构由于更多人参与,它对解决普惠金融的问题更加有利。如果有一条公链能很好地解决这个问题,我会觉得非常有吸引力。
针对数据属于大型企业还是个人用户,我觉得在联盟链里不存在这个问题,因为节点的所有权不是属于个人的。
Q3:针对供应链的升级,即使技术方案提供者给出降低成本的方案,面对现有的供应链中包含的不透明的利益,如何将该方案在整个行业内推广,如何去分这个蛋糕呢?
供应链金融在现阶段还是由大型的金融机构来把控。针对传统机构的逐次改革,我们不能指望它一蹴而就。尤其是普惠金融,实现点对点的金融价值传递是不可能一蹴而就的。但是现阶段,信用是可以传递的,过去大型的采购方是无法把信用传递到小商户或提供方。所以理想肯定是在公链上彻底形成普惠金融,但是还有很长一段路需要走。