专访富数科技卞阳:隐私计算的探索者

会议纪要

时间:2021年7月5日(周一)晚上8:30

主持人:所长助理、国盛区块链研究院 宋嘉吉

主讲嘉宾:上海市多方安全计算技术创新中心主任、富数科技副总 卞阳(卞总)

会议内容

周末滴滴事件发酵,周一运满满、货车帮等再行安全检查,数据安全重要性凸显。国内在保护数据隐私的前提下,如何完善数据要素市场建设将成为下一个风口,隐私计算有望成为“标配”!国盛区块链研究院携手行业内代表性企业富数科技,第一时间为您深入解读隐私计算的发展现状与市场前景,共同畅想未来隐私计算大规模商用将对数据行业和社会产生的深远影响。

会议纪要

宋嘉吉:滴滴事件之后,今天早上有其他几个交通类的APP也同样出现了审查,那么这一块其实未来对数据隐私安全这一块的关注度有明显有一个提高。其实我们从去年的上半年就开始提起了这个话题,因为在科技圈其实关于隐私计算数据安全这方面的话题已经兴起了一段时间了,那么当时主要解决的问题是在整个大数据的这种需求的背景下,要解决运用数据跟保护隐私这个矛盾点。

因为过去一段时间大家虽然知道有大数据这个东西,但在使用数据的时候,通常会伴随着数据隐私的一个泄露。所以为了解决这个问题,隐私计算应运而生,到了今年因为数据安全法,包括网安法,那么这些立法上的保证,其实对这一块又有推进了一个政策层面上更大的一个需求。

那么所以就是我们看到的这种最近对于互联网企业这个方向监管的趋严,我们判断跟这个方向也有一定的关系。

所以我们有幸今天请到了富数科技的副总卞总,同时卞总也是上海多方安全计算的技术创新协会的主任,那么有请卞总来跟大家聊聊这个话题。

那么首先请卞总站在整个产业角度介绍一下整个隐私计算好吧?

卞总:17年网络安全法出台,富数当时做大数据的啊然后不可避免是会碰到非常多的敏感的数据,所以开始看隐私计算相关的技术。开始研究的两年还不太火热,不是被广泛关注的这样一个问题,然后到19年的时候来逐渐开始有转变。并且有因为有大数据的监管越来越严格,我们也看到这个趋势它不是会有所放松。

隐私计算技术其实不是拿我们的隐私来做计算,其实完整的讲法应该是隐私保护的计算。用更通俗的话讲,数据可用不可见,数据可算不可得。

本身隐私计算技术再国家相关机构的规划中不是一个特别新的名词,‍2017年的1月份的时候,工信部它在大数据产业发展规划里面,就已经把隐私计算的技术作为说我们要突破这样一个技术。‍2019年的时候是央行也有金融科技发展规划里面,也已经把隐私计算相关的一个技术要充分利用去提高安全性,然后2020年4月份,国家是有两个关于数据要素市场的文件,然后到今年数据安全法已经发布了,个人信息保护法也是即将发布。所以家的顶层设计里面,在很早的时候把隐私计算的技术就已经在规划当中。

宋嘉吉:‍‍想请卞总介绍一下在这个数据可见而不可得的这种环境,比如说你现在想统计,然后人均的收入水平或者是人均的某个数据,你又看不到我的数据,看不到我个人的数据,你怎么来统计出这个平均数了,所以从技术上来看,你自己算是怎么实现的呢?

卞总:有一个技术叫同态加密,那么它其实就是数据加完了以后,可以去做各种计算,然后技术这个结果把它解密以后跟这个就是明文的计算是一样的。另外一个方向是多方安全计算,有一个很著名的例子是百万富翁问题,华人科学家姚期智提出的。

宋嘉吉:目前来看,效率跟加密性能之间的平衡问题是怎么解决的?

卞总:安全是有代价的,安全性能和效果它其实是有一个相互平衡的问题。那么在实际的应用场景当中,有一些要追求极致性能的,有些场景它可能是毫秒级的,你要用隐私计算的确它是很有挑战,但是有一些场景它不是那么实时性要求高,安全性要求更高,这个场景下面我们就可以用隐私计算。

事实上富数也有一些这种查询类的这样一些场景,已经做到了100毫秒以内,从用户体验来讲,它的效果性速度还是非常快,可以在这样的一个场景当中,它是已经达到这种可商用的一个级别了。

另外用硬件来加速隐私计算,这是一条可行的一条路径,富数也有实现它的性能可以达到几十倍的一个提升。所以这一块的话后面软硬件结合跟芯片结合,这也是一个非常有前景的方向。

宋嘉吉:目前来看您觉得技术上最大的难度在哪里呢,实现从这个实验室到商用最大的难度在哪里?

卞总:首先安全性是一个黑盒问题,外部人员很难断定整个过程的安全性。富数在做的是把它黑盒变得透明化,然后可视化,让大家知道里面是算法逻辑是如何运行,从而得到可证明的安全性,提升用户接受程度。

另外一个是互联互通问题,因为对隐私计算的话,往往是在多个合作方之间发生的,这一块就需要有标准和规范来进行一个统一,所以富数也正在推动叫互联互通的一个协议规范的标准的制定。

第三个问题是一个用户应用门槛,富数门针对隐私计算做了一个叫流程化的拖拉拽式的这样一个交互的工作台,使得普通的业务人员他也能够去用这些已经开发好的这些算法组件去完成复杂的隐私计算的这样的一个场景的任务。

宋嘉吉:目前为止,从商业落地的角度来看,隐私计算业务的商业模式一般会怎么去构建?

卞总:可能是隐私计算这个领域技术商业两者中技术的问题相对来讲越来越被解决掉了,然后呢啊现在越来越重要的就是商业的问题,那么尤其是在多方协同的时候利益怎么分配的问题。区块链在其中可以发挥一定的作用,因为通过智能合约就是一个多方的解决多方协同的这样一个解决这个问题,然后比如说智能合约里面可以约定个计算各自贡献价值的一个方法,大家你只要认同好他在链上去达成共识,然后后面的运行就按照智能合约的一个约定去执行。事实上富数在2018年的时候,就有隐私计算跟区块链结合,然后通过智能合约来进行一个各自利益的这种记账和结算的实践。

宋嘉吉:‍从收费上来看,我们现在能够通过隐私计算能产生收费的模式吗?

卞总:有两方面,一个是从技术的技术的解决方案来讲,这类似传统SaaS系统或者说是私有化部署的这样一个产品系统,用户方对它有一个建设的需求,这是一个收费模式。另一方面,在用户希望真正利用数据产生价值时,都会做一个机器学习训练和建模,所以得到一个建模模型的费用,然后还有数据的价值的开发费用。

宋嘉吉:对于不同的场景是需要不同的隐私计算的建模的,这种建模能力在整个的我们在实施的落地的过程当中,这一块的占比高或者是要花费的精力多吗?

卞总:‍是的,首先不同的行业它的差异性很大,比如说像金融和医疗,解决的问题完全不一样。富数在产品层面上把它尽可能的标准化,然后降低用户门槛,所以希望能达到一个效果就是80%的这样的一个多方的数据的安全应用,可以由用户他自己去创建,其余更复杂一些的可能是需要这个行业的专家和我们的算法的专家去参与其中的来进行设计和搭建。

宋嘉吉:从目前您看到的行业情况来看,几个不同的隐私计算技术方案的市场占比大概在什么水平?

卞总:我们不能够用技术的市场占比这样来划分,因为往往这几种技术是要啊综合起来使用的,比如说在我们的技术方案当中,我们有同态加密,我们也有多方安全计算,‍然后还有一个叫联邦学习,但联邦学习专门指机器学习的领域。另外一个是硬件的一个解决方案,它会相对独立一些,因为技术路线差异会比较大,硬件的方案目前的话应该说它在一个比较另独特的另外的一些领域发挥它的一个作用。

宋嘉吉:‍‍‍最后请卞总给我们举个例子,您看到的或者最近实施一个的隐私计算的这种商业案例的分享?

卞总:我们正好有一个项目非常典型,它一方是XX银行,然后另外一边是运营商。

那么这个项目是入选到央行的金融金融科技创新的监管试点的项目。这个项目里面它其实是交通银行在做对自己的客户做风控的时候,需要用到中国移动的运营商的一个数据,但是这里面就有涉及到一个隐私保护的问题,因为运营商的数据的话,它也是它肯定从安全性的角度也好,合规的角度,它不能够提供给交通银行,然后交通银行自己也有数据,它是比如说是金融的,它已经有积累了一个比较大的样本,那么这一些样本的数据它他要做跟假如说要跟运营商去联合建模,不能把这个数据拷贝到运营商那边,所以两边数据都不能出门,但是又希望能够去一起来进行一个机器学习进行一个训练,产生出一个对风控能够去做一个很好区分的这样一个模型。

那么我们金融科技监管创新的项目就解决这个问题的是目前的一个阶段,已经是交通银行和中国移动已经是建立了连接,而且是完成了目前第三轮的这样一个联合建模。产生的效果也非常好,在它的一个金融风控方面,可以得到一个很好的它的风险降低的这样一个效果。这是一个非常典型的案例,在中国人民银行上海总行的它的一个官网上面也可以查到这个项目。

提问1:关注到中国信通院这边在跟行业里很多的机构合作,在做一些行业内就是技术标准的规范化,不要富数这方面目前工作推进如何?

卞总:目前的话几乎所有隐私计算的技术标准和规范富数都有参与,除了参与之外,甚至有些我们是最主要的一个技术标准的一个提供方。

目前的话,这个行业里面已经有大概五六个标准已经是发布了。我们还有几个标准是金融行业的,还有是通信行业的标准,有两个标准正在制定当中。除此之外,我们还在有一个国标的项目部署牵头来发起,目前有这样一些标准都在制定当中,那么这标准的制定也使得这个行业里面大家是能够有更好的一个技术规范,然后相互之间能够包括互联互通,相互兼容,有更好的一个开放性,解决避免从数据孤岛走向一个技术孤岛的问题。

提问2:数对隐私计算行业和业务将要走向平台化这个观点有没有什么看法?

卞总:首先是在平台化之前先会有一个叫网络化,那么对于每一家企业或者每家机构,它都通过隐私计算的这样一种方式,能够和它的合作方去互联。平台的话它可以是它不会单一的一个平台,它可能是可以有多个具有丰富的这样一个结构,然后又是有多个中心的,举例是行业的中心,有区域的中心,然后还有比如说专门跟技术某一方面垂直领域的这样一些中心,然后这些中心之间它也不是孤立的,它相互之间也是要啊相互连接的。

所以在我们看来,将来的隐私计算它其实是会产生一个非常丰富多彩的这样一个生态,在生态里面是不同的参与方,他是扮演不同的角色,发挥不一样的一个价值。

提问3:‍‍现在这种网络社会安全,现在无论从国家的层面,还是从企业统一,它大家都是比较重视的,从网络安全或者数据安全角度来说,对隐私计算的提供隐私计算服务的这些企业的数据安全监管的角度有没有什么特别的不同的地方?

卞总:监管也是一个新的课题,那么一方面是在由于加密它是它是带来了比如说像新的算法,这个算法到底是否安全,我们有一些算法已经是经过行业里面有论文,有专家评审,那么这些是公认的,但是因为技术还在发展,还是可能会有一些新的算法的技术的产生,那么对这些算法的话,我能用可能是监管也是要有一些这种对的一个判断。

另外一个方面其实监管用隐私计算也能够产生更好的一个效果,我们其实在比如说像跨境的数据使用上面,或者说流通上面用到了隐私计算的一些技术,一些企业它在业务当中数据的保护意识很强,不愿意与监管方分享。但是通过隐私计算的方式去验证企业在经营当中,它的数据的确是符合监管的一个要求的,监管也是可以去追溯检查说企业的确是合规的去经营用这个数据。

总结就是两方面,一方面是增加了监管的难度,因为不是什么用了隐私计算就一定安全,还是要继续进行一个验证。第二个方面是同时隐私计算也给予监管提供了更好的工具。

‍提问4:有了分布式存储之后,会对隐私计算的数据业务框架产生怎么样的影响吗?

卞总:分布式存储它和隐私计算是有关联,但是这个就是隐私计算它不等于分布式存储,目前的话应该说这两个结合还在一个比较早期的这样一个阶段,虽然两个技术是解决不一样的问题,但是可以融合。

提问5:‍‍您觉得咱们这个产业离一个快速增长的阶段还要多久,大概的催化剂是等待监管那边更严厉的要求吗?

卞总:这样其实就不需要更严厉的要求,隐私计算已经从去年是验证,然后市场教育到今年的话接受度是越来越广,那么基本上一个是金融行业,金融行业因为央行它也有一个,数据金融数据治理的一个指引,然后把隐私计算作为一个基本上就是标配,所以金融行业里面会迎来一个比较快速的这样一个爆发式的增长,大家会在更多的场景当中去使用它。

那么在其他的行业,我们也也发现已经有一些案例,但可能没有金融行业那么快,所以我们觉得目前市场爆发性增长的条件已经具备了,当然因为这些都是toB的生意它的一个实施的过程,然后整个一个阶段它还是有流程在里面,所以它 不是toC的那种快速的一个采纳,还是会有一个过程,但是今年2021年应该是一个应用的元年,然后到2023年会有更多的应用的爆款的快速的增长。

提问6:联盟链的智能合约有没有落实在富数现有的一些业务当中?

卞总:‍其实是有的,那么我们其中有几个项目是把区块链是作为其中的不可缺少的部分,从城镇智能合约都是作为一个呃里面的核心模块去做一个解决方案推出来的,那么其实也有其他的这种替代方案,但是我们比较之后发现区块链还是一个最容易被接受的这样一个方案。不过并没有把说区块链和隐私计算它就就完全是不可分的,只是两者可以结合,构成更好的服务方案。

宋嘉吉:‍‍好的,非常感谢今天卞总跟大家的解答,那么有些计算也是未来在创新技术方面非常有前景的一个方向,我们也会关注附属在这个领域里的一些后续的拓展,感谢今天晚上卞总的时间,谢谢。

卞总:好,谢谢宋院长,谢谢国盛区块链,再见