拨开区块链的云雾,攻破三元悖论的不可能
长久以来,数据安全是人工智能行业内的热门话题和痛点之一,区块链技术凭借自身去中心化、匿名化等特点,不仅确保领域内数据共享的安全性及私密性,还在一定程度上避免了数据孤岛的情况发生。它与人工智能技术的有机结合,正在为智慧城市、医疗卫生、食品安全等领域注入更多的可能性。
尽管区块链技术在诸多场景中逐步应用 , 但这项技术长期面临「不可能三角」(也称三元悖论)的技术瓶颈。无论采取哪种共识机制来决定新区块的生成方式,区块链网络模型都无法同时兼顾性能、安全、去中心化这三项要求,最多只能满足其中两项而牺牲另外一项。
由创新工场人工智能工程院副院长兼执行董事王嘉平参与撰写的,基于异步共识组 Monoxide 区块链扩容方案的研究论文,在去年 12 月被计算机网络学术会议 NSDI 录用。这篇论文详细阐释了 Monoxide 的优势和特性,有望打破「不可能三角」这一长期阻碍区块链性能的瓶颈。
(创新工场人工智能工程院副院长兼执行董事王嘉平与 NSDI 会议主席 Jay Lorch | 创新工场)
**
**
数据暗箱
进入云服务时代后,面对全球的海量信息,我们更依赖于搜索引擎和推荐系统提供的网页和信息流推送内容。这些系统和产品左右着用户的「所见」,甚至通过人工智能技术的加持,主打「千人千面」的内容呈现方式。虽然这些服务系统的背后恪守着诸多规则,但它毕竟由人为建立,依附于机器去严格执行。
现有的服务系统基于计算所构建的规则愈发强大。不过,最初的计算却很简单。计算的目的是为了完成任务,计算过程全部掌握在使用者手中。王嘉平表示,从 Web 时代开始,移动互联网让这件事变得不一样。尤其是在云服务体系当中,规则被认为是计算的核心。我们日常使用的很多服务,背后都是受这些规则所驱动:「比如网页推荐和信息流,或主打撮合型服务的网约车程序,用户很少去思考系统规则的背后究竟是为用户服务,还是服务提供商谋取利润的工具。」
事实上,二者皆存在。
大型在线服务商的背后是成千上万服务器 24 小时运转,它服务每个人,又去了解每个人的喜好,并针对性地优化服务质量和业务流水。
Google 作为全球最大的搜索引擎公司,曾提出「不作恶」的口号,是因为技术本身存在作恶的嫌疑,所以 Google 才会用这句 slogan 为自己树立行业标杆。也正因这种计算范式,导致了它有一个冠冕堂皇的理由:收集用户的公开数据和隐私数据变为一种理所应当,成为用户隐私问题的罪恶之源。
行业从业者清楚,这些规则对用户而言并不透明,并可以在暗处操纵。尤其是在线服务的规模近乎影响到所有人时,这件事情更需要关注和警惕。
在线服务系统最初源自于基于服务器的计算范式。服务器的逻辑认为,所有的计算都在数据中心发生,它隐含了两件事情:一是计算过程完全由自己控制和制定,并且可以随时改变其中的规则;二是用户没有办法获悉整个计算过程。
(王嘉平现任创新工场执行董事,投资方向为区块链和人工智能,曾主导了对比特大陆的首轮机构投资,成为其首轮三大主要投资方之一 | 创新工场)
**
**
打破信息不对称
提到区块链,公众脱口而出的词汇更多是数字货币,但区块链的本质并不能和数字货币划上等号,「大家看到的比特币只是区块链技术支撑的应用之一」,王嘉平强调。
很明显,当下区块链行业信息不对称的现象严重。「那些人鼓吹区块链是万能的人,从一开始就让大家就对区块链产生误解,觉得区块链是一个不可篡改的数据库,这种理解明显歪曲了事物原貌。
区块链的本质是让计算规则不被改变。它作为一种全新的计算范式,让系统内的规则在全网公开透明,且规则一经部署无法私自改变。而系统内涉及的数据,建立的状态,可以是任何类型的数据结构。
不同于服务器的计算逻辑,区块链新的计算方式要求以用户为结点,计算过程是一次又一次地被全球不同的计算机接力完成,而不是停留在一台特定的计算机里面执行。
它改变了原来的计算方式,摆脱了由硬盘存储、CPU 代码等软硬件对计算结果的绝对控制。它拥有一份完整的规则,譬如应该如何完成计算,怎样利用数据做输出和输入。当这套规则运行在网络内时,它允许所有人参与进来,但任何人都没有办法在计算的过程中篡改规则,否则计算结果不会被承认。这使得区块链的计算范式具有一种「独特的能力」。
王嘉平认为,判断一项新兴技术的价值和潜力,归根到底是看其是否具备一些新的能力和实实在在的技术突破。区块链以数字化和形式化的业务场景为前提,构建了一个不受人为因素控制的、牢不可破的规则。正因为这种技术的独特性,才赋予了区块链支撑未来新业务和新应用的市场机遇。
(在接力计算的过程中,无法预测下一次计算会在哪个结点完成,但区块链会基于 P2P 网络协议把数据或计算结果同步到网络上 | 创新工场)
**
**
分而治之
眼下,区块链技术存在的明显缺陷是性能问题。要知道,区块链系统要求每一台计算机同步整个网络里面的信息和状态,这导致了全网性能实际上只有一台计算机的储存、通讯和计算能力,这正是比特币进展迟缓的主要原因。
当然,它的解决方案显而易见,因为工作量巨大,不必让所有的计算机重复所有的工作,可以对计算机分组并参与分片的工作,这种「分而治之」的思路,在互联网的发展历程当中,被大量的使用,也为为互联网系统性能的提升做出了卓越的贡献。
王嘉平介绍,分布式计算系统数据量之大,以至于当今世界上任何机器都无法独立胜任这份工作。而分布式计算的「伸缩性」可以很好地把储存数据和其相应的计算切分成若干块,利用普通的标准化 SKU,让多台计算机共同参与计算,不再需要打造超大型计算机。
去年 12 月,计算机网络顶级学术会议 NSDI 宣布录用由王嘉平参与撰写的区块链研究论文,该论文提出名为异步共识组 Monoxide 的区块链扩容方案,并可以在由 4.8 万个全球节点组成的测试环境中,实现比比特币网络高出 1000 倍的每秒事务处理量,以及 2000 倍的状态内存容量。
(理论上,Monoxide 模型可以将一个单链共识算法的横向扩展倍数提升到 10 万量级 | 创新工场)
论文中的异步共识组——Monoxide 模型,是一个并发的多链系统,每一个链称为「共识组」,即把整个网络的共识和计算分成若干组,它们互相独立,并行工作,分摊网络里的部分工作量。这种思路听起来直白简练,但事实上,要在区块链系统完成这样一项设计,并且保证安全和公平开放的特性,是非常有挑战的。
(Monoxide 模型打破了「不可能三角」的制约,在满足安全、高性能和去中心化的三角特性前提下,尽量不引入额外的实体,不引入额外的机制 | 创新工场)
「互联网技术讲究容错性,它在内部部署不需要考虑恶意结点的存在,允许机器的失效和突然宕机,但是在区块链系统当中,任何人都可以参与进来,这意味着它不仅仅需要容错,还要保证安全,这就要求它必须具备通过协议、密码学、共识技术等,去抵挡网络当中某些恶意结点的出现」,这是区块链系统实现「分而治之」的设计思路最有挑战的地方,王嘉平认为。
异步共识组本质上是为了改善区块链性能,它有两个非常重要的指标:一是吞吐量(TPS),二是状态容量。
吞吐量在业务层面意味着流量,意味着用户的活跃度。在 Monoxide 系统内,吞吐量不是一个定值,而是具备可伸缩的特性。只要给定足够多的计算资源,那么整个网络的吞吐量就可以实现线性提升。在试验阶段,Monoxide 成功在一千多台计算机上部署四万多个结点。
而状态容量则是系统承载用户量的天花板,它的空间量决定了区块链系统记录用户状态(又称账簿)的多与少。因为区块链存储用户数据需要放在内存里面,确保其验证交易能够随时访问。
状态容量以前始终是一个单机容量,几乎没有得到过提升。但实际上,状态容量可以随着更多的计算机参与而得到线性提升。「比如 Monoxide 现在用 2048 个分片,再全网达到一万多的 TPS,状态容量的大小是几个 T。当我们把分片分到几十万的量级,足以满足支付宝整个业务量。」王嘉平透露,Monoxide 将在今年 8 月上线测试网络,供开发者做技术评估。
**
**
应用畅想与自证清白
区块链构建的规则,要被完全数字化和形式化,确保所有的东西都能被计算。譬如现阶段用区块链技术去衡量道德,所有的计算机都无能为力。因此,区块链所涉及到的信息,需要被影射后才能成为链上的数据,触达一些新的业务。
王嘉平表示,用计算构建信任的区块链技术,可以在供应链、金融、食品安全、医疗卫生、防伪溯源等业务场景大有可为,它传递了信任关系,让不同产业间的上下游企业更好地相互协作。
比如一家溯源公司不可避免地要跟很多企业打交道,却始终绕不开「凭什么把数据给你」的问题。「给了你数据以后,万一你利用这些数据做其他的事情,我怎么控制,把你养大了,未来给我搞事情怎么办」,王嘉平强调,区块链最大的意义不是围绕业务展开,而是给业务增加一个很好的湿润剂。
大家做的都是跟溯源相关的计算,不能任意部署其他计算,也不能任意把数据拿作他用,这是区块链的技术保障。「倒不是说区块链本身在承载什么样的计算,而是说它给了大家一个可以去相信的支点,这个信任保证不是任何人的背书,而是来自于密码学和共识技术」,王嘉平说道。
再比如金融支付领域过去受到货币兑换、手续办理等因素的制约,跨国支付往往需要花费较高的时间成本,难以高效完成。而在具有公开、不可篡改属性的区块链技术的帮助下,交易双方的信用机制将得到保障,并且大幅提升系统的运转效率,降低业务成本,能够有效推动跨境支付在商业领域中的发展。
除此之外,保证计算被执行这件事情会有很大的价值,譬如就征信、税务和专利保护问题,这些事情在区块链里未来一定会发生,并深入到社会的每个角落。
对于业务本身来讲,自证清白是规避风险,明晰责任。比如医疗卫生、智慧城市,都需要做一些与公有数据和私有数据相关的计算和服务。对于那些想浑水摸鱼的企业来说,唯有用「良币驱逐劣币」的正向循环手段对付他们。
每逢基础设施的更替,都会导致企业盈利模式的变化。王嘉平推测,从互联网技术到区块链技术的更替同样会经历类似的阵痛期。商业公司需要在「提高用户服务质量」和「盈利赚钱」中权衡,这个平衡点目前区块链尚不能支撑,如果让计算机自证清白,这项新技术,或许不是区块链,也不是当年苹果提出的「端到端加密」的概念,还有赖于未来其他技术的发展。
图片来源:创新工场
责任编辑:周小丹
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: