AI新贵上位记:图网络是怎么火起来的?
谁是2018年AI圈最靓的仔?
这顶“桂冠”只有两位候选人:俗话说,前端能打看BERT,底层深度看图网络。
其实并没有这句俗话……但是BERT和图网络在今天的AI界并驾齐驱,堪称被讨论最多的两种技术,这一点是毫无疑问的。
谷歌的BERT作为一种算法模型,在语言任务上展现出了不讲道理的应用效果,熠熠夺目自然很容易理解。
但另一个最近大家听到很多次的词,图网络,可能就没那么容易理解了。相比某种算法,图网络更像是一个学术思考下若干种技术解决思路的集合,非常抽象和底层。它的价值到底在哪?为什么甚至能被抬高到“深度学习的救星”这种程度?
我们发现,目前关于图网络的解释,大多都是从论文出发。非技术背景的读者可能会看得有点晕。所以这里想用一些“大白话”,来描述一下:风口浪尖上的图网络,究竟有什么秘密?
想让自己在AI圈潮酷起来吗?聊Graph和GNN吧
所谓图网络,并不是指有图片的网站……而是指基于图(Graph)数据进行工作的神经网络。
Graph,翻译成“图”,或者“图谱”。这是一个数学概念,指由顶点(nodes)和边(edges)构成的一种数学关系。后来这个概念引申到了计算机科学中,成为了一种重要的数据形式,用来表示单元间相互有联系的数据网络。
此外,这个概念还引申到了生物学、社会科学和历史学等无数学科,甚至变成了我们生活中的常见概念。在警匪片里,警局或者侦探办公室的墙上,往往挂着罪犯的关系网络图,这大概是我们生活中最常见的Graph。
回到计算机科学领域,图数据和基于图的分析,广泛应用于各种分类、链路、聚类任务里。人工智能领域有个重要的分支,叫做知识图谱。基本逻辑就是将知识进行Graph化,从而在我们寻找知识时,可以依据图谱关系进行追踪和定位。比如我们在搜索引擎中搜某个名人时,相关推荐会跳出来跟这个人字面意义上无关的其他人。这就是知识图谱在起作用。
那么图网络是怎么搞出来的呢?
大家可能知道这样一个“唱衰AI”的小故事:用机器视觉技术,AI今天可以很轻松识别出来一张照片上的几张人脸。但它无法像真人一样,一眼看出来图上是朋友、恋人还是家庭聚会。
换句话说,一般意义上AI无法获得和增强用人类常识去进行逻辑推理的能力。很多人以此判断,今天的AI并不怎么智能。
AI科学家们琢磨了一下,表示这事儿有办法搞定。
如果把图/图谱作为AI的一部分,将深度学习带来的学习能力,和图谱代表的逻辑关系结合起来,是不是就好很多?
事实上,Graph+Deeplearning并不是一个全新概念。最早在2009年,就有研究提出了二者的结合。近几年这个领域陆续在有研究出来。对于这个组合产物,学术界有人称之为图卷积网络(GCN),也有人称呼其为图神经网络(GNN)或者图网络(GN,Graph Networks),其技术内涵和命名思路也各不相同。这里暂且使用图网络这个笼统称呼。
图网络作为一种新的AI研究思路,之所以能够在2018年被点燃,很大程度还是号称AI扛把子的DeepMind的功劳。
在火种抛出、全球跟进以及反复争论之后,图网络变成了AI学术圈最靓仔的那个关键词。今天大有一种,聊深度学习不说图网络就很low的感觉……
从识别小能手到推理专家:
AI新贵求职记
有种论调是这么说的:深度学习已死,图网络才是未来。
这句话怎么琢磨都有问题。因为从图网络在去年被“翻新”出来那一刻,它在本质上还是对流行的多层神经网络的一种补充。
让我们来打个比方,看一下跟传统深度学习相比,图网络应该是如何工作的。
举个例子,假如我们想让教育我们的孩子,让他认识新来的邻居一家人。我们应该怎么办呢?可以选择给他讲,隔壁新来了某个小朋友,他爸爸是谁妈妈是谁。但是这样不直观,孩子很容易记不住。而更快的方式或许是拿着照片给他看,告诉他照片上的人都是什么关系。而在这个工作之前,其实我们已经完成了一个先觉条件:我们已经告诉过孩子,爸爸妈妈爷爷奶奶这些称呼,分别指代的是什么意思。他理解这些“边”,然后再代入新邻居一家人具体的样貌性格交谈作为“顶点”,最终构成了对邻居一家这个“图”的网络化认识。
而我们在用深度学习教导AI时,往往是省略掉第一步。直接给出大量照片和语音文字资料进行训练,强迫AI去“记住”这一家人的关系。然而在AI缺乏对家庭关系的基本常识情况下,它到底能不能记住,是怎么记住的,会不会出现偏差,其实我们都是不知道的。
某种程度上,这就是深度学习的黑箱性来源之一。
所以图网络的思路是,首先让AI构建一个“图”数据,先理解爸爸妈妈这一类关系的含义,再去学习具体的家庭数据。这样AI就可以依靠已经积累的节点间的消息传递性,来自己推理下一个要认识的家庭究竟谁是爸爸谁是儿子。
这也就意味着,图网络某种程度上有了自己推理的能力。如果将这种能力推而广之,AI就将可能在非常复杂的联系和推理中完成智能工作。
前面说了,这个领域的工作其实一直没有停止。但是之所以没有广泛流行,一方面是因为这个领域相对小众,缺少重磅研究来引发大家的关注;另一方面也是因为看不见摸不着,缺少开源模型来检验理论的正误。
去年6月,DeepMind联合谷歌大脑、麻省理工等机构的27位学者,共同发表了关于图网络的论文《Relational inductive biases, deep learning, and graph networks.》,接着开源了相关的算法包GraphNet。
这篇文章中,DeepMind不仅提出了新的算法模型,希望能用图网络实现端到端的学习;同时也总结归纳了此前图网络各个流派的研究方法,并将其在新算法上进行了融合。
在这个有点承上启下意味的研究出来后,大量关于图网络的综述、应用检验,以及新算法的探讨开始在学术界萌生。随着全球AI圈的共同发力,这门AI技术新贵正在尝试走向台前。
图网络,到底有什么用?
这个问题或许可以分远近两方面看。
近的方面,有一些AI要面对的任务,天然就属于图结构数据。因此用图网络来学习和处理可谓事半功倍。比如说社交网络、智能推荐、化学分子预测、知识图谱等领域,都被证明可以广泛应用图网络技术来提升智能化效率,降低算力消耗。
而在非结构化数据,比如语音、文本、图片等场景,图网络可以用来提取结构化信息。比如在图片中更好地识别家庭成员关系,认识图片中正在发生的行为等等。此外,图网络还能为数据的优化组合提供更加智能化的应用。
而从长远方面看,图网络是对图谱技术和深度学习技术两个技术领域的融合与再拓展。这不仅让沉睡已久的,AI中的知识表示流派具备了复活的潜力。更重要的因素在于,图网络可能让深度学习打开因果推理这扇大门。
具体一点,作为一种底层逻辑上的更新,图网络似乎可以起到对深度学习几个原生缺点的弥补:
1、增强AI可解释性。
“臭名昭著”的深度学习黑箱,来自于大量非结构数据输入之后,算法进行归纳的逻辑无从掌握。而图网络可以操作知识的归纳逻辑,看出行为的因果关系,显然对是黑箱性的一次突破。
2、减少“人工智障”式的视觉错判。
在机器视觉领域,AI另一个广为人知的问题,就是对对抗攻击的低抵抗力。比如AI本来已经认识这是鸟了,结果照片上沾一个黑点,它又不认识了。这个问题来自于AI本身识别的是像素,而不是物体概念本身。图网络如果将物体关系带入其中,或许会让AI的视觉判断力更像人类。
3、小样本学习的可能性。
深度学习的另一个问题,就是很多算法必须经历超大规模训练来提升精度。而这也是对算力和数据的暴力消耗。如果能让AI具备逻辑上的迁移可能,那么具备人类常识的AI,将可以在很小的数据样本中完成相对复杂的工作。
4、向着通用智能的一小步。
我们知道,AI今天的主要能力是识别和理解,而推理是其若想。假如图网络弥补了这一弱势,是否意味着AI将从单体智能向通用智能走上一步呢?
这么多价值的图网络,显然想不火都难。2019年,或许将是图网络放出更多光芒的一年。
然而也别太乐观,这个更多光芒完全是个相对值!虽然今天很多声音高调吹捧图网络的价值,但要看到,图网络并不是AI的万能钥匙。
心头一动,道阻且长:
如何看待图网络的发展现状?
虽然今天产业端对于图网络的应用还没有怎么被提及,但就我所接触过的AI学术界人士,确实普遍对图网络报以非常强烈的兴趣。
当然了,对图网络的争议今天也普遍存在。整体而言,对它的整体评价分为了三个流派:
1、悲观派。有一种观点认为,图网络无非是对深度学习劣根性打的一个补丁,属于深度学习走不下去了,打算绕绕路。而且这个补丁并没有被证明有效。今天还只是停留在概念和浅层实验阶段。
2、客观派认为,图网络是深度学习发展的必然趋势和重要补充,恰恰证明了AI作为一种底层技术正在不断发展成长,拓展自己的边界。不管图网络是不是真的能做到畅想的一切,至少证明了深度学习体系在今天是有发展能力的。
3、乐观派则提出,图网络的关键意义,是让AI能够获取常识和推理能力,这种能力显然是人类智能的一个重要代表。我们一直期待的AI走向通用化的强人工智能,会不会就从图网络开始呢?在他们看来,图网络是关乎于AI去往下一个时代的关键开关。
到底哪一派更接近未来的真相呢?可能就交给诸位和未来一起检验吧。
总体而言,图网络是一种对今天流行的AI体系,从技术思想,到技术逻辑的一次重要修补和升级。它在某种程度上是一个未来,但今天还缺乏实践检验和有效工作。
在实践中,图网络的限制还非常多。比如其表示能力不足,无法承担太复杂的图结构数据。并且对计算复杂度要求很高,对今天的计算架构又提出了新的挑战。
而且图网络主要解决的是AI对结构化数据的处理,而在动态数据、大规模数据、非结构化数据等领域,图网络的作为依旧有限。
再一个,虽然AI是一个高度产学一体化的学科,从前瞻性研究到技术实践的周期已经被大大缩短。然而要客观看到,二者并不是无缝对接的,从算法理论提出到实际应用,还是会有一个比较长的蛰伏期。我们不能指望去年的AI学术明星,今年就走进千家万户。
总之呢,这是个让人动心的技术,但今天还仅仅是发现了藏宝图。真正的宝藏,大概还在千山万水之外。
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: