怎样让机器变得更加聪明,让它们更好奇就行
-- Preview: --
怎样让机器变得更加聪明?无需程序员介入,只需给它们一些好奇心就行了。
这是什么?怎么抓住它?这个玩意儿派什么用场?我要是拍拍它,或是把它扔到空中,又会发生什么?如果按一下这个红色的大按钮会发生什么呢?
因好奇而对世界进行的探索再也不是具有认知能力的卑微人类所独有的特质了。近几个月来,各大计算机实验室已开始在各自开发的强大算法中加入了一些“人工好奇心”。换句话说,就是用编程给机器制造好奇心。
这对于开发真正拥有智能的机器人来说是非常重要的一步。“只有当机器有能力自由探索身边的环境,靠自身来认识世界的时候,才算是成为了真正的人工智能。”于尔根·施密德胡贝(Jürgen Schmidhuber)这样表示,他是瑞士卢加诺大学该领域的先驱之一。
近五年,Google、IBM和Facebook等公司研发的算法取得的成果已经非常可观了。这些算法在许多我们之前认为只有人类大脑才具有的技能上都胜过了我们:脸部识别、医学诊断、国际象棋、围棋,等等。似乎没有什么必要再给这些效率惊人的怪物添加新的属性了……
但如果我们仔细想一想,就会发现这些厉害的成绩只限于某个特定的任务,都是为了完成工程师设立的各种目标:对图像进行识别分类,落子击败对方,等等。
所依靠的学习方法也都相当粗糙:程序员根据决策的有效程度来设计奖惩机制,从而使这些程序在奖赏和惩罚的交互中接受教育。本质上还是“打一巴掌揉一下子”那种古老的教育方式。
然而,科学家越来越相信,单凭这种方法是无法让机器面对我们这个复杂且不断变化的世界的。而解决这个问题的一个途径,正是一小群机器人专家20年来孜孜不倦研究的课题,他们想要开发能够自己决定目标,不需要奖赏机制就能进行自主学习的程序,也就是纯粹由好奇心驱动的程序。
“人类的好奇心是一种自发的探索行为,并非是受到寻找食物、庇护和社会关系等意愿的驱动,只是单纯地想要收集信息本身。人从童年开始逐步探索自己的身体、环境和语言等,在这个过程中,好奇心可谓至关重要。”法国国家信息和自动化研究院(INRIA)的机器人专家皮埃尔-伊夫·乌代耶(Pierre-Yves Oudeyer)解释道,“这让我们有了在算法中加入‘内在动力’的想法,让机器在没有人类干预的情况下,就能够自主学习各种各样的新任务。”这个想法听起来很完美,但怎样才能把这种驱使我们探索世界的内在动力复制出来呢?而且一个事物是否有趣又该怎么衡量呢?
“让我们举个具体的例子,比如将一个机器人放在一个房间内,”波尔多大学机器人学家塞巴斯蒂安·佛莱斯蒂耶(Sébastien Forestier)介绍道,“这个机器人会面对许多想得到的目标,比如向上伸手,推动视野内的小球等。面对这么大范围的选择,我们的好奇心算法会根据机器人当时的能力,优先选择最容易实现的目标:它会根据在初步尝试中设立的标准,评估自己的行为对小球是否起效,从而将精力集中在进步最大的行为上。”
机器人就像小孩一样,会优先选择适合自己能力水平的练习。“经过不断的学习,一开始认为无法达到的目标也会变得越来越可行。”法国国立高等电信工程布列塔尼学院计算机系的源绍梅(Sao Mai Nguyen)补充道。
研究人员也尝试了其他的方法。“我在算法中加入了新奇性的测量算法,可以鼓励系统导向之前没有见过的场景,或是外部环境中最不容易被预测的那一部分,”美国得克萨斯大学及Google研究人员托德·赫斯特(Todd Hester)介绍道。
罗切斯特大学发展心理学家塞莱斯特·基德(Celeste Kidd)指出,新奇性和惊奇感是好奇心的两个关键参数:“孩子们更喜欢令他们感到意外的事物,或者是因果关系为他们所不知的事情。”
风险是机器人会不加甄别地接触所有新鲜事物:想象一个机器人在看见了天上瞬息万变的云彩后,沉迷其中,不能自拔……“这些算法必须忽略环境中机器人无法发挥作用的那一部分,”美国伯克利大学机器学习专家迪帕克·帕塔克(Deepak Pathak)强调道。而皮埃尔-伊夫·乌代耶则认为,“对这些机器的好奇心必须要有所规范……但也不能太单一。”
如今,这些人工好奇心的算法已经取得了颇有前景的成果。“这些算法展示出更为有效地探索复杂环境的能力,”皮埃尔-伊夫·乌代耶高兴地说,“在恰到好处的好奇心面前,那些互联网巨头计算能力卓绝的大型计算机也要退避三舍。”
此外,德国波鸿大学的人工好奇心专家伐楼拿·拉杰·康佩拉(Varun Raj Kompella)指出,好奇的系统能够更好地举一反三:“它们不满足于只学习一种任务,而是希望同时学习多种技能。”“这些机器人的探索行为很接近6个月到2岁的儿童,未来会模仿年龄更大的儿童的行为模式。”塞巴斯蒂安·佛莱斯蒂耶透露。
Google的团队最近也注意到了这些新的可能性,他们让这些好奇的机器试着玩起了电子游戏,在此之前,Google所有的机器人都对这些游戏束手无策。“这些机器能够获得在类似《超级马里奥》的游戏中晋级的能力,完全是受好奇心的驱使,当中没有进行任何人工干预。”迪帕克·帕塔克告诉介绍说。
人工好奇心玩马里奥
这几个实验看起来似乎无关紧要。然而,“这种对可能比较稀少或隐藏在一组数据中的关键信息的主动搜寻,对今后学习自动驾驶或医疗诊断这类技能肯定会非常有用。”源绍梅猜想道。计算机科学家已经摩拳擦掌,尝试将好奇心算法精妙的分析能力和现有算法惊人的统计能力结合起来。
如果和这种人工智能一起生活,可能会有一些奇怪的体验。“我们在对一个机器人进行操作的过程中惊奇地发现,在已经进行了5个小时的试验后,它依然乐此不彼地挥动着自己的手和臂膀。”塞巴斯蒂安·佛莱斯蒂耶介绍说。“从某种角度来说,我们完成了学习乐趣的建模。”皮埃尔-伊夫·乌代耶指出。这些拥有好奇心的系统会不断自我发展,并定期向人类寻求帮助以满足它们的求知欲,甚至还会发展出人格的雏形。还有可能让我们大吃一惊的是它们不羁的创造力。“
这些好奇的系统会生成一些新的行为序列或是经验,有时候能让我们发现一些至今未被注意到的规律性,”于尔根·施密德胡贝兴奋地说道,“可能是一种新的音乐形式,一个新的玩笑,或者是遵循某些未被发现的物理规律的新实验数据。”
但不断地试错,不断往各个方向探出触角,好奇的人工智能也可能会成为一个可怕的错误。“我们已经开始对这个问题进行研究了。”
皮埃尔-伊夫·乌代耶透露。“确实,这对人类来说可能是一种危险。”伐楼拿·拉杰·康佩拉警告道,“我们不应对好奇心有所限制,这是阻碍生产力的发展。但我们应该对人工智能获取能力的学习环境加以限定。我认为我们应该像教育孩子那样来教育人工智能:我们不可能把手枪放在婴儿的手中,他可能会因为单纯的好奇心而扣动扳机,伤到他人……”
所以,我们最好避免让这些新型算法按下那个红色的大按钮。
撰文 Vincent Nouyrigat
编译 邹沁
阅读原文
Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: