揭秘AlphaGo背后团队:人工智能的下一个目标是什么?
来源: 一财网作者: 一财网
攻克围棋,仅仅是AlphaGo背后Deepmind团队的第一步。
近日,Deepmind创始人Demis Hassabis在接受The Verge采访时透露, AlphaGo仅仅是谷歌人工智能项目的一个分支。在未来,Deepmind主要目的是“用人工智能解决一切问题”,并将进一步探索人工智能在医疗、机器人以及手机等多个领域的应用。
回溯Demis Hassabis的成功之路,从一个获得过5次智力奥林匹克冠军的国际象棋神童,到两科优等成绩获得剑桥大学计算机科学学位的青少年,再到创造了第一款包含人工智能的视频游戏《主题公园》并创立了开创性的视频游戏公司Elixir1,之后离开游戏产业深造神经科学的PhD学位后于2010年创立Deepmind团队,你会发现他的经历十分与众不同。
Hassabis接受The Verge采访时正值AlphaGo首胜李世石九段的次日清早,如果说这个时候他把来自媒体的追问抛到九霄云外似乎也无可厚非。然而他却依旧热情友好,当Google方面的代表告诉Hassabis一夕之间有超过3300篇韩国媒体关于他的采访时,Hassabis表示出了明显的诧异:“这真是难以置信,不过看到一个高深莫测的东西在短时间内变得如此受欢迎,还是一件有趣的事情。”
围棋将是永恒的圣杯
据Hassabis称:“围棋一直位于完美信息游戏的顶峰之处,在可能性方面围棋比国际象棋复杂得多,所以,尤其是在深蓝之后,围棋对于人工智能来说意味着可望而不可及的圣杯。尽管我们做出了很多的努力,但仍旧没有特别深入的领悟围棋。蒙特卡罗树搜索可以说是十年前的一项重大革新,但是我认为对于AlphaGo的研发更为重要的部分在于我们引入了深度神经网使得人工智能拥有了所谓的直觉方面的判断力。可以说好的直觉是令顶尖棋手出类拔萃的关键原因,在昨天的比赛的实时解说中,当我看到麦克雷蒙九段在计算结果方面表示很难判断的时候,再次感到写出一套围棋价值判断的程序极其困难。
此外,对于AlphaGo在实战过程中下出的一些出其不意的招数,Hassabis表示十分震惊:“我相信李世石也会是同样的感觉,从他的面部表情上面可以观察出来,当AlphaGo向左进击李世石的领域时,我承认这的确出人意料。”同时他也认为,AlphaGo的下法极具进攻性,在某种程度上来说,AlphaGo在用李世石的长项来进行对抗。Hassabis说:“李世石以奇招频出和善于把控局势闻名,可以说AlphaGo在第一场比赛中下出了我们想要看到的局面,在开始的时候,它只是在整个棋盘上进行布局并没有实质地占领某块区域。传统的围棋程序之所以具有明显的短板,是因为它们精于计算却缺乏一种大局观。”
为何AlphaGo的胜利意义重大
举办这场比赛的初衷在于评估AlphaGo 的能力,谈及从AlphaGo的胜利中学到了什么以及未来它的发展方向,Hassabis表示:“通过比赛我们意识到我们目前所处的环节比之前预计的更加先进。对于完美信息游戏,围棋一直位于金字塔尖,还有许多顶级的围棋高手等待对决。此外,还有很多其他的游戏,比如说无限制扑克,因为是不完美信息游戏,因此多人游戏也是一个挑战。显而易见所有人类比机器玩儿的好的电子游戏也可以被考虑其中,比如说《星际争霸》在韩国也是非常受欢迎的。在信息不完美世界里,策略游戏对决策能力有极高的要求,因为能够被看到的仅仅是全局的一部分。而在围棋之中全盘情况都是可视的,这点对于电脑来说会使游戏略微容易一些。”
尽管用人工智能进行游戏对战刺激有趣,但是Deepmind团队还是希望将人工智能用于更多主流的项目当中。Hassabis表示他本人对游戏十分感兴趣,也许是曾经写过游戏,但是目前来说,游戏仅仅是提供测试平台用来测试我们的算法并且评估它们的等级的一个行之有效的办法。而Deepmind的终极目标在于用人工智能解决真实世界中的棘手问题。
谈及自己过去从事游戏行业的经历对现在有何影响时,Hassabis说:“可以说创立Deepmind一直以来是我的最终目的,我用了近20年筹划这个事情,如果你从一个最终我将要从事人工智能研究的角度审视我的经历,你会发现我的每一步选择都是朝向人工智能的,熟悉我的Bullfrog员工都知道,我写的所有游戏的核心都是与人工智能相关的。在16岁的时候写《主题公园》游戏的时候我第一次意识到如果我们全力以赴进行研究,人工智能的前景不可估量。这款游戏十分畅销,说明玩家享受其中,因为人工智能十分贴合玩家的心意。因此我继续在游戏领域进行拓展,然而在2000年的时候我感觉到我们已经在’从后门偷偷逼近‘人工智能研究的路上走到了尽头,因为不管怎么样你的最终目标都只是做出一款游戏,所以我转而去学习神经科学,以期在人工智能领域有所进展。”
Hassabis认为人工智能在90年代最直观的应用即是体现在游戏行业,那时,学术界的研究没有什么动静,一些诸如增强学习、深度学习、神经网络等新技术都没有得到应用与推广,所以游戏成为人工智能最好的应用领域,当然那时的人工智能与现在大相径庭,当时的人工智能更像是较为复杂的有限状态机(FSM),游戏Black &White中应用到了增强学习技术,到目前为止我仍旧认为这是在游戏中应用最复杂的案例。然而到了2004年左右,游戏行业发生了很大的变化,不再像90年代那样只要你有一个不错的点子就可以做一款游戏,游戏行业变得更加注重画面感,并且官方授权也变得十分重要,像FIFA系列游戏就是一个很好的例子。所以我认为做游戏不再像以前那样有趣了,并且我已经在游戏领域积蓄了创立Deepmind所需的信息与经验,这个时候神经科学引起了我的兴趣,我很想从明白大脑解决问题的过程中获得灵感,所以读一个神经科学的PhD再合适不过了。”
人工智能如何改变医疗领
人工智能的主要应用将会在医疗、智能手机助手、机器人科学领域,在医疗方面,目前认知计算系统IBM Watson已经着手进行癌症诊断的项目,据此,Deepmind表示几周之前已经开始了和NHS(英国国家医疗服务体系)的合作,构建一个可以应用机器学习智能的平台。Hassabis认为IBM Watson所做的工作与Deepmind团队的工作有所区别,癌症筛查更像是一个专家系统,是另一种形式的人工智能,这类人工智能所能做到的是进行图像方面的医学诊断,自我量化然后进行重要特征的横向比对以及大量的筛查,从而指导人们拥有更健康的生活方式,我认为把增强学习技术用于这个领域较为适宜。
对于与NHS的合作,Deepmind推出了一款并未有用到AI或是机器学习的应用程序,原因在于NHS软件自身来看较为落后,它们并不是移动端的,完全不适用于目前消费者的使用习惯,并且对于医生和护士来说这个软件十分低效。所以Deepmind首先会改善可视化与基础化信息,借此看清真正的需求,继而将更加熟练的机器运用其中。
未来核心应用领域
在第一天发布会的演讲中,Hassabis使用了电影《她》中的海报作为讲解的背景,对此他解释道:“关于智能手机助手的样子,《她》是较为盛行的主流观点,我的看法是应该让智能手机助手变得更加‘人性化’,使它能够对你的需求有更加深刻的理解。而目前大部分这样的系统都极为脆弱,一旦偏离了预先编程输入的模版,它们就会变得毫无用处。”
正如Hassabis所言,目前基本所有的智能手机助手都属于特殊案例和预编程的,这意味着它们很脆弱,只能做预编程写好的事。然而真实的世界非常混乱,用户们也会在你无法提前知晓的情况下,做着不可预知的事情。所以DeepMind 的信念是:通往人工智能的唯一道路,是从地基开始打起,而且变得通用。这也是最根本的原则之一。
针对这点该如何改进,Hassabis的看法是:”由于智能手机的输入十分多变,所以或许得输入有’上万吨’的数据,才可以从中学习到很多东西。根据AlphaGo 的算法,我们打算在未来几个月尝试的是,摆脱监督式学习的出发点,让它完全自我发挥,从一无所有的状态开始。它会需要更长的时间,因为当你采用随机方法的时候,其中的审查和错误会需要更多的时间训练,也许是几个月。但是,我们认为有这个可能性,让它从纯粹的学习中起步。“对于何时才能看到人工智能给市场带来显著性差异,Hassabis给出的答案是:”我认为在未来的两到三年会开始看到改善。我的意思是,这些改善在开始的时候是非常微小的,只有很小的部分会工作的更好。也许在未来的4 到5 年,甚至5 年更多,你可以看到智能手机在功能上大的变化。“
为何选择Google ?
事实上,AlphaGo 在比赛中并没有使用那么多硬件,然而Deepmind团队需要大量的硬件来训练它,做各种不同的版本,并让他们在云端互相比赛。这需要相当多的硬件才能高效完成,所以如果没有这些资源,在这段时间内根本无法完成。这也是Deepmind选择与Google合作的原因之一。
关于是否期待被纳入Google商业模式与产品路线图中,Hassabis认为:“在如何最优化研究进展方面,我们有很强的主导权。这是我们的使命,也是为什么我们加入了Google,这样我们可以给研究进行涡轮增压。这是发生在过去几年的事情。当然,我们实际上也致力于很多Google 内部的产品,但是他们是非常早期的阶段,所以还没准备好公布。当然我认为智能手机助手是非常核心的,我认为Sundar Pichai 已经对此谈了很多,这是Google 未来的核心。”
对于与Google Brain是否有合作,Hassabis表示:“其实我们是非常互补的。我们每周都有交谈。Google Brain 主要致力于深度学习,他们也有非常卓越的工程师Jeff Dean,所以他们已经铺开到公司的各个角落,这也是为什么我们发明出了令人惊喜的Google 图片搜索。他们正在做着现象级的工作。另外,他们的团队在山景城,所以他们离产品团队更近,他们的研究周期也更像12 到18 个月。而我们有更多算法开发的工作,我们倾向于为需要两三年研究的事情做研究,而且不需要在开始的时候就有直接的产品焦点。”
关注未来科学
关于机器人科学目前的发展状况,Hassabis认为它们或许有漂亮的躯干,但是依然缺乏智慧的“大脑”,与智能手机助手目前的状况相似,机器人目前似乎只能对预先进行编程的情况作出反应,一旦处于状况之外,机器人无疑会无所适从。因此如何通过机器学习强化机器人的能力十分重要。
对于科学习的机器人,Hassabis举出了一些直接使用的案例:“显然,自动驾驶汽车是一种机器人,但目前来说还是狭义的人工智能,虽然他们使用了计算机视觉里面一些可学习的人工智能——特斯拉采用了一种基于深度学习的标准、现场的计算机视觉方案。我相信日本在老年护理机器人、家庭清洁机器人上面有很多思考,我认为这对社会会非常有用。特别是在一个人口老龄化的社会里,我认为是一个非常紧迫的问题。“
对人类、机器人和人工智能在未来的交互,Hassabis的期望是:“我自己对机器人没多少思考。我自己对人工智能的使用感到兴奋的领域是科学,能够推动它更快的发展。我想看到人工智能未来能够辅助科学,如果有一个人工智能研究助手,它可以做很多乏味的工作,阅读有趣的论文,从海量的数据中找到结构,并把它们呈现到人类专家和科学家面前,以实现更快的技术突破。我几个月前在欧洲核子研究中心做演讲,很显然它们创造出比地球上任何地方都多的数据,我们都知道在它们海量的硬盘中,可能会有某个新的粒子发现,但没有人能抽出时间做这件事情,因为这里的数据量的确太过庞大。所以我觉得,如果有一天人工智能参与寻找到一个新的粒子,那么是一件非常酷的事。”