对话 DeepMind 创始人:AI 会如何重塑我们的世界?

本期#思维方式#,转载自“极客公园”(微信号:geekpark),为TheVerge对DeepMind联合创始人DemisHassabis的专访,由极客公园翻译,译者为“龟途慢慢”,本译文已获极客公园转载授权。

本期#思维方式#,转载自“极客公园”(微信号:geekpark),为 The Verge 对 DeepMind 联合创始人 Demis Hassabis 的专访,由极客公园翻译,译者为“龟途慢慢”,本译文已获极客公园转载授权。

DeepMind 在与李世石围棋比赛中的胜利又激发了人们对人工智能潜力的遐想。但是,谷歌这个名为 AlphaGo 的项目只是它很小一个计划而已——甚至不是主要的那个。就像 DeepMind 联合创始人 Demis Hassabis 所说,DeepMind 想去“解决智能方面的问题”,而且对如何完成这一任务,他的办法可不少。

为完成这一目标,Hassabis 自己有个不同寻常的成长路径:作为一个在象棋方面堪称神童的小朋友,他在智力运动会竞赛中赢得总冠军;之后,在很年轻时就凭借开发出几款电子游戏在英国一举成名;自然而然,他建立了自己工作室 Elixir;再之后,2005 年左右离开游戏行业,在神经科学领域读了一个博士学位,然后,他创建了 DeepMind。

在 AlphaGo 与李世石比赛的第一场胜利后,Hassabis 接受了 The Verge 访问。在 Hassabis 想法里,媒体这方面的事永远排在最后,但当他走进房间时,还是很开心的样子;而当有谷歌工作人员告诉他,昨晚有超过 3000 篇文章关注了 AlphaGo 比赛时,他表示了震惊。“这难以置信,对吧?”他说道:“看到这种有些深奥的东西变得受欢迎,这还挺有趣的。”

AlphaGo 外,对话还涉及到了视频游戏、下一代智能手机助手、DeepMind 在谷歌中扮演的角色、机器人、AI 怎样帮助科学研究等等。总之,这是一次深入的对话。

1,目前为止,对那些还不了解 AI 或围棋是什么的人,你如何从文化共鸣角度为他们描述昨天发生的一切?

围棋堪称是一种完全信息博弈的巅峰之作,仅就可能性来说,它的复杂程度远胜国际象棋,所以对自从“深蓝”之后的 AI 研究,围棋一直是一个重大挑战。正如你所知,即使我们已经付出很大努力,但我们所走的路还是很有限。

蒙特卡罗树搜索是我们在 10 年前得到的一个重要创新,但我认为我们为 AlphaGo 所做的是为其引入了神经网络中的直觉部分,而这才是真正能成为顶级围棋选手的条件:直觉。

当我看到麦克雷蒙在解说时也在计算目数时遇到困难,我觉得挺惊讶的,你要知道,他可是一位围棋九段选手!而这也表明了想要为围棋写出一套“价值网络”体系有多困难。

2,AlphaGo 有下出任何让你感到吃惊的行动吗?

有。当 AlphaGo 穿越棋盘进入李世石占优势领地时,我们感到相当震惊,而且我认为从李世石面部表情看,他也很震惊。我认为那绝对是出乎所有人意料的一招。

3,是因为那代表了一种侵略性吗?

也许是因为它的侵略性和胆大妄为吧。它在同李世石比赛中使用了李世石式下法。要知道,李世石就是以具有创造性战斗方式闻名于世,而这也是他昨天想展示出来的地方,我们对此也很期待。

从比赛一开始,布局未稳时,他就几乎在所有地方都展开了激战。但传统围棋程序并不擅长这种下棋方式,他们在本地计算时也不差,但它们通常都缺少对整个棋盘的大局观。

4,你们举行这五场比赛目的就是要去评估 AlphaGo 能力,无论输赢。你们从昨天比赛中得到了什么?

我猜我们学到的就是我们要沿着这条路继续向前走。你可以这样说:这并没有超出我们预期,但这也是我们所希望看到的。我们在赛前表示这场比赛胜负难料,大家都有 50% 几率获胜。我仍然认为我们说的没错,任何事都可能发生,而我也知道李世石在今天比赛中一定会调整战术。所以我对接下来的比赛仍充满兴趣。

让我们来谈谈到 AI 意义。你也许听我谈起过 AlphaGo 和“深蓝”间的差异,“深蓝”是个手工操作程序,程序员需要将国际象棋大师们的信息提取出来,将它们转化成为具体规则和启发;而 AlphaGo 则拥有更多学习能力,它能通过实践和学习获得成长,这是它更为人性的地方。

5,如果接下来的比赛继续以这种 AlphaGo 取胜方式结束,你们下一步计划是什么?会在未来开发另一款 AI 对战游戏吗?

我认为,对完全信息博弈来说,围棋已经是巅峰。当然,也许还有其他围棋高手等着我们去挑战。但对其他游戏,比如没有限制条件的扑克,那就非常困难了,因为那是一种不完全信息博弈的游戏。

而且也还有不少人类比计算机玩得好的项目,比如视频游戏,《星际争霸》就是其中一例。这种策略类游戏在信息不完全世界中需要一种更高层级的战略能力,也许我们可以称之为“只观察部分的情况”。而围棋就没那么复杂,你能看到棋盘上的一切,因此,计算机玩起来会更容易一些。

6,挑战《星际争霸》是你自己感兴趣的事吗?

也许吧。我们只对在我们研究主轨道上的项目感兴趣。因此,DeepMind 目的不是打游戏、找乐子、取悦观众,虽然它能做到这一切。从我个人来说,我喜欢打游戏,曾开发过电子游戏,但我们主要是将游戏作为一个测试平台,以此,我们能试着去写算法、也能测算出它们架构和能力。总之,游戏是个非常有效的测试方式。但最终,我们还是希望将其应用到现实生活。

7,我在 1990 年代末的英国长大,能看到不少电脑杂志和许多电子游戏,因此当我第一次见到 DeepMind 和你时,我想“你们可真是天生一对”,你之前在游戏行业中的经验和你现在所做的事有关联吗?

像 DeepMind 这样的事一直是我终极目标,我为此计划了 20 年。如果你始终观察我在 AI 领域做的这些事,你会发现它们都有自己作用。如果你对我之前开发的那些游戏有印象,你会知道 AI 就是我所做的所有事的核心。我们游戏卖出了上百万份,这是因为我们将 AI 融入到了人们玩的游戏中。之后,我又回到校园中去学习神经科学,那是因为我感觉在 2005 年左右,我们应该在 AI 领域中走得更远,但我当时却还被要求去做游戏,因为你的出版商们只想要游戏。

8,是不是因为在那个时代,游戏就是 AI 最显著的应用领域?

我想是的,而且我认为我们当时所做的就是最顶尖的 AI 技术。我想说在当时,学术水平还停留在 90 年代,而这些新技术还没真正得到普及,比如神经网络、深度学习等等。

因此,最好的 AI 技术就在游戏领域。那不是现在这种学习型 AI 技术,它们都还是停留在有限状态的机器,但已经很复杂了。像 Black & White 这样的游戏已经使用强化学习技术。

但在 2004、05 年时,游戏行业发展方向已与 1990 年代大为不同,1990 年代的游戏行业很有创造力、也很有趣,你能实践你任何想法。但到 2005 年左右,人们都将注意力放在了图像及版权这些方向上,所以它就不那么有趣了。我已为游戏付出一切,而现在到为 DeepMind 做准备的时候了。而我选择的方向就是神经科学,我想要从“大脑是如何解决问题”这个方向上获得灵感,所以我想,还有什么比去读一个神经科学博士更好的方法呢?

9,本周你提到说 AI 未来应用领域将集中在医疗保健、智能手机助手及机器人,让我们来聊聊这些。为提升医疗保健水平,像 IBM 和 Watson 这样的公司已开始有关癌症诊断方面工作,DeepMind 能带来什么呢?

目前它还处在初级阶段。我们前几周才和 NHS(英国国家医疗服务体系)展开合作,但那只是开始构建一个机器学习平台而已。

在我理解中,Watson 和我们做的完全是两码事,他们做的更像是个专家系统,那是一种完全不一样的 AI 样式。我认为这种 AI 是通过图像去诊疗癌症,之后也许能纵向跟踪你生命特征,然后帮人们拥有一个更健康的生活方式。我认为这非常适合强化学习技术。

10,和 NHS 成为合作伙伴,你已经宣布开发一个 App,但似乎没有太多 AI 或机器学习技术。你们是怎么想的?为什么是 NHS 而不是其他人?

NHS 软件系统在我看来就是一团糟,因此我想我们要做的第一步就是将其带入 21 世纪。他们不是移动的,和消费者所理解的处理方式也完全不一样,对医护人员来说也非常糟糕。因此我想第一步,还是去帮他们使用更有效的工具,比如可视化工具和基础统计工具。我觉得我们已经做到这一点,之后我们会将更复杂的机器学习技术带入其中。

11,让我们再聊聊智能手机助手吧。我发现你在当天演讲中使用了电影《她》一张图片,这难道就是最终结果吗?

当然不是,我的意思是说《她》是现在主流观点。我只是觉得我们想让这些智能手机助手变得智能、能够情境化,并可以对我们想做的事有一个更深理解。而目前,大多数系统还非常脆弱,一旦你使用他们没预先编程的模板,他们就完全没用了。所以这还是有关实用性、灵活性以及可靠性问题。

12,那你们需要什么样的突破以提升它?为什么我们不能明天就用上它呢?

事实上是可以的,我只是觉得我们需要一种不同方式。再说一次,这是在预先编程和自我学习之间的对立,而目前几乎所有智能手机助手都采用的是预先编程方式,因此它们也非常脆弱,因为它们只能做已经编程好了的事。

但真实世界是非常复杂的,用户会用你做许多你意想不到的事。而我们对 DeepMind 的坚信就在于这个基本原则:你研究智能的唯一办法,就是从根本性和普遍性上学习。

13,AlphaGo 成功的方法是学到许多不同游戏模式,但这种方法如何应用到智能手机中呢?毕竟人们向智能手机输入的内容五花八门。

我同意你的意见,因此数据量非常大,而你可以从中进行学习。事实上,我们将在接下来几个月继续调整 AlphaGo 算法,我们认为我们可以摆脱监督式学习方式,能完全做到自我发挥,能从一张白纸成长起来。

这段路可能会很长,因为你需要测试和犯错误,所以也许我们需要几个月。但我们觉得让 AlphaGo 由纯粹的自我学习成长起来是可能的。

14,这可能吗?你们算法已经达到这个程度了吗?

不,我们可以在算法没达到之前就能完成。因为它不是开发出更强大程序,我们只是让它使用纯粹学习方法。我们认为目前这个算法能在没有监督情况下运行。

15,这会更容易吗?比如它的失败迹象会更明显吗?

会更容易,因为分数会变得更规则。在围棋中,想要判断你胜负,你只需得到一个分数就够了,这被称为所谓的“信用分配问题”,它的问题在于当你在围棋中下了一百颗棋子后,你并不知道哪些是让你赢、哪些是让你输了的,因此,判断信号会变得相当微弱。而在其他一些游戏中,你所做的大多数举动都能给你一个分数,因此你会有效仿的对象。

16,你能给出一个时间表吗?何时人们才能在手机上见到这些变化?

接下来两到三年中,人们就能见到这些变化。我的意思是,它的开始是很微妙的,只是让某些方面变得更好了;但也许四到五年后,你就能开始看到一些大变化。

17,根据你所确定的未来可能性,这会是让你们同谷歌连接起来成为一个整体的那一部分?

是的。

18,你有没得到任何指示去让你上面提到的这些技术契合到谷歌产品路线图中?

没有,对我们想要做的事,我们有自由选择权。那就是我们的使命,也是我们选择加入谷歌的原因,过去几年它从未改变。

当然,我们也同许多谷歌内部产品一起工作,但还都在非常初级阶段,因此谷歌还不想谈论这些。智能手机助手当然是我认为非常重要的核心部分,我也认为 Sundar Pichai 也已多次谈论过将其作为谷歌未来发展核心了。

19,Google 自己也有一些创新部门,比如 Google Brain,它们也面向用户推出像 Google Photos 这样的机器学习产品。

这样的产品到处都是。

20,你觉得你们和 Google Brain 有互动吗?你们之间的工作有重叠地方吗?

当然有,事实上我们是非常互补的部门,每周都有交流,Brain 主要关注在深度学习方面,他们也有像 Jeff Dean 这样杰出的工程师,因此能融入到公司每个角落,这也是为什么我们能见到 Google Photos 这样优秀产品的原因。

他们目前正着手进行一项非常重要的工作,因为他们部门在 Moutain View,所以离产品部门更近,也有 12-18 个月不等的研究周期。而我们则更多关注在算法开发,我们想要做的事通常时间周期都在两到三年间,我们不需要在一开始就关注在产品上。

21,谷歌对 AlphaGo 的帮助大吗?如果没有他们,你能完成这项工作吗?

谷歌的帮助当然很大。AlphaGo 在硬件上的运行要求并不大,但需要很多硬件设施去训练它、去测试不同版本并在谷歌云端进行比赛训练。这些都对硬件设施有很高要求,因此我们不可能在没有这些资源情况下、在这个时间范围内完成它。

22,我驻扎在日本,这里被认为是机器人的精神家园。我认为机器人目前在这个国家在两个方向上被使用,Fanuc 这样的公司制造工业化机器人,能在一个固定用途上做出令人惊讶的工作;而像软银 Pepper 这样的公司则开发一些礼宾式机器人,他们很有野心却又用途有限。你的想法是?

是的,就像你所说的 Fanuc 一样,他们产品有很出色的身体机能,但缺少智慧。而那些礼宾式机器人则更像是智能手机助手,都是使用模板进行预先编程那种样式,如果你做了什么他们无法理解的事,他们会非常困惑。

所以我猜目前最显而易见的问题,就是像机器学习这样的技术,如何才能推动机器人的能力发展。这是两种完全不同的思路,我们人类从基础上就拥有了学习新事物和应对突发事件的能力,而我认为这才是机器人或软件在真实世界中所需具备的能力,他们也需要拥有正确使用这种能力的方法。我觉得机器人的学习路径最终会走上正轨。

23,目前你能看到的最直接使用学习方法的机器人案例是哪个?

我还没太想过这个问题。自动驾驶汽车会是其中一种,但他们目前使用 AI 场景太有限,尽管它们能在计算机视觉方面使用 AI 学习技术,Tesla 就使用了基于深度学习的计算机视觉技术。

我相信在日本肯定思考过不少这方面的事,比如能照顾老人的机器人,或是家庭清扫方向的机器人,它们都会在社会中非常有用,尤其是在一个人口老龄化问题严重的国家。

24,为什么这种更加以学习为基础的方法会对实际使用有这么大帮助?

你只需去思考“为什么我们还没有这些东西”就好了。为什么我们还没一个能清扫家庭的机器人?就是因为我们每个人家里都不同,比如布置、家具之类,即使是你自己的房子,它每天状况甚至都不同,有时很乱、有时又没那么乱。

因此,你不可能使用一个预先编程的办法去解决你家庭清扫问题,并且在类似衣物折叠这类问题上,你还会有自己喜好,这就更复杂了。我们觉得这些问题对人类没什么难的,但事实上我们所处理的是非常复杂的问题。

25,这只是一个个人好奇,你有机器人吸尘器吗?

额…我们没买,但它真的不是很好用…

26,我买了一个,它不是“特别”好用,但我发现我能学习到它那些怪癖并能与它一起工作,因为我很懒,而它所带来的好处值得我付出这些。所以我很好奇:当我们拥有了更先进机器人时,那个“足够好”的引爆点是哪个?我们会在它能达到有意义的人类层面的交互之前就停止前进吗?

有可能。我想我们每个人都会去购买价格合理的机器人,因为它能处理垃圾、帮我们打扫卫生,无论如何,这些非常蠢的机器人确实很受欢迎,而它们也确实没有任何智能的地方。因此,我想我们所进的每一步都会是非常有用的。

27,你对未来人类、机器人与 AI 间的互动有什么期待?很明显,人们目前都在科幻小说中幻想美丽场景。

我自己并不会做太多机器人方面的想象,真正令我感兴趣的还是 AI 在科学上的应用以及它的进步和发展。我想要看到 AI 助手在科学上帮助人类处理很多艰苦工作、检索有趣的文章、在大量数据中发现相关结构、并协助那些真正能做出重大突破的人类科学家去工作。

几个月前,我和欧洲粒子物理研究所有一场对话,很明显他们创造出的数据比地球上任何人都要多,而我们都知道可能有新粒子就躺在那些海量的硬盘中,但没有人能够分析出它们,因为数据实在是太多。因此,我想如果有一天 AI 能参与到发现新粒子过程中去,那会是非常酷的一件事。

相关推荐

评论 抢沙发

取 消
暂无评论...