logo
客服资讯
活着界上最复杂的棋类游戏——围棋上 欧洲冠军都输给谷歌AI了

  围棋是最简单的游戏:三分钟就能学会怎么下;围棋同时也是世界上最难的游戏,下六十年都不敢说本身真正学会了。

活着界上最复杂的棋类游戏——围棋上 欧洲冠军都输给谷歌AI了


  计算机目前已经在很多智力游戏比赛上克服了人类顶级选手,包括国际象棋、五子棋、诟谇棋、拼字游戏等等。而对于有着2500年历史的东方游戏围棋——比国际象棋要复杂得多——人类始终能够保持在和计算机对决中的胜利。

  长期以来,绝大部分科学家和围棋业内人士认为,计算机在围棋比赛中不可能克服人脑,计算机围棋程序如同人工智能领域里的哥德巴赫猜想,还无法像“深蓝”击败卡斯帕罗夫那样击败顶尖围棋高手。

  然而今天,英国《天然》杂志封面论文讲述了如许一个故事:Google旗下的深度学习团队Deepmind开发的人工智能围棋软件AlphaGo,以5:0克服了围棋欧洲冠军樊麾。这是计算机程序第一次能在不让子的情况下,在完备的围棋游戏中击败专业选手——这本来被认为是十年后人工智能才能达到的成就。

活着界上最复杂的棋类游戏——围棋上 欧洲冠军都输给谷歌AI了

描述AlphaGo研究成果的论文成为了1月28日的《天然》杂志的封面文章

活着界上最复杂的棋类游戏——围棋上 欧洲冠军都输给谷歌AI了

  与“AlphaGo”一较高下的棋手是2013年至2015年的欧洲围棋冠军樊麾。樊麾1981年12月 27日生于陕西西安,1996年初段,2000年二段。少年时期曾入选过中国国少队。随后移民法国,目前是法国国家围棋队总教练,已经延续三年赢得欧洲围棋冠军的称号。

活着界上最复杂的棋类游戏——围棋上 欧洲冠军都输给谷歌AI了


  Nature采访了樊麾,问他被机器击败是什么感觉,同时采访了围棋与人工智能两方面的专家,问他们展望AI最终挑衅世界冠军李世乭是否会成功。

  “在中国,围棋不仅仅是一种游戏,也是生活的一壁镜子。你在围棋中碰到的题目,可能也反映着生活中的题目。”

  失败的感觉是很难受的。在与AlphaGo对弈之前,我一向以为我会赢。第一局之后,我改变了策略,努力应对挑衅,但最终照旧输了。我觉得重要题目在于,人类是会犯错的,由于我们是人类。我们会累,会因求胜欲望过于强烈而感到压力,但计算机程序就不会如许。它们很壮大,又很稳固,就像一堵墙一样。在我看来,这就是机器与人类的最大区别。假如事先没人告诉我AlphaGo是个机器的话,我会以为对手是人类——或许棋路有些新鲜,但很强,是个真正的人类。

活着界上最复杂的棋类游戏——围棋上 欧洲冠军都输给谷歌AI了


  输了比赛当然不会感到开心,但所有的职业棋手都会输棋。输棋以后我就会研究棋局,或许也会改变我的策略。我觉得这对我的未来是有益处的。


  人工智能克服人类围棋到底有多难?

  1997年,由IBM公司设计的会下国际象棋的计算机“深蓝”在全世界媒体的关注下首次完成电脑击败人脑的惊人挑衅,开创了此后的人工智能博弈时代。

  深蓝”能够展望出对手下一步会怎么走,而且计算力远高于人类。但是,围棋要复杂得多。国际象棋每一步平均只有35种可能性的走法,但是围棋呢——在19*19的棋盘内,共有361个点,就机器学习的角度而言,围棋的计算最大有3^361次方种局面,大致的体量是10^170,而已经观测到的宇宙中,原子的数量才1080。国际象棋最大只有2155种局面,称为香农数,大致是1047。

活着界上最复杂的棋类游戏——围棋上 欧洲冠军都输给谷歌AI了


  面对任何棋类,一种直观又偷懒的思路是暴力列举所有能赢的方案,这些方案会形成一个树形地图。AI只要根据这个地图下棋就能永久胜利。然而,围棋一盘大约要下150步,每一步有250种可选的下法,所以粗略来说,要是AI用暴力列举所有情况的体例,围棋必要计算250^150种情况,大致是10^360。相对的,国际象棋每盘大约80步,每一步有35种可选下法,所以只要算35^80种情况,也许是10^124。无论如何,枚举所有情况的方法不可行,所以研究者们必要用巧妙的方法来解决题目,他们选择了模拟人类大师的下棋体例。

  因此,从2014年至2015年间,包括Facebook、爱丁堡大学、DeepMind等人工智能研究团队都将围棋人工智能体系的突破方向瞄准为——使得程序能够模拟人类的直觉式思维。

  机器学习

  研究者们祭出了终极杀器——“深度学习”(Deep Learning)。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶主动汽车,天然语言处理,识别声音,分析生物信息数据等特别很是复杂的义务。

  AlphaGo究竟厉害在哪里?AlphaGo的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的义务在于合作“遴选”出那些比较有前途的棋步,抛弃显明的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

  其中,“值网络”负责削减搜索的深度——AI会一边推算一边判断局面,局面显明劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责削减搜索的宽度——面对面前目今的一盘棋,有些棋步是显明不该走的,比如不该随便送子给别人吃。将这些信息放入一个概率函数,AI就不用给每一步以同样的正视程度,而可以重点分析那些有戏的棋着。

活着界上最复杂的棋类游戏——围棋上 欧洲冠军都输给谷歌AI了



AlphaGo所使用的神经网络结构示意图

  AlphaGo行使这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推测将来的局面一样。如许AlphaGo在分析了比如将来20步的情况下,就能判断在哪里下子赢的概率会高。

  研究者们用很多专业棋局训练AI,这种方法称为监督学习(supervised learning),然后让AI和本身对弈,这种方法称为强化学习(reinforcement learning),每次对弈都能让AI棋力精进。然后他就能克服冠军啦!

  人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了充足的训练,就能击败所有的人类选手。

活着界上最复杂的棋类游戏——围棋上 欧洲冠军都输给谷歌AI了


  DeepMind的研究者David Silver透露表现,“在与其它神经网络和它本身对战数百万局后,AlphaGo学会了本身发现新策略,并渐渐进步了水平。”

活着界上最复杂的棋类游戏——围棋上 欧洲冠军都输给谷歌AI了


  正是这种方法帮AlphaGo超越了其它围棋AI体系,包括Crazystone。但事情还没完,研究人员随后将效果再反馈给第二个神经网络。了解前任的走法了,第二个神经网络会使用很多雷同的技术来判断每一步的后果。这一过程与深蓝等旧体系在国际象棋上的做法类似,只是它会在下棋过程中学习,分析更多数据,而非暴力破解所有可能的步骤。如许,AlphaGo不仅能克服AI,还能克服顶尖人类选手了。

  AlphaGo突破的意义在哪?

  AlphaGo的紧张性不言而喻。同样的技术还能用于机器人和科学研究,以及类似于Siri的数字助理和金融体系。深度学习创业Skymind的创始人Chris Nicholson就认为,技术“能用于任何对抗性题目,任何类似于游戏且必要策略的事情,包括战争、商业和交易”。

  对有些人来说,这是一件值得担心的事,分外是DeepMind的体系还能本身学会下围棋。它不仅能从人类提供的数学中学习,还能生成本身的数据,在与本身下棋中学习。特斯拉创始人埃隆·马斯克等大佬多次声明,这类AI体系会最终超越人类智能,离开掌控。

  幸而DeepMind的体系还在Hassabis等人的控制之下。虽然他们用体系破解了复杂的游戏,但这仍只是个游戏。AlphaGo离人类智能还很远,更不论超级智能了。下棋是一种高度结构化的情景,体系也没有人类级别的理解力。但它代表了一种方向,即假如AI能理解围棋,它也会理解更多事。假如宇宙就是一局超大型的围棋呢?

  不屈不挠 AlphaGo将在今年3月挑衅李世石

  AlphaGo将于3月间挑衅韩国棋手李世石(朝鲜汉字:李世乭),当来世界围棋最强者之一,奖金是100万美金,由Google提供。

活着界上最复杂的棋类游戏——围棋上 欧洲冠军都输给谷歌AI了

李世石


  李世石曾多次赢得世界冠军。“这是第一次有电脑在公平规则下挑衅人类顶级职业围棋手,我很幸运成为这名棋手,”李世石说,“作为人类代表,信赖这一次我还能赢。”

  祝你好运。


(声明:本站发布的内容图片、视频和文字以用户投稿、网络转载为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。联系QQ:3436855069 联系邮箱:kefuxitong@foxmail.com )
(作者:佚名编辑:admin)
最新文章
推荐文章
热门文章