活着界上最复杂的棋类游戏——围棋上欧洲冠军都输给谷歌AI了-在线客服系统选购网站

活着界上最复杂的棋类游戏——围棋上欧洲冠军都输给谷歌AI了

　　围棋是最简单的游戏：三分钟就能学会怎么下；围棋同时也是世界上最难的游戏，下六十年都不敢说本身真正学会了。

　　计算机目前已经在很多智力游戏比赛上克服了人类顶级选手，包括国际象棋、五子棋、诟谇棋、拼字游戏等等。而对于有着2500年历史的东方游戏围棋——比国际象棋要复杂得多——人类始终能够保持在和计算机对决中的胜利。

　　长期以来，绝大部分科学家和围棋业内人士认为，计算机在围棋比赛中不可能克服人脑，计算机围棋程序如同人工智能领域里的哥德巴赫猜想，还无法像“深蓝”击败卡斯帕罗夫那样击败顶尖围棋高手。

　　然而今天，英国《天然》杂志封面论文讲述了如许一个故事：Google旗下的深度学习团队Deepmind开发的人工智能围棋软件AlphaGo，以5：0克服了围棋欧洲冠军樊麾。这是计算机程序第一次能在不让子的情况下，在完备的围棋游戏中击败专业选手——这本来被认为是十年后人工智能才能达到的成就。

描述AlphaGo研究成果的论文成为了1月28日的《天然》杂志的封面文章

　　与“AlphaGo”一较高下的棋手是2013年至2015年的欧洲围棋冠军樊麾。樊麾1981年12月 27日生于陕西西安，1996年初段，2000年二段。少年时期曾入选过中国国少队。随后移民法国，目前是法国国家围棋队总教练，已经延续三年赢得欧洲围棋冠军的称号。

　　Nature采访了樊麾，问他被机器击败是什么感觉，同时采访了围棋与人工智能两方面的专家，问他们展望AI最终挑衅世界冠军李世乭是否会成功。

　　“在中国，围棋不仅仅是一种游戏，也是生活的一壁镜子。你在围棋中碰到的题目，可能也反映着生活中的题目。”

　　失败的感觉是很难受的。在与AlphaGo对弈之前，我一向以为我会赢。第一局之后，我改变了策略，努力应对挑衅，但最终照旧输了。我觉得重要题目在于，人类是会犯错的，由于我们是人类。我们会累，会因求胜欲望过于强烈而感到压力，但计算机程序就不会如许。它们很壮大，又很稳固，就像一堵墙一样。在我看来，这就是机器与人类的最大区别。假如事先没人告诉我AlphaGo是个机器的话，我会以为对手是人类——或许棋路有些新鲜，但很强，是个真正的人类。

　　输了比赛当然不会感到开心，但所有的职业棋手都会输棋。输棋以后我就会研究棋局，或许也会改变我的策略。我觉得这对我的未来是有益处的。

　　人工智能克服人类围棋到底有多难？

　　1997年，由IBM公司设计的会下国际象棋的计算机“深蓝”在全世界媒体的关注下首次完成电脑击败人脑的惊人挑衅，开创了此后的人工智能博弈时代。

　　深蓝”能够展望出对手下一步会怎么走，而且计算力远高于人类。但是，围棋要复杂得多。国际象棋每一步平均只有35种可能性的走法，但是围棋呢——在19*19的棋盘内，共有361个点，就机器学习的角度而言，围棋的计算最大有3^361次方种局面，大致的体量是10^170，而已经观测到的宇宙中，原子的数量才1080。国际象棋最大只有2155种局面，称为香农数，大致是1047。

　　面对任何棋类，一种直观又偷懒的思路是暴力列举所有能赢的方案，这些方案会形成一个树形地图。AI只要根据这个地图下棋就能永久胜利。然而，围棋一盘大约要下150步，每一步有250种可选的下法，所以粗略来说，要是AI用暴力列举所有情况的体例，围棋必要计算250^150种情况，大致是10^360。相对的，国际象棋每盘大约80步，每一步有35种可选下法，所以只要算35^80种情况，也许是10^124。无论如何，枚举所有情况的方法不可行，所以研究者们必要用巧妙的方法来解决题目，他们选择了模拟人类大师的下棋体例。

　　因此，从2014年至2015年间，包括Facebook、爱丁堡大学、DeepMind等人工智能研究团队都将围棋人工智能体系的突破方向瞄准为——使得程序能够模拟人类的直觉式思维。

　　机器学习

　　研究者们祭出了终极杀器——“深度学习”（Deep Learning）。深度学习是目前人工智能领域中最热门的科目，它能完成笔迹识别，面部识别，驾驶主动汽车，天然语言处理，识别声音，分析生物信息数据等特别很是复杂的义务。

　　AlphaGo究竟厉害在哪里？AlphaGo的核心是两种不同的深度神经网络。“策略网络”（policy network）和 “值网络”（value network）。它们的义务在于合作“遴选”出那些比较有前途的棋步，抛弃显明的差棋，从而将计算量控制在计算机可以完成的范围里，本质上和人类棋手所做的一样。

　　其中，“值网络”负责削减搜索的深度——AI会一边推算一边判断局面，局面显明劣势的时候，就直接抛弃某些路线，不用一条道算到黑；而“策略网络”负责削减搜索的宽度——面对面前目今的一盘棋，有些棋步是显明不该走的，比如不该随便送子给别人吃。将这些信息放入一个概率函数，AI就不用给每一步以同样的正视程度，而可以重点分析那些有戏的棋着。

AlphaGo所使用的神经网络结构示意图

　　AlphaGo行使这两个工具来分析局面，判断每种下子策略的优劣，就像人类棋手会判断当前局面以及推测将来的局面一样。如许AlphaGo在分析了比如将来20步的情况下，就能判断在哪里下子赢的概率会高。

　　研究者们用很多专业棋局训练AI，这种方法称为监督学习（supervised learning），然后让AI和本身对弈，这种方法称为强化学习（reinforcement learning），每次对弈都能让AI棋力精进。然后他就能克服冠军啦！

　　人类在下棋时有一个劣势，在长时间比赛后，他们会犯错，但机器不会。而且人类或许一年能玩1000局，但机器一天就能玩100万局。所以AlphaGo只要经过了充足的训练，就能击败所有的人类选手。

　　DeepMind的研究者David Silver透露表现，“在与其它神经网络和它本身对战数百万局后，AlphaGo学会了本身发现新策略，并渐渐进步了水平。”

　　正是这种方法帮AlphaGo超越了其它围棋AI体系，包括Crazystone。但事情还没完，研究人员随后将效果再反馈给第二个神经网络。了解前任的走法了，第二个神经网络会使用很多雷同的技术来判断每一步的后果。这一过程与深蓝等旧体系在国际象棋上的做法类似，只是它会在下棋过程中学习，分析更多数据，而非暴力破解所有可能的步骤。如许，AlphaGo不仅能克服AI，还能克服顶尖人类选手了。

　　AlphaGo突破的意义在哪？

　　AlphaGo的紧张性不言而喻。同样的技术还能用于机器人和科学研究，以及类似于Siri的数字助理和金融体系。深度学习创业Skymind的创始人Chris Nicholson就认为，技术“能用于任何对抗性题目，任何类似于游戏且必要策略的事情，包括战争、商业和交易”。

　　对有些人来说，这是一件值得担心的事，分外是DeepMind的体系还能本身学会下围棋。它不仅能从人类提供的数学中学习，还能生成本身的数据，在与本身下棋中学习。特斯拉创始人埃隆·马斯克等大佬多次声明，这类AI体系会最终超越人类智能，离开掌控。

　　幸而DeepMind的体系还在Hassabis等人的控制之下。虽然他们用体系破解了复杂的游戏，但这仍只是个游戏。AlphaGo离人类智能还很远，更不论超级智能了。下棋是一种高度结构化的情景，体系也没有人类级别的理解力。但它代表了一种方向，即假如AI能理解围棋，它也会理解更多事。假如宇宙就是一局超大型的围棋呢？

　　不屈不挠 AlphaGo将在今年3月挑衅李世石

　　AlphaGo将于3月间挑衅韩国棋手李世石（朝鲜汉字：李世乭），当来世界围棋最强者之一，奖金是100万美金，由Google提供。

李世石

　　李世石曾多次赢得世界冠军。“这是第一次有电脑在公平规则下挑衅人类顶级职业围棋手，我很幸运成为这名棋手，”李世石说，“作为人类代表，信赖这一次我还能赢。”

　　祝你好运。

（声明：本站发布的内容图片、视频和文字以用户投稿、网络转载为主，如果涉及侵权请尽快告知，我们将会在第一时间删除。文章观点不代表本网站立场，如需处理请联系客服。联系QQ：3436855069 联系邮箱：kefuxitong@foxmail.com ）

上一篇：人工智能之父马文•明斯基逝世，又一颗科技巨星陨落
下一篇：P2P金融企业如何做好客户服务？

(作者：佚名编辑：admin)