AlphaGo横空出世,为什么能超越人类视线距离极限极限

自学3天碾压Master!AlphaGo Zero横空出世,彻底摆脱人类知识自学3天碾压Master!AlphaGo Zero横空出世,彻底摆脱人类知识猪猪驴教练百家号据国外媒体报道,谷歌旗下人工智能公司DeepMind新开发的AlphaGo Zero自学成才,以100比0战绩击败上代AlphaGo。Deep Mind发表的论文人工智能的最大挑战是研发一种能从零开始、以超人类的水平学习复杂概念的算法。为了打败人类围棋世界冠军,科学家在训练上一款AlphaGo时,同时用到了监督式学习(基于上百万种人类专业选手的下棋步骤)和基于自我对弈的强化学习。那款AlphaGo的训练过程长达几个月,用到多台机器和48个TPU(神经网络训练所需的专业芯片)。本文中,英国DeepMind的David Silver, Julian Schrittwieser, Karen Simonyan, Demis Hassabis和同事介绍了AlphaGo Zero,它的学习从零开始,且单纯基于与自己的对弈。人类的输入仅限于棋盘和棋子,没有任何人类数据。AlphaGo Zero仅用到一张神经网络,这张网络经过训练,专门预测程序自身的棋步和棋局的赢家,在每次自我对弈中进步。新程序只使用一台机器和4个TPU。通过几天的训练——包括近500万局自我对弈——AlphaGo Zero便能够超越人类并打败所有之前的AlphaGo版本。随着程序训练的进行,它独立发现了人类用几千年才总结出来的围棋规则,还建立了新的战略,为这个古老的游戏带来新见解。迄今最强大的围棋程序:不使用人类的知识DeepMind这篇最新的Nature,有一个朴素的名字——《不使用人类知识掌握围棋》。DeepMind 研究人员介绍 AlphaGo Zero。视频来源:DeepMind,视频中英文字幕由Nature 上海办公室制作这篇论文的最大亮点,在于无需任何人类指导,通过全新的强化学习方式自己成为自己的老师,在围棋这一最具挑战性的领域达到超过人类的精通程度。相比起之前使用人类对弈的数据,这一算法训练时间更短,仅用3天时间就达到了击败李世石的AlphaGo Lee的水平,21天达到了之前击败柯洁的AlphaGo Master的水平。在3天内——也就是AlphaGo Zero在击败AlphaGo Lee之前,曾进行过490万次自我对弈练习。 相比之下,AlphaGo Lee的训练时间长达数月之久。AlphaGo Zero不仅发现了人类数千年来已有的许多围棋策略,还设计了人类玩家以前未知的的策略。这是AlphaGo的终曲,也是一个全新的开始,相关技术将被用于造福人类,帮助科学家认识蛋白质折叠,制造出治疗疑难杂症的药物,开发新材料,以制造以出更好的产品。谨以下面的小传,致敬AlphaGo,以及研发AlphaGo的人:AlphaGo姓名:AlphaGo(Fan,Lee,Master,Zero)别名:阿老师,阿尔法狗生日:2014年出生地:英国伦敦1击败樊麾2015年10月,AlphaGo击败樊麾,成为第一个无需让子即可在19路棋盘上击败围棋职业棋手的电脑围棋程序,写下了历史,相关成果在2016年1月发表于Nature2击败李世石2016年3月,AlphaGo在一场五番棋比赛中4:1击败尖端职业棋手李世石,成为第一个不借助让子而击败围棋职业九段棋手的电脑围棋程序,再创历史。五局赛后韩国棋院授予AlphaGo有史以来第一位名誉职业九段3排名短暂超越柯洁日,AlphaGo在Go Ratings网站的排名升至世界第一。但几天之后被柯洁反超。4化名“Master”横扫棋界2016年底至2017年年初,再度强化的AlphaGo以“Master”为名,在未公开其真实身份的情况下,借非正式的网络快棋对战进行测试,挑战中韩日台的一流高手,60战全胜5战胜柯洁,成为世界第一至27日乌镇围棋峰会,最新的强化版AlphaGo和世界第一棋手柯洁对局,并配合八段棋手协同作战与对决五位顶尖九段棋手等五场比赛,获取3比零全胜的战绩,团队战与组队战也全胜。这次AlphaGo的运算资源消耗仅李世石版本的十分之一。在与柯洁的比赛结束后,中国围棋协会授予AlphaGo职业围棋九段的称号。本文由百家号作者上传并发布,百家号仅提供信息发布平台。文章仅代表作者个人观点,不代表百度立场。未经作者许可,不得转载。猪猪驴教练百家号最近更新:简介:分享NBA等篮球联赛最新赛事!作者最新文章相关文章AlphaGo Zero横空出世 英国为何能扛起AI创新的大旗?|AlphaGo|人工智能|英国_新浪科技_新浪网
AlphaGo Zero横空出世 英国为何能扛起AI创新的大旗?
  作者:薛皎
  英国当地时间10月18日,来自伦敦的DeepMind公司公布了最强版AlphaGo,代号AlphaGo Zero。AlphaGo Zero通过零基础学习,在短短3天时间里,其水平已经超越此前所有版本的AlphaGo。英国在人工智能方面的发展一直走在世界前列,DeepMind在此诞生并非巧合。
  丰厚的学术资源、创新氛围以及政府大力支持,使得过去3年,几乎每周都有一家新的人工智能公司在英国创立。预计到2035年,人工智能将为英国经济额外增加超过8千亿美元的收入。
  来自伦敦的Blippar公司创立于2011年,最初致力于设计AR应用程序,在去年3月,转型成为人工智能视觉搜索引擎。目前Blippar已融资超过1亿美元,估值超过15亿美元。
  Blippar联合创始人安博里斯告诉记者,随着人工智能技术的不断成熟,将AI融入到AR应用中,并在特定场景下结合VR效果,将使体验者无论从视觉还是意识形态上获得更加真实的感受,这也是人工智能领域未来发展的趋势之一。
对趣店和众安而言,如果你将它们看作互联网公司,就不能仅仅关注当下的收入和盈利情况,而是将目
华为成立到现在,一直由任正非亲力指导决策,从来没有为了任何管理制度问题而影响业务发展。
AlphaGo已经学会很多人类的定式,也下出了自己的定式。现在职业棋手有时就在使用AlphaGo的定式。AlphaGo Zero横空出世 完全自学21天虐Master_凤凰体育
AlphaGo Zero横空出世 完全自学21天虐Master
用微信扫描二维码分享至好友和朋友圈
据Verge等外媒报道,专注于推进人工智能(AI)研究的谷歌子公司DeepMind今天发布了一款新版本的AlphaGo程序,它能通过自学玩转多种游戏。这套系统名为&AlphaGo Zero
据Verge等外媒报道,专注于推进人工智能(AI)研究的谷歌子公司DeepMind今天发布了一款新版本的AlphaGo程序,它能通过自学玩转多种游戏。这套系统名为&AlphaGo Zero&,它通过一种名为&强化学习&的机器学习技术,可以在与自己的对决游戏中吸取教训。在击败韩国棋神李世石,并且今年5月击败&世界围棋第一人&柯洁后,AlphaGo迎来了一次新生。昨天,DeepMind 在《自然》杂志上发表了一篇论文,正式介绍了这个人工智能围棋程序及其演化:- AlphaGo Zero从零开始自我学习下围棋。- 仅仅36小时后,AlphaGo Zero靠着自我学习,就摸索出所有基本且重要的围棋知识,达到了与李世石九段对战的AlphaGo v18的相同水平。- 30天后,不断进步的AlphaGo Zero达到了Master的水平。Master即年初在网上达成60连胜的AlphaGo版本。- 40天后,AlphaGo Zero对战Master达到近90%胜率,成为有史以来AlphaGo的最强版本。之前的AlphaGo版本首先基于数千场人类围棋比赛来训练如何学习围棋。但AlphaGo Zero跳过了这一步,从自己完全随机的下围棋开始来学习围棋。通过这种&无师自通&的方式,它快速超越了人类棋手的水平,并且以100:0 的比分打败了之前战胜世界冠军的AlphaGo,堪称&最强棋手&。硬件和算法上的变化才是系统更加强大和高效的重要原因。AlphaGo Zero的运作非常高效,它只需要一台机器和4个TPU。在训练过程中,AlphaGo Zero每下一步需要思考的时间是0.4秒。由于是自我对弈学习下棋,并且是在世界上最强大的棋手&&AlphaGo本身学起,AlphaGo Zero很快超过了人类水平,并且走出了很多新的步法。利用&强化学习&的新模式,从一个对围棋一无所知的神经网络开始,将该神经网络和一个强力搜索算法结合,自我对弈。在对弈过程中,神经网络不断调整、升级,预测每一步落子和最终的胜利者。等级分排名(在围棋等竞争性比赛中对选手的相关技巧的水平的度量):显示AlphaGo 如何在发展过程中逐渐变得强大。AlphaGo的首席研究员大卫&席尔瓦(David Silver)表示,&由于未引入人类棋手的数据,AlphaGo Zero远比过去的版本强大,我们去除了人类知识的限制,它能够自己创造知识。DeepMind联合创始人宣布了AlphaGo Zero面世的消息,并称公司&要解决的是智能上的问题&与此前的AlphaGo一大不同之处在于,AlphaGo Zero仅用了单一的神经网络。在此前的版本中,AlphaGo 用到了&策略网络&来选择下一步棋的走法,以及使用&价值网络&来预测每一步棋后的赢家。而在新的版本中,这两个神经网络合二为一,依靠的是其高质量的神经网络来评估下棋的局势,从而让它能得到更高效的训练和评估。AlphaGo Zero中的自我对抗强化学习这一进展标志着通用型AI发展的大一里程碑。大多数AI被认为&用途有限&,因为它们只能执行单一任务,例如,翻译、识别面孔。但通用型AI在许多不同任务上拥有超越人类的潜能。像AlphaGo Zero就正在研究蛋白质如何折叠的问题,这是一个艰难的科学挑战,不过有望成为药物发明的一大突破。类似的其他结构性问题如减少能耗和寻找新材料也有望利用通用型AI来完成。
用微信扫描二维码分享至好友和朋友圈
凤凰体育官方微信
播放数:127244
播放数:141670
播放数:136715
播放数:5808920}

我要回帖

更多关于 超越人类极限 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信