AlphaGo横空出世，为什么能超越人类视线距离极限极限

点击联系发帖人 时间：2018-05-20 04:09

超越人类极限

自学3天碾压Master！AlphaGo Zero横空出世，彻底摆脱人类知识自学3天碾压Master！AlphaGo Zero横空出世，彻底摆脱人类知识猪猪驴教练百家号据国外媒体报道，谷歌旗下人工智能公司DeepMind新开发的AlphaGo Zero自学成才，以100比0战绩击败上代AlphaGo。Deep Mind发表的论文人工智能的最大挑战是研发一种能从零开始、以超人类的水平学习复杂概念的算法。为了打败人类围棋世界冠军，科学家在训练上一款AlphaGo时，同时用到了监督式学习（基于上百万种人类专业选手的下棋步骤）和基于自我对弈的强化学习。那款AlphaGo的训练过程长达几个月，用到多台机器和48个TPU（神经网络训练所需的专业芯片）。本文中，英国DeepMind的David Silver, Julian Schrittwieser, Karen Simonyan, Demis Hassabis和同事介绍了AlphaGo Zero，它的学习从零开始，且单纯基于与自己的对弈。人类的输入仅限于棋盘和棋子，没有任何人类数据。AlphaGo Zero仅用到一张神经网络，这张网络经过训练，专门预测程序自身的棋步和棋局的赢家，在每次自我对弈中进步。新程序只使用一台机器和4个TPU。通过几天的训练——包括近500万局自我对弈——AlphaGo Zero便能够超越人类并打败所有之前的AlphaGo版本。随着程序训练的进行，它独立发现了人类用几千年才总结出来的围棋规则，还建立了新的战略，为这个古老的游戏带来新见解。迄今最强大的围棋程序：不使用人类的知识DeepMind这篇最新的Nature，有一个朴素的名字——《不使用人类知识掌握围棋》。DeepMind 研究人员介绍 AlphaGo Zero。视频来源：DeepMind，视频中英文字幕由Nature 上海办公室制作这篇论文的最大亮点，在于无需任何人类指导，通过全新的强化学习方式自己成为自己的老师，在围棋这一最具挑战性的领域达到超过人类的精通程度。相比起之前使用人类对弈的数据，这一算法训练时间更短，仅用3天时间就达到了击败李世石的AlphaGo Lee的水平，21天达到了之前击败柯洁的AlphaGo Master的水平。在3天内——也就是AlphaGo Zero在击败AlphaGo Lee之前，曾进行过490万次自我对弈练习。相比之下，AlphaGo Lee的训练时间长达数月之久。AlphaGo Zero不仅发现了人类数千年来已有的许多围棋策略，还设计了人类玩家以前未知的的策略。这是AlphaGo的终曲，也是一个全新的开始，相关技术将被用于造福人类，帮助科学家认识蛋白质折叠，制造出治疗疑难杂症的药物，开发新材料，以制造以出更好的产品。谨以下面的小传，致敬AlphaGo，以及研发AlphaGo的人：AlphaGo姓名：AlphaGo（Fan，Lee，Master，Zero）别名：阿老师，阿尔法狗生日：2014年出生地：英国伦敦1击败樊麾2015年10月，AlphaGo击败樊麾，成为第一个无需让子即可在19路棋盘上击败围棋职业棋手的电脑围棋程序，写下了历史，相关成果在2016年1月发表于Nature２击败李世石2016年3月，AlphaGo在一场五番棋比赛中4:1击败尖端职业棋手李世石，成为第一个不借助让子而击败围棋职业九段棋手的电脑围棋程序，再创历史。五局赛后韩国棋院授予AlphaGo有史以来第一位名誉职业九段３排名短暂超越柯洁日，AlphaGo在Go Ratings网站的排名升至世界第一。但几天之后被柯洁反超。４化名“Master”横扫棋界2016年底至2017年年初，再度强化的AlphaGo以“Master”为名，在未公开其真实身份的情况下，借非正式的网络快棋对战进行测试，挑战中韩日台的一流高手，60战全胜５战胜柯洁，成为世界第一至27日乌镇围棋峰会，最新的强化版AlphaGo和世界第一棋手柯洁对局，并配合八段棋手协同作战与对决五位顶尖九段棋手等五场比赛，获取3比零全胜的战绩，团队战与组队战也全胜。这次AlphaGo的运算资源消耗仅李世石版本的十分之一。在与柯洁的比赛结束后，中国围棋协会授予AlphaGo职业围棋九段的称号。本文由百家号作者上传并发布，百家号仅提供信息发布平台。文章仅代表作者个人观点，不代表百度立场。未经作者许可，不得转载。猪猪驴教练百家号最近更新：简介:分享NBA等篮球联赛最新赛事！作者最新文章相关文章AlphaGo Zero横空出世英国为何能扛起AI创新的大旗?|AlphaGo|人工智能|英国_新浪科技_新浪网
AlphaGo Zero横空出世英国为何能扛起AI创新的大旗?
　　作者：薛皎
　　英国当地时间10月18日，来自伦敦的DeepMind公司公布了最强版AlphaGo，代号AlphaGo Zero。AlphaGo Zero通过零基础学习，在短短3天时间里，其水平已经超越此前所有版本的AlphaGo。英国在人工智能方面的发展一直走在世界前列，DeepMind在此诞生并非巧合。
　　丰厚的学术资源、创新氛围以及政府大力支持，使得过去3年，几乎每周都有一家新的人工智能公司在英国创立。预计到2035年，人工智能将为英国经济额外增加超过8千亿美元的收入。
　　来自伦敦的Blippar公司创立于2011年，最初致力于设计AR应用程序，在去年3月，转型成为人工智能视觉搜索引擎。目前Blippar已融资超过1亿美元，估值超过15亿美元。
　　Blippar联合创始人安博里斯告诉记者，随着人工智能技术的不断成熟，将AI融入到AR应用中，并在特定场景下结合VR效果，将使体验者无论从视觉还是意识形态上获得更加真实的感受，这也是人工智能领域未来发展的趋势之一。
对趣店和众安而言，如果你将它们看作互联网公司，就不能仅仅关注当下的收入和盈利情况，而是将目
华为成立到现在，一直由任正非亲力指导决策，从来没有为了任何管理制度问题而影响业务发展。
AlphaGo已经学会很多人类的定式，也下出了自己的定式。现在职业棋手有时就在使用AlphaGo的定式。AlphaGo Zero横空出世完全自学21天虐Master_凤凰体育
AlphaGo Zero横空出世完全自学21天虐Master
用微信扫描二维码分享至好友和朋友圈
据Verge等外媒报道，专注于推进人工智能（AI）研究的谷歌子公司DeepMind今天发布了一款新版本的AlphaGo程序，它能通过自学玩转多种游戏。这套系统名为&AlphaGo Zero
据Verge等外媒报道，专注于推进人工智能（AI）研究的谷歌子公司DeepMind今天发布了一款新版本的AlphaGo程序，它能通过自学玩转多种游戏。这套系统名为&AlphaGo Zero&，它通过一种名为&强化学习&的机器学习技术，可以在与自己的对决游戏中吸取教训。在击败韩国棋神李世石，并且今年5月击败&世界围棋第一人&柯洁后，AlphaGo迎来了一次新生。昨天，DeepMind 在《自然》杂志上发表了一篇论文，正式介绍了这个人工智能围棋程序及其演化：- AlphaGo Zero从零开始自我学习下围棋。- 仅仅36小时后，AlphaGo Zero靠着自我学习，就摸索出所有基本且重要的围棋知识，达到了与李世石九段对战的AlphaGo v18的相同水平。- 30天后，不断进步的AlphaGo Zero达到了Master的水平。Master即年初在网上达成60连胜的AlphaGo版本。- 40天后，AlphaGo Zero对战Master达到近90%胜率，成为有史以来AlphaGo的最强版本。之前的AlphaGo版本首先基于数千场人类围棋比赛来训练如何学习围棋。但AlphaGo Zero跳过了这一步，从自己完全随机的下围棋开始来学习围棋。通过这种&无师自通&的方式，它快速超越了人类棋手的水平，并且以100:0 的比分打败了之前战胜世界冠军的AlphaGo，堪称&最强棋手&。硬件和算法上的变化才是系统更加强大和高效的重要原因。AlphaGo Zero的运作非常高效，它只需要一台机器和4个TPU。在训练过程中，AlphaGo Zero每下一步需要思考的时间是0.4秒。由于是自我对弈学习下棋，并且是在世界上最强大的棋手&&AlphaGo本身学起，AlphaGo Zero很快超过了人类水平，并且走出了很多新的步法。利用&强化学习&的新模式，从一个对围棋一无所知的神经网络开始，将该神经网络和一个强力搜索算法结合，自我对弈。在对弈过程中，神经网络不断调整、升级，预测每一步落子和最终的胜利者。等级分排名（在围棋等竞争性比赛中对选手的相关技巧的水平的度量）：显示AlphaGo 如何在发展过程中逐渐变得强大。AlphaGo的首席研究员大卫&席尔瓦(David Silver)表示，&由于未引入人类棋手的数据，AlphaGo Zero远比过去的版本强大，我们去除了人类知识的限制，它能够自己创造知识。DeepMind联合创始人宣布了AlphaGo Zero面世的消息，并称公司&要解决的是智能上的问题&与此前的AlphaGo一大不同之处在于，AlphaGo Zero仅用了单一的神经网络。在此前的版本中，AlphaGo 用到了&策略网络&来选择下一步棋的走法，以及使用&价值网络&来预测每一步棋后的赢家。而在新的版本中，这两个神经网络合二为一，依靠的是其高质量的神经网络来评估下棋的局势，从而让它能得到更高效的训练和评估。AlphaGo Zero中的自我对抗强化学习这一进展标志着通用型AI发展的大一里程碑。大多数AI被认为&用途有限&，因为它们只能执行单一任务，例如，翻译、识别面孔。但通用型AI在许多不同任务上拥有超越人类的潜能。像AlphaGo Zero就正在研究蛋白质如何折叠的问题，这是一个艰难的科学挑战，不过有望成为药物发明的一大突破。类似的其他结构性问题如减少能耗和寻找新材料也有望利用通用型AI来完成。
用微信扫描二维码分享至好友和朋友圈
凤凰体育官方微信
播放数：127244
播放数：141670
播放数：136715
播放数：5808920}

叫爱嘘网络