田渊栋：AlphaGo之后研究智能围棋还有什么意义？

2017-03-29 11:57:30来源：雷锋网编辑：沐子飞关键词：人工智能机器人智能制造装备阅读量：35036

导读：近日，田渊栋受地平线曾经在Facebook的同事邀请，赴中国做了一期大牛讲堂，分享了关于游戏和增强学习等的话题。

　　【中国智能制造网名家论谈】近日，田渊栋受地平线曾经在Facebook的同事邀请，赴中国做了一期大牛讲堂，分享了关于游戏和增强学习等的话题。

田渊栋

　　1. AlphaGo目前是世界的围棋选手，在此之后，研究智能围棋还有什么意义？

　　我觉得围棋是很有意思的游戏，AlphaGo虽然把它做出来了。但很多东西的做法和人是不一样的。人在学围棋的时候有很多概念，按照概念做判断，但是机器解决他还是比较暴力的。

　　一方面，你可以说人用概念来做推理局限了他的计算能力，体现出人本身有一个高度抽象的能力，就是用非常非常局限的计算能力，能达到那么强的棋力。而AlphaGo就是用非常多的计算能力去弥补这些不足，所以恰恰是互补的，我相信还是有意义的。

　　另一方面，联系到后面那个问题(目前你的研究团队，对围棋AI的研究进展到何种地步？相比AlphaGo如何。)，我们这边在开源之后就先放在那儿了，可能等到以后我们有新想法再拿过来试一试。我们这边是七八十人的研究机构，要让我们花二十人做围棋，这个是不可能的。我们这边都是很有名的研究员，这些研究员每个人都有自己的方向，像计算机视觉和自然语言处理等等，不可能把自己的方向放弃掉来专门(搞围棋)。

　　后，从本质上来说，我们的风格跟其它公司不一样。我们研究员的一个目标是说在大家不做这个东西的时候，在比较冷门或者大家不相信它能做得更好的时候去做它，证明这条路能走通。比如说我们在做DarkForest的时候，围棋还是很冷门的方向，大家都不认为围棋可以做出来。我们的文章比AlphaGo早了三个月出来，证明这个东西确实有效果，而且能提高挺多的，这就是我们的贡献。我之前在采访里面说过，好的研究就是“于无声处听惊雷”。

　　像星际这样的游戏，大家都不知道怎么做，研究员们的任务就是要想办法找到一些突破口，这个突破口可能没有人想到，或者是没有人觉得能做成，我们的目标是在这儿。我回到个问题，就是说智能围棋之后还有什么意义，就是我刚才说的，如果有人愿意想要做下去的话，就看能不能自动从里面学出一些概念来，学出一些有意思的东西，比如说人有大局观或者是大势，或者是各种下棋时候的概念，概念是不是能从这里面自动学出来。像这些，目前大家都没什么办法。

　　(你说大局观吗？)

　　对，像这样的东西其实对于我们如何理解人的思维方式是更重要的。职业棋手是很厉害的，人脑的神经传导是毫秒级的，这点时间机器可以干很多事情，但人就是用这么慢的处理速度达到了这么强的水平。

　　2. 绝艺和AlphaGo有差距么，差距是多少，是什么造成了这种差距？

　　这个我稍微看了一下，我觉得绝艺肯定是比Zen要强挺多，200手不到就让Zen认输了。我之前看新闻是它对职业棋手可以战胜80%甚至更高，所以我相信它已经是做得非常好了，我相信它肯定是超过了或者是相当于AlphaGo之前Paper(AI科技评论注：2016 年 1 月 28 日，Deepmind 公司在 Nature 杂志发表论文 Mastering the game of Go with deep neural networks and tree search，介绍了 AlphaGo 程序的细节。)的水平，但是它跟现在的Master相比，可能还是有差距。

　　3. 跟AlphaGo 3月份比赛的水平比如何？

　　跟3月份(对战李世石)的时候这个我不好说，我只能说和Nature那篇论文相比做得好，当然了跟Master比是有差距的，现在Master所有对战是全部都是赢的，没有输的，胜率是100%，而且都是赢的莫名其妙。Master赢了你，你都不知道什么地方出错了，好像下得挺好的，然后就输掉了。所以就是已经到了不知道错哪儿的程度了。我相信他们应该用别的方法做训练的，而不是单纯拓展之前的文章。像我是听说他们近把训练好的值网络单独拿出来，根据它再从头训练一个策略网络。我觉得这样做的好处是会发现一些看起来很怪但其实是好棋的招法，毕竟人类千百年下棋的师承形成了思维定式，有些棋在任何时候都不会走，所以按照人类棋谱训练出来的策略网络终究会有局限性；而用值网络作为指导，从头训练一个策略网络的话，确实会发现很多新招。

　　(AlphaGo用其他的方法迭代的？)

　　我相信他们也用了别的办法，但是细节我也不知道，因为我近也没有做，所以我也不知道他们用什么样的办法，我觉得这方面需要创新。

　　4. 绝艺这次是跟电脑围棋比赛，跟下一次的真人比赛区别在哪？

　　电脑围棋我们之前也参加过，就是大家坐着，连上之后让计算机自己下，下到什么地方就说我输了你输了，然后就结束了，有可能说我们看看剩下好像不行了，但是机器误判，就让人去认输。基本上是这样的过程。

　　(那我可以这样理解吗？跟电脑围棋比赛的是两个既定程序的对战，比如说电脑围棋绝艺跟真人，比如柯洁对战的时候，是变动性更大一点，是吗？)

　　我相信是的，因为电脑围棋至少在之前都是有些明显的风格，比如说有些喜欢在角上和你拼，不愿意去外面抢大场。人可能能看出来这个风格，就会击败它，特别是水平不是很高的两个AI下的话，很明显能看出问题，比如我们DarkForest就有死活的问题，我们自己会说，你看这里下得不对，肯定是这里下错了，这个地方他可能判断有问题，以为这块棋是活的，其实是死的，所以会有各种各样的问题。当然了，如果是达到绝艺或者是AlphaGo这样的水平的话，我肯定是看不出来，我需要计算机辅助帮我下到后面才能看到，但是我相信职业棋手还是能看出来，但Master我不知道，我不是特别清楚。

　　5. 以DarkForest为例，除了围棋，这种完全信息博弈的游戏智慧要应用在其他领域需要解决哪些问题？

　　我觉得现在这个系统是针对于某个问题做特别优化，我之前在 talk里也说了，那么多方法，要依照不同的游戏用不同的方法，没有那么通用的。比如说你在象棋上用蒙特卡洛树搜索肯定是不行的，你可能漏搜了某一条特别重要的分支，然后导致一个杀王的走棋序列没有看到，这是非常有可能的。所以整个AlphaGo是一个大的系统工程和框架结构，它需要有几个人每天花时间在上面，还得每天不停地调啊调。所以说，现在所谓的 “人工智能” 还是比较弱的，还是需要人去监督，然后把它做出来。

　　(如果是要针对某一个特定领域呢？)

　　就是我刚才说的，你先要对这个领域有了解，然后去设计。比如说围棋和象棋就不一样，象棋每步的可能性比较少，对局面的判断相对容易，因为这个原因，你要换一个方法做，而不是用原来的方法做。所以对于方法的选择，其实是完全依赖于这个问题本身的，所以这个是需要大量的人工智能相关知识才能做出来的。

上一篇：尹可挺博士：区块链将成物联网发展新搭档

下一篇：百胜CEO：AI和机器人将在快餐业取代人类

我要评论

中国生成式人工智能用户规模达5.15亿人，普及率36.5%
《生成式人工智能应用发展报告(2025)》显示，截至2025年6月，我国生成式人工智能用户规模达5.15亿人，普及率为36.5%。上半年，国产生成式人工智能产品取得显著进步，在春节期间成为社会关注热点，推动生成式人工智能快速渗透。
人工智能生成式人工智能
2025-10-20 09:07:04
人工智能和物联网如何协作以实现更智能的技术
人工智能与物联网的融合代表着科技发展的新方向。物联网通过分布在各处的传感器、设备和网络基础设施，持续生成海量的实时数据。而人工智能则通过机器学习与深度学习算法，对这些数据进行分析、建模与优化。
人工智能物联网
2025-10-20 10:57:54
OpenAI联合创始人：人工智能代理真正发挥作用还需10年
OpenAI联合创始人预估，要系统解决上述所有问题，大约还需要十年时间。尽管众多投资者将2025年称为“智能体之年”，但现实发展仍面临显著挑战。广义上，AI智能体被定义为能够自主执行任务的虚拟助手，具备问题拆解、方案规划与自主实施的能力。
OpenAI人工智能
2025-10-20 10:58:05
物联网和 Agentic AI 助力未来智能医院
随着物联网(IoT)与新一代智能体人工智能(Agentic AI)的融合，这一复杂体系正在被重新定义。越来越多的医院开始引入基于实时数据的智能运营模式，使医疗体系逐步从“经验驱动”走向“数据驱动”，甚至是“自主优化”的新阶段。
医疗应用方案人工智能
2025-10-17 13:23:02
快讯|HDL与海康威视达成战略合作；特斯联与新华三达成战略合作
中国智能控制品牌河东科技HDL与安防企业海康威视宣布达成战略合作，双方产品实现互联互通，为海外用户提供更完整的智能生活解决方案；特斯联与新华三正式宣布达成战略合作，双方将集中优势资源，围绕AIoT算力平台打造及异构算力生态建设进行深度合作......
AIoT算力人工智能
2025-10-17 11:27:16
网信办、发改委：政务领域人工智能大模型13大典型应用场景
政务部门可围绕政务服务、社会治理、机关办公和辅助决策等工作中的共性、高频需求，因地制宜、结合实际，选择典型场景进行人工智能大模型探索应用。
人工智能大模型
2025-10-17 08:30:05

版权与免责声明：

凡本站注明“来源：智能制造网”的所有作品，均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品，未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：智能制造网”。违反上述声明者，本站将追究其相关法律责任。

本站转载并注明自其它来源（非智能制造网）的作品，目的在于传递更多信息，并不代表本站赞同其观点或和对其真实性负责，不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时，必须保留本站注明的作品第一来源，并自负版权等法律责任。如擅自篡改为“稿件来源：智能制造网”，本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多，如涉及作品内容、版权等问题，请与本站联系并提供相关证明材料：联系电话：0571-89719789；邮箱：1271141964@qq.com。