阿尔法狗的程序为何能够自己学习

发布网友发布时间：2022-04-22 07:01

共2个回答

热心网友时间：2022-06-17 03:09

我是学计量经济学模型算法的，对此我有了解。简单说，阿尔法狗之所以会“学习”，是因为他会根据每一步对手的步骤，去更改参数。所谓参数，就是对手下一步会以什么样的概率去走某一棋局步骤，如果这个概率能算的越准，那么就越能把握对手的动向，从而采取应对措施。
中国已经有团队向阿尔法狗发出挑战，其实两个人工智能之间比的，不仅仅是棋盘套路及战法的数据输入，更是谁能以更精准的算法去计算概率，从而预测对手。

热心网友时间：2022-06-17 03:09

“阿尔法狗”是一些网友对谷歌AlphaGo人工智能的昵称。
“阿尔法狗”其实是一款围棋人工智能程序，由位于英国伦敦的谷歌旗下DeepMind公司开发。它也是第一款能击败专业围棋选手的计算机软件。
　　据DeepMind的团队介绍，选择围棋，恰恰是因为围棋的复杂。围棋的“分支因子”无穷无尽，走法比全宇宙的原子数量还要多。传统的计算机程序在下棋时，会使用“暴力计算”的做法，为所有可能的步数建立搜索树，也就是根据数学和逻辑推理的方法，把每一种可能的路径都走一遍，从中选出最优的走法。
　　但是围棋棋盘有361个点，走法变化繁多，普林斯顿的研究人员算出了19×19格围棋的精确合法棋局数的所有可能性是一个171位数——比宇宙中的原子数还多。这样的计算结果，哪怕是巨型计算机也要算上许多年。而且由于围棋的每颗棋子都相同，没有大小的区分，这使得围棋的下法中增加了很多“随机”的成分，无法用逻辑推理来预测。所以围棋一直被认为是人工智能领域的最大挑战。
　　在阿尔法狗出现之前，电脑的围棋能力还停留在业余水平。专家预言，想击败世界上的精英选手，电脑技术至少还要再发展十年。但是“阿尔法狗”做到了。
　　简单来说，“阿尔法狗”系统之所以可以玩转围棋，是因为它具有两个大脑，一个叫做“策略网络”，负责选择下一步走法；另一个“价值网络”，负责预测比赛胜利者，每走一步估算一次获胜方，而不是一直搜索到比赛结束，从而减少了运算量。两个大脑配合工作，于是将围棋巨大无比的搜索空间压缩到可以控制的范围之内。

全部栏目

阿尔法狗的程序为何能够自己学习