阿尔法狗的程序为何能够自己学习

发布网友 发布时间:2022-04-22 07:01

我来回答

2个回答

热心网友 时间:2022-06-17 03:09

我是学计量经济学模型算法的,对此我有了解。简单说,阿尔法狗之所以会“学习”,是因为他会根据每一步对手的步骤,去更改参数。所谓参数,就是对手下一步会以什么样的概率去走某一棋局步骤,如果这个概率能算的越准,那么就越能把握对手的动向,从而采取应对措施。
中国已经有团队向阿尔法狗发出挑战,其实两个人工智能之间比的,不仅仅是棋盘套路及战法的数据输入,更是谁能以更精准的算法去计算概率,从而预测对手。

热心网友 时间:2022-06-17 03:09

“阿尔法狗”是一些网友对谷歌AlphaGo人工智能的昵称。
“阿尔法狗”其实是一款围棋人工智能程序,由位于英国伦敦的谷歌旗下DeepMind公司开发。它也是第一款能击败专业围棋选手的计算机软件。
  据DeepMind的团队介绍,选择围棋,恰恰是因为围棋的复杂。围棋的“分支因子”无穷无尽,走法比全宇宙的原子数量还要多。传统的计算机程序在下棋时,会使用“暴力计算”的做法,为所有可能的步数建立搜索树,也就是根据数学和逻辑推理的方法,把每一种可能的路径都走一遍,从中选出最优的走法。
  但是围棋棋盘有361个点,走法变化繁多,普林斯顿的研究人员算出了19×19格围棋的精确合法棋局数的所有可能性是一个171位数——比宇宙中的原子数还多。这样的计算结果,哪怕是巨型计算机也要算上许多年。而且由于围棋的每颗棋子都相同,没有大小的区分,这使得围棋的下法中增加了很多“随机”的成分,无法用逻辑推理来预测。所以围棋一直被认为是人工智能领域的最大挑战。
  在阿尔法狗出现之前,电脑的围棋能力还停留在业余水平。专家预言,想击败世界上的精英选手,电脑技术至少还要再发展十年。但是“阿尔法狗”做到了。
  简单来说,“阿尔法狗”系统之所以可以玩转围棋,是因为它具有两个大脑,一个叫做“策略网络”,负责选择下一步走法;另一个“价值网络”,负责预测比赛胜利者,每走一步估算一次获胜方,而不是一直搜索到比赛结束,从而减少了运算量。两个大脑配合工作,于是将围棋巨大无比的搜索空间压缩到可以控制的范围之内。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com