设置

关灯

第220章 提前宣布(第一更4000字!) (3 / 14)

《关闭小说畅读模式体验更好》


        对面的,真的是一个人类吗?

        不,哪怕是AI,也一样是要用人类棋谱进行学习的,招数并没有真正的脱离人类的思考范畴,只是把人类的招数探索到了极致而已。

        但现在在这个对手,所使用的招数,无论从布局,还是局部定式,完全和人类既有套路不一样。

        除非……对方真的是个AI,并且从未学过任何人类的招数,只凭自我对弈,自我学习,自我推理,掌握了这个游戏!

        黄世杰被自己的想法吓了一大跳。

        如果他的猜测是真的,那就意味着,对方不止是在训练上走在了deepmind前面,在算法上,更是把deepmind远远甩在了后面!

        此前他们也曾经设想过让alphaGo完全自我对弈来掌握围棋,但效果非常糟糕。

        在实验中,他们发现,alphaGo所用的策略梯度算法在平衡探索新策略与利用已知策略之间存在严重的不稳定性,导致AI无法从整局优势的角度上去考虑胜负优势。

        而且,围棋的胜负信号噪音太强了,如果没有初期的既有知识引导,会导致模型在初期训练阶段无法有效学习。

        除此之外,还需要解决神经网络的“灾难性遗忘”问题和没有初始策略下的大量随即走子的问题。

        内容未完,下一页继续阅读