从信息学霸到神级科学家四爷的狗
第72章 生成式对抗网络(求追读)(第3页)
他们都对江铭的研究很感兴趣,短短两个月内解决了机器翻译问题,又提出策略梯度的研究天才,竟然也会有被难住的时候?
两位教授眼中闪过一丝兴奋,他们最喜欢有挑战性的话题了。
“好吧,哎,其实也没什么,是我想训练出一个超越人类的围棋程序。”,江铭叹了口气:“就还是用策略梯度算法来让围棋自我对弈,不过,我昨天试了一下,这个训练实在太难收敛了。”
众人眼睛一亮,这个课题有意思!
围棋一直被誉为人类智力的最高峰,其复杂程度远远超过其他智力游戏的总和,如果真能挑战成功,将是一个里程碑式的大事件。
“嗯...这的确难以收敛。”,那位男教授率先道:“我研究过你的策略梯度算法,这个通过试错和探索来收集数据实际上是一种蒙特卡洛法,也就是需要完整下完一整局才算作收集一次有效数据。”
“但是围棋的每一步,都有可能让最终的胜负翻转。这样上百步叠加在一起,方差几乎是个天文数字,当然难以收敛了。”,他咋舌感叹,这个难题的确棘手。
“那有没有可能,先学习人类的下法啊,或者让人类来指导训练?”,瑞秋问道。
“感觉似乎也不太走得通,人类还是太渺小了,人类的下法可能是误导也说不定呢?况且让人类指导,人类也判断不出一步棋的好坏吧。”,另一位女教师反驳道。
江铭眉头微皱,听着面前三人的对话,突然感觉有了一点点的灵感。
人类指导不了,那机器呢?
江铭冥冥之中有了一点知觉,但灵感就像在空气浮动的杨絮,想要抓却又扰动了气流,怎么都抓不住。
就差一点点了!
不行,他感到灵感快要消失了,于是立刻在心中默念:“系统,我要使用顿悟因子。”
呼!一股热流涌入了他的大脑,江铭终于在最后一刻把灵感化成了领悟。
“我...我好像明白了!”