AlphaGo中使用的策略网络（Policy Network）表达的是确定性函数。_计算机考试题

人工智能

判断题

AlphaGo中使用的策略网络（Policy Network）表达的是确定性函数。

【参考答案】

错误

(↓↓↓ 点击‘点击查看答案’看答案解析 ↓↓↓)

相关考题

判断题全连接网络被用于作为策略网络（Policy Network）的表达形式。

判断题强化学习用于提高策略网络（Policy Network）的效果时，需要将输赢作为奖励和惩罚。

判断题 AlphaGo使用了基于策略的强化学习方法。

All Rights Reserved 版权所有©计算机考试题库(PPhuashu.com)

备案号：湘ICP备2020024380号-1