AlphaGo的策略网络（Policy Network）主要表达了一个根据当前棋局状态获得下一个动作的函数，以_计算机考试题

人工智能

多项选择题

AlphaGo的策略网络（Policy Network）主要表达了一个根据当前棋局状态获得下一个动作的函数，以下哪些学习方法被用来学习该函数（）

A.监督学习
B.强化学习
C.非监督学习
D.半监督学习

相关考题

多项选择题 AlphaGo是哪几种人工智能实现途径的结合（）

单项选择题 AlphaGo算法中的值网络（value network）是用于表达（）

单项选择题 AlphaGo算法的主干是（）

All Rights Reserved 版权所有©计算机考试题库(PPhuashu.com)

备案号：湘ICP备2020024380号-1