单项选择题
AlphaGo算法中的值网络(value network)是用于表达()
A.棋盘状态B.棋局评估函数C.下棋策略D.棋手意图
单项选择题 AlphaGo算法的主干是()
单项选择题 AlphaGo算法没有使用以下哪种人工智能方法()
判断题 在行为智能的学习中,可以提供针对当前状态的标准动作作为学习数据。