对于深度强化学习中的策略搜索,以下哪种方法适用于大规模连续动作空间?
对于深度强化学习中的策略搜索,以下哪种方法适用于大规模连续动作空间?
A.基于梯度的方法
B.基于采样的方法
C.基于模型的方法
D.以上都是
正确答案:B
答案解析:基于采样的方法适用于大规模连续动作空间的策略搜索。
Tag:AI人工智能知识竞赛 方法 策略
时间:2025-01-17 21:14:27