对于深度强化学习中的策略搜索,以下哪种方法适用于大规模连续动作空间?



对于深度强化学习中的策略搜索,以下哪种方法适用于大规模连续动作空间?

A.基于梯度的方法

B.基于采样的方法

C.基于模型的方法

D.以上都是

正确答案:B

答案解析:基于采样的方法适用于大规模连续动作空间的策略搜索。


Tag:AI人工智能知识竞赛 方法 策略 时间:2025-01-17 21:14:27