对于强化学习中的探索策略，以下哪种方法通过对动作的不确定性进行建模来实现？

精华吧→答案→学富五车

对于强化学习中的探索策略，以下哪种方法通过对动作的不确定性进行建模来实现？

A.汤普森采样

B.上置信界算法

C.随机策略

D.以上都是

正确答案：D

答案解析：汤普森采样、上置信界算法和随机策略都可对动作不确定性建模实现探索。

Tag：AI人工智能知识竞赛策略不确定性时间：2025-01-17 21:14:05

相关答案

热门答案