对于强化学习中的探索策略,以下哪种方法通过对动作的不确定性进行建模来实现?
对于强化学习中的探索策略,以下哪种方法通过对动作的不确定性进行建模来实现?
A.汤普森采样
B.上置信界算法
C.随机策略
D.以上都是
正确答案:D
答案解析:汤普森采样、上置信界算法和随机策略都可对动作不确定性建模实现探索。
Tag:AI人工智能知识竞赛 策略 不确定性
时间:2025-01-17 21:14:05