对于强化学习中的探索策略,以下哪种方法通过对动作的不确定性进行建模来实现?



对于强化学习中的探索策略,以下哪种方法通过对动作的不确定性进行建模来实现?

A.汤普森采样

B.上置信界算法

C.随机策略

D.以上都是

正确答案:D

答案解析:汤普森采样、上置信界算法和随机策略都可对动作不确定性建模实现探索。


Tag:AI人工智能知识竞赛 策略 不确定性 时间:2025-01-17 21:14:05