在epsilon-greedy算法中,epsilon的值越大,采取随机动作的概率越(),采用当前Q函数最大动作的概率越()


在epsilon-greedy算法中,epsilon的值越大,采取随机动作的概率越(),采用当前Q函数最大动作的概率越()

A.大,大

B.小,大

C.大,小

D.小,小

正确答案:C


Tag:概率 动作 算法 时间:2023-11-23 21:35:54