Q(s,a)是指在给定状态s的情况下,采取行动a之后,后续的各个状态所能得到的回报()


Q(s,a)是指在给定状态s的情况下,采取行动a之后,后续的各个状态所能得到的回报()

A.最大值

B.总和

C.最小值

D.期望值

正确答案:D


Tag:状态 最大值 期望值 时间:2023-11-23 21:35:56