对于深度强化学习中的长期规划问题,以下哪种方法可以更好地处理?
对于深度强化学习中的长期规划问题,以下哪种方法可以更好地处理?
A.蒙特卡罗树搜索
B.策略梯度
C.价值函数估计
D.以上都不是
正确答案:A
答案解析:蒙特卡罗树搜索能更好地处理长期规划问题。
Tag:AI人工智能知识竞赛 梯度 函数
时间:2025-01-17 21:14:47