强化学习是从以往经验中去不断学习来获取知识，不需要大量已标记的确定标签，只需要一个评价行为好坏的奖惩机制进行反馈。_精华吧

强化学习是从以往经验中去不断学习来获取知识，不需要大量已标记的确定标签，只需要一个评价行为好坏的奖惩机制进行反馈。

精华吧→答案→网课

强化学习是从以往经验中去不断学习来获取知识，不需要大量已标记的确定标签，只需要一个评价行为好坏的奖惩机制进行反馈。

正确答案：正确

Tag：奖惩好坏标记时间：2024-04-17 10:41:59

相关答案

热门答案