首页
强化学习是从以往经验中去不断学习来获取知识,不需要大量已标记的确定标签,只需要一个评价行为好坏的奖惩机制进行反馈。
精华吧
→
答案
→
网课
强化学习是从以往经验中去不断学习来获取知识,不需要大量已标记的确定标签,只需要一个评价行为好坏的奖惩机制进行反馈。
正确答案:正确
Tag:
奖惩
好坏
标记
时间:2024-04-17 10:41:59
上一篇:
在英语课堂上学习新单词的时候,老师会给我们相应的对与否的反馈,这就是有监督学习。
下一篇:
半监督学习是有监督和无监督学习相结合,训练数据包含有标记样本和无标记样本。
相关答案
1.
我们在家自学英语单词,只能自己看音节、听发音,自己找其中的规律,这就是无监督学习。
2.
分类是一种对离散型随机变量建模或预测的监督学习方法。
3.
聚类算法是要自己想办法把一批样本分开,分成多个类,保证每一个类中的样本之间是相似的,而不同类的样本之间是不同的。
4.
在有监督学习中,我们会在训练数据集上建立模型,之后会把这个模型用于之前从未见过的数据中,这个过程称为模型的泛化。
5.
如果模型过于简单,连训练数据集的特点都不能完全考虑到的话,那么这样的模型在训练数据集和测试数据集的得分都会非常差,这个时候我们说模型出现了欠拟合。
6.
scikit()learn是一个文档丰富且易于使用的库,它使用简单的方法简化了机器学习算法的应用。
7.
scikit()learn还用于执行数据预处理、特征选择、模型评估等操作。
8.
线性回归的任务是找到一个从特征空间X到输出空间Y的最优的线性映射函数。
9.
根据商品房屋的所在城市、面积、地段和开发商等若干个特征数据进行预测房价,根据季度、维度、时间和地点等若干特征数据预测天气预报都属于回归问题。
10.
机器学习可以根据学习方式分为监督式学习和非监督式学习。
热门答案
1.
监督式学习只需要有标记的训练样本去学习得到一个最优模型。
2.
非监督式学习就是从以往经验中去不断学习来获取知识,不需要大量已标记的确定标签。
3.
强化学习是通过反馈来自我进行“学习”,不需要大量已标记的确定标签。
4.
分类通过有标记样本训练出一个分类函数或分类模型,该模型能把训练样本以外的新样本映射到给定类别中的某一类中,属于有监督学习。
5.
回归是通过拟合有标记样本的分布得到一条直线或者超平面,从而对新样本进行预测,属于有监督学习。
6.
聚类是通过一定方法使得相似的样本划分为一个簇,不同簇的样本尽可能不相似,属于无监督学习。
7.
所有的聚类算法都属于有监督学习。
8.
特征工程是机器学习的关键步骤。
9.
特征工程是一个创造新特征的过程,利用数据领域的知识创建使机器学习算法达到最佳性能的特征。
10.
在对人的性别进行分类的模式分类问题中,特征提取与选择的好坏将直接决定分类器的性能。