自然语言处理中为了计算文档之间的相似度,往往需进行文档的量化表示,下面关于BOW(即Bag-Of-WordsModEl)和VSM(VEctorSpacEModEl)的描述错误的是:
自然语言处理中为了计算文档之间的相似度,往往需进行文档的量化表示,下面关于BOW(即Bag-Of-WordsModEl)和VSM(VEctorSpacEModEl)的描述错误的是:
A、VSM,即向量空间模型。是一种表示文本文档的数学模型。将每个文档表示成同一向量空间的向量
B、在BOW,即词袋模型中,词的数量是一定的
C、在VSM,即向量空间模型中,所有文档的向量维度的数目都相同
D、BOW,即词袋模型。即为了计算文档之间的相似度,假设可以忽略文档内的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合
正确答案:在BOW,即词袋模型中,词的数量是一定的