自然语言处理中为了计算文档之间的相似度,往往需进行文档的量化表示,下面关于BOW(即Bag-Of-WordsModEl)和VSM(VEctorSpacEModEl)的描述错误的是:


自然语言处理中为了计算文档之间的相似度,往往需进行文档的量化表示,下面关于BOW(即Bag-Of-WordsModEl)和VSM(VEctorSpacEModEl)的描述错误的是:

A、VSM,即向量空间模型。是一种表示文本文档的数学模型。将每个文档表示成同一向量空间的向量

B、在BOW,即词袋模型中,词的数量是一定的

C、在VSM,即向量空间模型中,所有文档的向量维度的数目都相同

D、BOW,即词袋模型。即为了计算文档之间的相似度,假设可以忽略文档内的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合

正确答案:在BOW,即词袋模型中,词的数量是一定的


Tag:向量 文档 模型 时间:2024-04-05 21:48:08