根据课程内容，大语言模型作为"下一个词预测器"的工作流程包括哪些关键步骤？（）

精华吧→答案→超星尔雅学习通未分类

A.接收输入文本并将其Token化

B.分析上下文关系，理解Token之间的语义联系

C.计算词表中每个可能词语的概率分布

D.根据概率分布选择最合适的词语输出

正确答案：ABCD

答案解析：

选项A：大语言模型首先要接收输入文本，而计算机无法直接处理文本，所以需要将文本进行Token化。Token化就是把文本分割成一个个Token（词元），比如将“我爱自然语言处理”分割为“我”“爱”“自然语言”“处理”等Token，这是后续处理的基础，故A选项正确。

选项B：模型需要分析上下文关系，理解这些Token之间的语义联系。例如在“苹果很甜”这句话中，模型要理解“苹果”和“甜”之间的描述关系。只有理解了上下文语义，才能更好地预测下一个词，故B选项正确。

选项C：基于对上下文的理解，模型会计算词表中每个可能词语的概率分布。词表包含了模型所学习到的所有词语，模型根据当前的上下文信息，评估每个词语作为下一个词出现的可能性，比如在“我今天去了”之后，“学校”“公园”“超市”等词都有一定的出现概率，模型会计算出它们各自的概率，故C选项正确。

选项D：最后，模型会根据计算得到的概率分布，选择最合适的词语输出。这个“最合适”可能是概率最高的词，也可能通过一些策略（如考虑多样性等）选择其他概率较高的词，作为预测的下一个词，完成文本生成的一个步骤，故D选项正确。

Tag：动手学AI人工智能通识与实践时间：2025-11-16 11:26:29