下列那种模型可以被用于文本相似度(document similarity)问题?
在语料中训练一个由词到向量(word 2 vector)的模型来对文本中呈现的上下文语境进行学习
训练一个词包模型(a bag of words model)来对文本中的词的发生率(occurrence)进行学习
创建一个文献检索词矩阵(document-term matrix)并且对每一个文本应用余弦相似性
上述所有方法均可