我正在尝试使用不同的NLP特征进行KNN学习。例如,我想使用词袋和局部POS标记。
在单个特征上,我有一些计算相似性的想法。比如使用余弦相似度来计算词袋向量的计数,或者使用汉明距离来计算POS标记。
然而,我不知道如何将两者结合起来。在这个领域里,人们通常怎么做呢?能否有人帮助我?
谢谢您提前的帮助。
在单个特征上,我有一些计算相似性的想法。比如使用余弦相似度来计算词袋向量的计数,或者使用汉明距离来计算POS标记。
然而,我不知道如何将两者结合起来。在这个领域里,人们通常怎么做呢?能否有人帮助我?
谢谢您提前的帮助。