使用分类算法(例如朴素贝叶斯或SVM)和StringToWordVector,是否可以使用TF/IDF并在整个当前类中计算术语频率,而不仅仅是查看单个文档?
让我解释一下,我希望计算为给定类别中非常频繁的词汇(而不仅仅是给定文档),但在整个语料库中并不是非常频繁的词汇提供高分。
这是否可能直接实现,还是需要进行额外的开发?
谢谢 :)
让我解释一下,我希望计算为给定类别中非常频繁的词汇(而不仅仅是给定文档),但在整个语料库中并不是非常频繁的词汇提供高分。
这是否可能直接实现,还是需要进行额外的开发?
谢谢 :)