我有一组文档(以
我已经参考了这篇博客文章,但它给出了整个词汇表的分数。
.txt
文件的形式存储)。我还有一个Python字典,其中包含一些选定的单词。我想仅为这些单词分配tf-idf分数,而不是从文档集中的所有单词。如何使用scikit-learn
或任何其他库来完成此操作?我已经参考了这篇博客文章,但它给出了整个词汇表的分数。