我有一份包含5000个评论的文件。我在这个文件上应用了tf-idf。在这里,sample_data包含5000个评论。我将tf-idf向量化器应用于sample_data,并使用一元范围。现在,我想从sample_data中获取具有最高tf-idf值的前1000个单词。请问如何获得前1000个单词?
from sklearn.feature_extraction.text import TfidfVectorizer
tf_idf_vect = TfidfVectorizer(ngram_range=(1,1))
tf_idf_vect.fit(sample_data)
final_tf_idf = tf_idf_vect.transform(sample_data)