这个页面:http://scikit-learn.org/stable/modules/feature_extraction.html提到:
我尝试过:
然后我按照代码,在我的语料库上使用了fit_transform()。如何获取fit_transform()计算出的每个特征的权重?由于tf-idf在文本特征中经常被使用,所以还有另一个类叫做TfidfVectorizer将CountVectorizer和TfidfTransformer的所有选项结合到单个模型中。
我尝试过:
In [39]: vectorizer.idf_
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-39-5475eefe04c0> in <module>()
----> 1 vectorizer.idf_
AttributeError: 'TfidfVectorizer' object has no attribute 'idf_'
但是缺少这个属性。
谢谢
vectorizer.fit_transform(corpus)
的返回值。 - Lukas Graf