我相信带有
现在,我的数据集非常大,我正在使用
当我按以下方式运行时:
我得到了一个错误信息:
我还尝试将类用作参数,但仍然出现相同的问题。
在SGD分类器的文档中,它指出:
loss='log'
的SGDClassifier()
支持多标签分类,我不需要使用OneVsRestClassifier。详情请查看此处。现在,我的数据集非常大,我正在使用
HashingVectorizer
并将结果作为输入传递给SGDClassifier
。我的目标有42048个特征。当我按以下方式运行时:
clf.partial_fit(X_train_batch, y)
我得到了一个错误信息:
ValueError: 输入形状不正确(300000,42048)
。我还尝试将类用作参数,但仍然出现相同的问题。
clf.partial_fit(X_train_batch, y, classes=np.arange(42048))
在SGD分类器的文档中,它指出:
y:形状为[n_samples]的numpy数组
。
X_train_batch
和y
的形状是什么? - bogatron