52得票2回答
为什么scikit-learn的SVM.SVC()运行极其缓慢?

我曾尝试使用SVM分类器对大约10万个样本的数据进行训练,但我发现它非常缓慢,即使过了两个小时也没有响应。当数据集大约有1k个样本时,我可以立即得到结果。我还尝试了SGDClassifier和朴素贝叶斯,这两种方法都非常快速,我可以在几分钟内得到结果。您能解释一下这种现象吗?

49得票4回答
在sklearn中确定对SVM分类器最有贡献的特征

我有一个数据集,想用这些数据来训练我的模型。训练完毕后,我需要知道哪些特征对SVM分类器的分类起到了主要作用。 森林算法有一个叫做特征重要性的东西,是否有类似的方法呢?

48得票6回答
如何在sklearn上将数据分割为平衡的训练集和测试集

我在多分类任务中使用sklearn。我需要将所有数据拆分为训练集和测试集。我希望从每个类别中随机抽取相同数量的样本。 实际上,我正在使用这个函数X_train, X_test, y_train, y_test = cross_validation.train_test_split(Data, ...

48得票6回答
一些好的支持向量机教程指针

我一直在尝试理解支持向量机的基础知识,并下载并阅读了很多在线文章。但仍然无法掌握。 我想知道是否有一些 好的教程 可以用来理解的示例代码 或者您认为任何其他东西,可以让我轻松学习SVM基础知识。 附注:我不知怎么地学会了主成分分析(PCA)。顺便说一句,你们可能已经猜到了我正在从事...

46得票2回答
sklearn.svm.svc的predict_proba()函数在内部是如何工作的?

我正在使用scikit-learn中的sklearn.svm.svc进行二元分类。我使用它的predict_proba()函数来获取概率估计值。有人可以告诉我predict_proba()如何在内部计算概率吗?

43得票2回答
何时应该使用LinearSVC或SVC?

根据我的研究,我发现了三个相互矛盾的结果: SVC(kernel="linear") 更好 LinearSVC 更好 没有区别 有人可以解释一下何时使用 LinearSVC 而不是 SVC(kernel="linear") 吗? 看起来 LinearSVC 略优于 SVC 并且通常更...

42得票7回答
为什么在支持向量机中需要进行特征缩放?

我发现在SVM(支持向量机)问题中进行缩放确实可以提高其性能。 我已阅读了这个解释: 缩放的主要优点是避免具有较大数值范围的属性支配具有较小数值范围的属性。 不幸的是,这没有帮助我。能否有人提供更好的解释?

39得票4回答
F1微平均值和准确率是否相同?

我在scikit-learn中尝试了许多F1微观和准确度的示例,但在所有示例中,我看到F1微观与准确度相同。这总是正确的吗? 脚本from sklearn import svm from sklearn import metrics from sklearn.cross_validation...

37得票7回答
SVM和神经网络

SVM和神经网络的区别在哪里?线性SVM与NN相同吗?对于非线性可分问题,神经网络使用添加隐藏层,SVM使用改变空间维度是真的吗?

36得票3回答
如何解释scikit-learn的混淆矩阵和分类报告?

我有一个情感分析任务,为此我使用了这个语料库,意见被分为5类(非常负面、负面、中性、正面、非常正面),从1到5。因此,我按照以下方式进行分类: from sklearn.feature_extraction.text import TfidfVectorizer import numpy a...