得票数最多 'chi-squared' 问题

关联标签

50得票7回答

Python中卡方检验统计量的P值

我计算了一个检验统计量，其服从自由度为1的卡方分布，并且想要使用Python找出对应的P值。作为Python和数学/统计方面的新手，我认为我需要使用SciPy中卡方分布的概率密度函数。但是，当我像这样使用它时：from scipy import stats stats.chi2.pdf(3.8...

pythonstatisticsscipychi-squared

39得票2回答

使用scikit-learn进行特征选择

我是机器学习的新手。我正在使用Scikit Learn SVM对我的数据进行分类准备。为了选择最佳特征，我使用了以下方法： SelectKBest(chi2, k=10).fit_transform(A1, A2) 由于我的数据集包含负值，我会收到以下错误： ValueError ...

pythonmachine-learningscikit-learnfeature-selectionchi-squared

22得票4回答

为因子变量（分类数据）绘制类似于相关矩阵的图表？同时包含混合类型数据？

事实上有两个问题，其中一个比另一个更高级。 Q1：我正在寻找一种类似于corrplot()的方法，但可以处理因子数据。我最初尝试使用chisq.test()然后计算p值和Cramer's V作为相关性，但是由于列太多而无法解决。所以，有人能告诉我是否有一种快速创建“corrplot”的...

rplotstatisticscorrelationchi-squared

18得票1回答

费舍尔检验错误：LDSTP太小。

输入NN <- c(359,32);JJ <- c(108,13);NNS <- c(103,15);VBN <- c(95,9);RB <- c(63,11);NNP <- c(56,0);VBG <- c(55,10);IN <- c(38,...

rtestingstatisticschi-squared

15得票2回答

Python中的卡方检验

我想在Python中运行卡方检验。我已经编写了代码来执行此操作，但是由于scipy文档非常稀少，我不知道自己是否做得对。首先说一下背景: 我有两组用户。我的零假设是，无论是哪组的人更有可能使用桌面、移动设备还是平板电脑，都没有显着差异。这些是两组的观察到频率:[[u'desktop',...

pythonnumpyscipychi-squared

13得票1回答

Sklearn Chi2 用于特征选择

我正在学习使用卡方检验进行特征选择，并发现了类似这个的代码。然而，我的理解是，较高的卡方分数意味着该特征更加独立（因此对模型的用处更小），因此我们应该关注得分最低的特征。然而，使用scikit-learn的SelectKBest选择器，返回具有最高卡方分数的值。我的卡方检验使用理解是否不正...

pythonmachine-learningscikit-learnfeature-selectionchi-squared

13得票2回答

在R中进行卡方拟合优度检验

我有一个观测值的向量和一个使用模型计算出的值的向量：actual <- c(1411,439,214,100,62,38,29,64) expected <- c(1425.3,399.5,201.6,116.9,72.2,46.3,30.4,64.8) 现在我正在使用卡方拟合优度...

rstatisticschi-squaredgoodness-of-fit

12得票1回答

如何在scipy.optimize.curve_fit的输出中获取卡方值？

在使用scipy.optimize.curve_fit()进行拟合时，能否直接获得卡方值的输出呢？通常情况下，我们可以通过对模型和数据之间的差异进行平方、加权并求和来计算卡方值。然而，当参数sigma被传递一个二维矩阵（即数据的协方差矩阵）而不是简单的一维数组时，这个过程就不太直接了。 ...

pythonscipycurve-fittingchi-squared

10得票3回答

Python是否有类似于R中qchisq函数的等价函数？

R语言的qchisq函数可以将p值和自由度转换为相应的卡方值。是否有Python库具有相同功能？我已在SciPy中查找，但未找到相应的函数。

pythonrstatisticsscipychi-squared

8得票1回答

Scikit Learn：未选择所需数量的最佳特征（k）

我正在尝试使用卡方检验（scikit-learn 0.10）选择最佳特征。从80个训练文档中，我首先提取了227个特征，然后从这些特征中选择前10个。 my_vectorizer = CountVectorizer(analyzer=MyAnalyzer()) X_train =...

pythonmachine-learningscikit-learnchi-squared