50得票7回答
Python中卡方检验统计量的P值

我计算了一个检验统计量,其服从自由度为1的卡方分布,并且想要使用Python找出对应的P值。作为Python和数学/统计方面的新手,我认为我需要使用SciPy中卡方分布的概率密度函数。但是,当我像这样使用它时:from scipy import stats stats.chi2.pdf(3.8...

39得票2回答
使用scikit-learn进行特征选择

我是机器学习的新手。我正在使用Scikit Learn SVM对我的数据进行分类准备。为了选择最佳特征,我使用了以下方法: SelectKBest(chi2, k=10).fit_transform(A1, A2) 由于我的数据集包含负值,我会收到以下错误: ValueError ...

22得票4回答
为因子变量(分类数据)绘制类似于相关矩阵的图表?同时包含混合类型数据?

事实上有两个问题,其中一个比另一个更高级。 Q1:我正在寻找一种类似于corrplot()的方法,但可以处理因子数据。 我最初尝试使用chisq.test()然后计算p值和Cramer's V作为相关性,但是由于列太多而无法解决。 所以,有人能告诉我是否有一种快速创建“corrplot”的...

18得票1回答
费舍尔检验错误:LDSTP太小。

输入NN <- c(359,32);JJ <- c(108,13);NNS <- c(103,15);VBN <- c(95,9);RB <- c(63,11);NNP <- c(56,0);VBG <- c(55,10);IN <- c(38,...

15得票2回答
Python中的卡方检验

我想在Python中运行卡方检验。我已经编写了代码来执行此操作,但是由于scipy文档非常稀少,我不知道自己是否做得对。 首先说一下背景: 我有两组用户。我的零假设是,无论是哪组的人更有可能使用桌面、移动设备还是平板电脑,都没有显着差异。 这些是两组的观察到频率:[[u'desktop',...

13得票1回答
Sklearn Chi2 用于特征选择

我正在学习使用卡方检验进行特征选择,并发现了类似这个的代码。 然而,我的理解是,较高的卡方分数意味着该特征更加独立(因此对模型的用处更小),因此我们应该关注得分最低的特征。然而,使用scikit-learn的SelectKBest选择器,返回具有最高卡方分数的值。我的卡方检验使用理解是否不正...

13得票2回答
在R中进行卡方拟合优度检验

我有一个观测值的向量和一个使用模型计算出的值的向量:actual <- c(1411,439,214,100,62,38,29,64) expected <- c(1425.3,399.5,201.6,116.9,72.2,46.3,30.4,64.8) 现在我正在使用卡方拟合优度...

12得票1回答
如何在scipy.optimize.curve_fit的输出中获取卡方值?

在使用scipy.optimize.curve_fit()进行拟合时,能否直接获得卡方值的输出呢? 通常情况下,我们可以通过对模型和数据之间的差异进行平方、加权并求和来计算卡方值。然而,当参数sigma被传递一个二维矩阵(即数据的协方差矩阵)而不是简单的一维数组时,这个过程就不太直接了。 ...

10得票3回答
Python是否有类似于R中qchisq函数的等价函数?

R语言的qchisq函数可以将p值和自由度转换为相应的卡方值。是否有Python库具有相同功能? 我已在SciPy中查找,但未找到相应的函数。

8得票1回答
Scikit Learn:未选择所需数量的最佳特征(k)

我正在尝试使用卡方检验(scikit-learn 0.10)选择最佳特征。从80个训练文档中,我首先提取了227个特征,然后从这些特征中选择前10个。 my_vectorizer = CountVectorizer(analyzer=MyAnalyzer()) X_train =...