7得票2回答
用for循环在R中进行卡方分析

我正在尝试对数据中所有变量的组合进行卡方分析,我的代码如下: ```python ``` Data <- esoph[ , 1:3] OldStatistic <- NA for(i in 1:(ncol(Data)-1)){ for(j in (i+1):ncol(Data)...

22得票4回答
为因子变量(分类数据)绘制类似于相关矩阵的图表?同时包含混合类型数据?

事实上有两个问题,其中一个比另一个更高级。 Q1:我正在寻找一种类似于corrplot()的方法,但可以处理因子数据。 我最初尝试使用chisq.test()然后计算p值和Cramer's V作为相关性,但是由于列太多而无法解决。 所以,有人能告诉我是否有一种快速创建“corrplot”的...

12得票1回答
如何在scipy.optimize.curve_fit的输出中获取卡方值?

在使用scipy.optimize.curve_fit()进行拟合时,能否直接获得卡方值的输出呢? 通常情况下,我们可以通过对模型和数据之间的差异进行平方、加权并求和来计算卡方值。然而,当参数sigma被传递一个二维矩阵(即数据的协方差矩阵)而不是简单的一维数组时,这个过程就不太直接了。 ...

7得票1回答
如何使用SelectKBest (chi2)计算得分?

我正在尝试通过将特征选择方法应用于我的数据集来找到最有价值的特征。目前我正在使用SelectKBest函数。我可以生成分数并按照自己的想法进行排序,但我不完全理解这个分数是如何计算的。我知道高分数在理论上更有价值,但我需要一个数学公式或示例来深入学习如何计算分数。 bestfeatures ...

13得票1回答
Sklearn Chi2 用于特征选择

我正在学习使用卡方检验进行特征选择,并发现了类似这个的代码。 然而,我的理解是,较高的卡方分数意味着该特征更加独立(因此对模型的用处更小),因此我们应该关注得分最低的特征。然而,使用scikit-learn的SelectKBest选择器,返回具有最高卡方分数的值。我的卡方检验使用理解是否不正...

18得票1回答
费舍尔检验错误:LDSTP太小。

输入NN <- c(359,32);JJ <- c(108,13);NNS <- c(103,15);VBN <- c(95,9);RB <- c(63,11);NNP <- c(56,0);VBG <- c(55,10);IN <- c(38,...

15得票2回答
Python中的卡方检验

我想在Python中运行卡方检验。我已经编写了代码来执行此操作,但是由于scipy文档非常稀少,我不知道自己是否做得对。 首先说一下背景: 我有两组用户。我的零假设是,无论是哪组的人更有可能使用桌面、移动设备还是平板电脑,都没有显着差异。 这些是两组的观察到频率:[[u'desktop',...

13得票2回答
在R中进行卡方拟合优度检验

我有一个观测值的向量和一个使用模型计算出的值的向量:actual <- c(1411,439,214,100,62,38,29,64) expected <- c(1425.3,399.5,201.6,116.9,72.2,46.3,30.4,64.8) 现在我正在使用卡方拟合优度...

10得票3回答
Python是否有类似于R中qchisq函数的等价函数?

R语言的qchisq函数可以将p值和自由度转换为相应的卡方值。是否有Python库具有相同功能? 我已在SciPy中查找,但未找到相应的函数。

8得票1回答
Scikit Learn:未选择所需数量的最佳特征(k)

我正在尝试使用卡方检验(scikit-learn 0.10)选择最佳特征。从80个训练文档中,我首先提取了227个特征,然后从这些特征中选择前10个。 my_vectorizer = CountVectorizer(analyzer=MyAnalyzer()) X_train =...