21得票3回答
从 ggplot 条形图中删除未使用的因子水平

我想要做与这个问题相反的事情,也就是这个问题的相反,不过那个问题是关于图例而不是图形本身。 其他的SO问题似乎都在问如何保留未使用的因子水平。但我实际上希望它们被删除。我有几个名称变量和几列(宽格式)的变量属性,我正在使用它们创建许多条形图。以下是一个可重现的示例:library(ggplo...

24得票7回答
寻找给定整数的所有精确除数的算法

我想找到一个数的所有因子。 目前我有这样的代码:{ int n; int i=2; scanf("%d",&n); while(i<=n/2) { if(n%i==0) printf("%d,",...

41得票7回答
为什么我的Swift循环出现错误“无法使用 end < start 形成范围”?

我有一个for循环,它检查一个数字是否是另一个数字的因数,然后检查该因数是否为质数,最后将其添加到数组中。根据原始数字不同,会出现一个错误,显示: 致命错误:无法形成范围,结束 &lt; 开始 这几乎每次都会发生,但对于某些数字它能正常工作。我发现只有9、15和25可以与之配合使用...

8得票2回答
查找因数和

为什么这段代码会返回一个数字的因数之和? 在几个欧拉计划问题中,你需要计算因数之和作为问题的一部分。在其中一个论坛上,有人发布了以下Java代码作为找到这个和的最佳方法,因为你只需要找到质数而不是每个因数(你不需要了解Java,可以跳到我的总结部分): public int sumOfDi...

19得票4回答
直接按升序列出一个数的因子,而无需排序?

有没有一种高效的算法,可以按升序枚举一个数n 的因子而不进行排序?所谓“高效”,是指: 该算法通过从n的质因数分解开始避免了暴力搜索约数。 该算法的运行时间复杂度为O(d log₂ d)或更好,其中d是n的因子数量。 该算法的空间复杂度为O(d)。 该算法避免了排序操作。也就是说,因子是按...

7得票1回答
如何确保一个分区包含来自因子每个水平的代表性观测数据?

我编写了一个小函数来将我的数据集分成训练和测试集。然而,当处理因子变量时,我遇到了麻烦。在代码的模型验证阶段,如果模型是建立在没有每个因子级别的代表性的数据集上,我会收到一个错误。我该如何修复partition()函数以包括因子变量的每个级别至少有一个观察值? test.df &lt;- d...

19得票7回答
将具有N个类别因子的数据重编码为N个二进制列

原始数据框:v1 = sample(letters[1:3], 10, replace=TRUE) v2 = sample(letters[1:3], 10, replace=TRUE) df = data.frame(v1,v2) df v1 v2 1 b c 2 a a...

13得票3回答
处理具有大量水平的因子的R机器学习包

我正在尝试做一些需要大量因素型变量(例如单词、描述、时间等非数值型内容)的机器学习。通常我会使用randomForest,但它无法处理具有超过32个级别的因子。 请问是否有其他好用的替代方案?

38得票2回答
为什么因子中的标签和级别术语如此奇怪?

一个不可设置的函数示例是labels。只有在使用factor()函数创建因子时才能设置因子标签。没有labels&lt;-函数。注意,在因子中的“标签”和“级别”都没有意义....&gt; fac &lt;- factor(1:3, labels=c(&quot;one&quot;, &qu...

9得票1回答
在lm公式中删除变量仍会触发对比错误。

我正在尝试在数据的一个子集上运行lm(),但遇到了问题。 dt = data.table(y = rnorm(100), x1 = rnorm(100), x2 = rnorm(100), x3 = as.factor(c(rep('men',50), rep('women',50)))) ...