10得票2回答
在使用data.table中的paste()函数时,如何使用:=?

我已经开始在人口大模型中使用data.table。到目前为止,我印象深刻的是,使用data.table结构可以将我的模拟运行时间缩短约30%。 我正在尝试进一步优化我的代码,并包含了一个简化的例子。我的两个问题是: 这段代码能否使用:=操作符? 使用:=操作符是否会更快(不过,如果我能回答...

30得票6回答
为什么对字符向量使用as.Date函数会变得很慢?

我开始在R中使用data.table包来提高代码的性能。我正在使用以下代码: sp500 <- read.csv('../rawdata/GMTSP.csv') days <- c("Monday","Tuesday","Wednesday","Thursday","Friday...

14得票3回答
无法在R中对data.table使用dput函数

我有以下的data.table,但我不能使用dput命令的输出结果来重新创建它:> ddt Unit Anything index new 1: A 3.4 1 1 2: A 6.9 2 1 3: A1 1.1 ...

11得票2回答
在版本1.9.3中,使用.data.table(merge - X[Y])进行合并时,关键字丢失了。

我有两个数据表 dtp 和 dtab。 require(data.table) set.seed(1) dtp <- data.table(pid = gl(3, 3, labels = c("du", "i", "nouana")), year =...

13得票5回答
从时间中提取小时的最快方法是什么?(HH:MM)

希望fastPOSIXct能够发挥作用,但在这种情况下没有起作用。 这是我的时间数据(不含日期)- 我需要从中获取小时部分。times <- c("9:46","11:06", "14:17", "19:53", "0:03", "3:56") 这里是fastPOSIXct的错误输出:f...

7得票2回答
R: data.table交叉连接无法工作

我有两个data.table,我想将它们连接起来(形成一个笛卡尔积)。其中一个data.table以Date向量为键,另一个以numeric向量为键: # data.table with dates (as numeric) dtDates2 = data.table(date = ...

21得票2回答
使用多核和并行编程加速data.table分组操作

我有一大段代码,目前速度瓶颈在于聚合步骤。 我希望加快数据分组步骤的速度。我的代码中,一个简单而非平凡的示例(SNOTE)的数据如下: library(data.table) a = sample(1:10000000, 50000000, replace = TRUE) b = sam...

13得票3回答
使用data.table功能将长结构化数据表重塑为宽结构?

> library(data.table) > A <- data.table(x = c(1,1,2,2), y = c(1,2,1,2), v = c(0.1,0.2,0.3,0.4)) > A x y v 1: 1 1 0.1 2: 1 2 0.2 3:...

9得票1回答
如何从具有命名值的向量创建数据表并保留名称?

我有一个带有命名值的向量: v = c(a = 10, b = 20) 我想创建一个 data.table 并将名称保存在单独的列中。

7得票4回答
什么是在按组ID子集化数据时比for循环更高效的替代方法?

我在研究中经常遇到的一种分析范式是需要基于所有不同的组ID值进行子集,逐个对每个组执行统计分析,然后将结果放入输出矩阵以便进一步处理/汇总。 我通常在R中执行此操作的方式如下: data.mat <- read.csv("...") groupids <- unique(d...