7得票4回答
将环境中的所有数据框转换为数据表

当我将所有的data.frame转换为data.table后,使用:=时会收到一个警告: library(data.table) #Win R-3.5.1 x64 data.table_1.12.2 df1 <- data.frame(A=1, B=2) df2 <- data....

90得票5回答
如何在每个组内创建滞后变量?

我有一个 data.table:require(data.table) set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", &quot...

16得票3回答
当在一个包中使用data.table时,R CMD check会提示:没有可见的全局函数定义'.'。

我已经尝试过(通过roxygen2)@import data.table 和只导入我使用的函数(@importFrom data.table data.table rbindlist setkey setDT := .SD)。无论哪种方式,我都会收到关于 . "function"的警告,我认为...

8得票1回答
使用.data.table进行操作:简洁地计算百分比变化

我想使用data.table来简洁地计算一些百分比变化,但我在完全理解.SD操作方式方面遇到了一些问题。假设我有以下表格: dt = structure(list(type = c("A", "A", "A", "B", "B", "B"), Year = c(2000L, 2005L, ...

15得票4回答
在R中从data.table列计算中位数

我正在尝试计算多列的中位数,但是我的数据有些问题。它看起来像以下示例。 我正在尝试计算多列的中位数,但是我的数据有些问题。它看起来像以下示例。library(data.table) dt <- data.table("ID" = c(1,2,3,4),"none" = c(0,5,5,...

9得票1回答
Pandas的数据框架(Python)更接近于R的数据框架还是datatables?

为了理解我的问题,我首先应该指出,R datatables不仅仅是带有语法糖的R数据框,它们之间存在重要的行为差异:datatables中的列赋值/修改通过引用避免将整个对象复制到内存中(请参见此Quora答案中的示例),而在dataframes中则不然。 我已经多次发现,由于data.ta...

38得票4回答
在data.table中找到*所有*重复记录(不是除了一个以外的所有记录)

如果我理解正确,data.table 中的 duplicated() 函数返回一个逻辑向量,其中不包含重复记录的第一个出现。那么如何标记这个第一次出现呢?在使用 base::duplicated() 的情况下,我通过反转顺序函数并进行析取来解决这个问题:myDups <- (duplic...

11得票5回答
如何使用data.table进行因子变量的独热编码?

对于那些不熟悉的人来说,独热编码只是将类别列(即因子)转换为多个二进制指示变量列的过程,其中每个新列对应原始列的一个类别。以下示例将更好地说明:dt <- data.table( ID=1:5, Color=factor(c("green", "red", "red", "bl...

12得票1回答
如何使用fread()作为readLines(),而不进行自动列检测?

我有一个5GB的.dat文件(> 1000万行)。每行的格式如下:aaaa bb cccc0123 xxx kkkkkkkkkkkkkk或者aaaaabbbcccc01234xxxkkkkkkkkkkkkkk。由于使用readLines读取大文件时性能较差,我选择使用fread()来读取,但遇...

39得票3回答
如何创建一个带有列名的空数据表,然后将其他数据表附加到它上面?

首先我想创建一个带有列名的空数据表,但它失败了:data <- data.table(va, vb, vc) > Error in data.table(va, vb, vc) : object 'va' not found 其次,我想将数据表附加到它上面,但它也失败了:data...