当我将所有的data.frame转换为data.table后,使用:=时会收到一个警告: library(data.table) #Win R-3.5.1 x64 data.table_1.12.2 df1 <- data.frame(A=1, B=2) df2 <- data....
我有一个 data.table:require(data.table) set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "...
我已经尝试过(通过roxygen2)@import data.table 和只导入我使用的函数(@importFrom data.table data.table rbindlist setkey setDT := .SD)。无论哪种方式,我都会收到关于 . "function"的警告,我认为...
我想使用data.table来简洁地计算一些百分比变化,但我在完全理解.SD操作方式方面遇到了一些问题。假设我有以下表格: dt = structure(list(type = c("A", "A", "A", "B", "B", "B"), Year = c(2000L, 2005L, ...
我正在尝试计算多列的中位数,但是我的数据有些问题。它看起来像以下示例。 我正在尝试计算多列的中位数,但是我的数据有些问题。它看起来像以下示例。library(data.table) dt <- data.table("ID" = c(1,2,3,4),"none" = c(0,5,5,...
为了理解我的问题,我首先应该指出,R datatables不仅仅是带有语法糖的R数据框,它们之间存在重要的行为差异:datatables中的列赋值/修改通过引用避免将整个对象复制到内存中(请参见此Quora答案中的示例),而在dataframes中则不然。 我已经多次发现,由于data.ta...
如果我理解正确,data.table 中的 duplicated() 函数返回一个逻辑向量,其中不包含重复记录的第一个出现。那么如何标记这个第一次出现呢?在使用 base::duplicated() 的情况下,我通过反转顺序函数并进行析取来解决这个问题:myDups <- (duplic...
对于那些不熟悉的人来说,独热编码只是将类别列(即因子)转换为多个二进制指示变量列的过程,其中每个新列对应原始列的一个类别。以下示例将更好地说明:dt <- data.table( ID=1:5, Color=factor(c("green", "red", "red", "bl...
我有一个5GB的.dat文件(> 1000万行)。每行的格式如下:aaaa bb cccc0123 xxx kkkkkkkkkkkkkk或者aaaaabbbcccc01234xxxkkkkkkkkkkkkkk。由于使用readLines读取大文件时性能较差,我选择使用fread()来读取,但遇...
首先我想创建一个带有列名的空数据表,但它失败了:data <- data.table(va, vb, vc) > Error in data.table(va, vb, vc) : object 'va' not found 其次,我想将数据表附加到它上面,但它也失败了:data...