我知道
例如,是否可以使用
如果现在还不支持这个功能,那么是否建议先读取整个数据,然后使用
参考一下,我需要读取大约 800 个文件,每个文件包含约 10 列、100,000 行的数据。
欢迎任何意见。
谢谢。
fread
相对较新,但它真的可以显著提高性能。我想知道的是,你是否可以从正在读取的文件中选择行和列? 就像read.csv.sql
一样?我知道使用fread
的select
选项可以选择要读取的列,但如何仅读取满足特定条件的行呢?例如,是否可以使用
fread
实现以下内容?read.csv.sql(file, sql = "select V2,V4,V7,V8,V9, V10 from file where V5=='CE' and V10 >= 500",header = FALSE, sep= '|', eol ="\n")
如果现在还不支持这个功能,那么是否建议先读取整个数据,然后使用
subset
等方法得出最终结果?但这样做是否会失去使用 fread
的意义呢?参考一下,我需要读取大约 800 个文件,每个文件包含约 10 列、100,000 行的数据。
欢迎任何意见。
谢谢。
ans = rbindlist(lapply(files, function(x) fread(x)[, fn := x]))
。然后,在ans
上进行一次子集操作(假设子集条件相同)。 - Arun