在R控制台查看大型数据集

7

有没有办法在R控制台上完整地查看一个大型数据集 [44个变量的1380160次观察结果]?

我已经使用options(max.print=...)更改了打印限制,但是由于没有滚动数据的方式,我无法看到完整的数据集,即从第一行到最后。


2
你可以尝试将数据保存为CSV格式,然后使用电子表格程序打开,这通常是我使用的方法。 - Seth
保存这么多数据需要我的电脑超过30秒的时间,用Excel打开需要45秒。我尝试使用View(),但需要超过6分钟才能打开。而在fix()edit()中打开只需要大约1分钟。 - Seth
最后我想说的是,如果现在还不明显的话,我不确定你是否想查看整个内容。只需查看数据的部分或样本即可。 - Seth
当你查看这个数据集时(包含了1.4百万条记录),我并不清楚你将会看到什么......Paul Murrell写了一个不错的“rdataviewer”包(见http://www.stat.auckland.ac.nz/~paul/Talks/viewer.pdf),它似乎特别适用于查看大型数据集,但我不确定它是否依然可用——我认为它从未进展得很好,只是停留在概念验证阶段... - Ben Bolker
谢谢。我知道查看整个数据集不可行,但我想找出是否有办法这样做(以防万一),我想浏览整个数据。 - Anusua
有没有关于查看大型数据集的新方法的更新?我仍然很好奇,因为这是 Excel 唯一有价值的东西。 - Ben Rollert
3个回答

8
使用View函数(注意大写的“V”),可以在新窗口中以电子表格样式格式打开数据帧、矩阵或其他类似表格的对象,以便滚动查看数据(但不能编辑)。这个窗口与控制台无关,因此您可以继续发出命令,而不必关闭查看窗口(但是,对数据对象的更改将不会在查看窗口中看到,您需要关闭窗口并再次运行View来查看更改)。
如果您想在电子表格式窗口中编辑数据,则使用editfix(但使用这些命令时,直到关闭编辑窗口之前您不能运行其他命令)。
R的一些GUI也具有用于滚动查看或编辑数据对象的工具。

谢谢。我很快就会尝试这个 :) - Anusua

6

两个选择:

df <- data.frame(X = rpois(n = 100, lambda = 3), Y = rnorm(n = 100, mean = 25, sd = 7))
page(x = df, method = "print")
View(x = df , title = "My test data")

1
这是一个老问题,但是我遇到了同样的问题。对于查看大型数据集,我发现 Rcmdr 中的 View data set 非常好用。它可以显示所有数据(但是在窗口中显示)。
library(relimp, pos=35)
showData(Dat, placement='-20+200', font=getRcmdr('logFont'), maxwidth=80,  maxheight=10)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接