将dat文件导入R

Question

将dat文件导入R

62

提前道歉，这个问题可能很简单。我正在尝试使用以下代码将一个网站上的.dat文件导入到R中：

www = "http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat"
data <- read.delim(www, header = TRUE, sep="\t")

我想访问数据框架中的值部分，但是我不确定数据框架的维度，如果我键入ncol(data)，它返回1，而我预期应该是3。如何访问这个数据框架的“第三”列？

- KatyB

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- A5C1D2H2I1M1N2O1R2T1 · Accepted Answer

dat文件在实际数据之前有一些额外的信息行。使用skip参数跳过它们：

read.table("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat", 
           header=TRUE, skip=3)

如果您对数据集不熟悉，可以通过首先使用 readLines 检查几行来轻松检查：

readLines("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat", 
          n=10)
# [1] "Ozone data from CZ03 2009"   "Local time: GMT + 0"        
# [3] ""                            "Date        Hour      Value"
# [5] "01.01.2009 00:00       34.3" "01.01.2009 01:00       31.9"
# [7] "01.01.2009 02:00       29.9" "01.01.2009 03:00       28.5"
# [9] "01.01.2009 04:00       32.9" "01.01.2009 05:00       20.5"

从这里我们可以看到实际数据从[4]开始，因此我们知道要跳过前三行。

更新

如果你真的只想要Value列，你可以这样做：

as.vector(
    read.table("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
               header=TRUE, skip=3)$Value)

再次强调，readLines 函数在帮助我们确定将要导入的列的实际名称方面非常有用。

但是我认为，与读取整个数据集并稍后提取相比，这种方法并没有太多优势。