我需要使用 .dct 文件来读取 .dat 文件。有没有人在 R 中做过这个操作?
文件的格式如下:
dictionary {
# how many lines per record
_lines(1)
# start defining the first line
_line(1)
# starting column / storage type / variable name / read format / variable label
_column(1) str8 aid %8s "respondent identifier"
...
}
“读取格式”就像以下这些:
%2f 2 column integer variable
%12s 12 column string variable
%8.2f 8 column number with 2 implied decimal places.
存储类型可在此处查看:http://www.stata.com/help.cgi?datatypes 其他信息来源网站: http://library.columbia.edu/indiv/dssc/technology/stata_write.html http://www.stata.com/support/faqs/data-management/reading-fixed-format-data/ .dat文件是一堆数字,对应于.dct文件中指定的变量。(这可能是固定宽度列中的数据)。
以下是一个真实的例子:
.dtc文件 http://goo.gl/qHZOk 数据 http://goo.gl/FRGRF 来自Stata网站的一个具体示例是:
.dat文件(在这个实例中为“test.raw”)
C1245A101George Costanza
B1223B011Cosmo Kramer
dictionary using test2.raw {
_column(1) str5 code %5s
_column(2) int call %4f
_column(6) str1 city %1s
_column(7) int neigh %3f
_column(10) str16 name %16s
}
生成的数据文件:
+-----------------------------------------------+
| code call city neigh name |
|-----------------------------------------------|
1. | C1245 1245 A 101 George Costanza |
2. | B1223 1223 B 11 Cosmo Kramer |
+-----------------------------------------------+
.dct
文件是什么?你提到的.dat
文件类型具体是哪种?我们需要更详细的信息才能回答你。 - thelatemailmemisc
包会很有用,正如read.dta
帮助文档中所建议的那样。你可以在阅读了精彩的数据导入/导出手册后,前往该帮助文档。 - mnel