我有一个包含以下数据的 .csv 文件:
"Ա","Բ"
1,10
2,20
我无法将其读入R中,以便列名显示为文件中的样子。
d <- read.csv("./Data/1.csv", fileEncoding="UTF-8")
head(d)
生成以下内容:
> d <- read.csv("./Data/1.csv", fileEncoding="UTF-8")
Warning messages:
1: In read.table(file = file, header = header, sep = sep, quote = quote, :
invalid input found on input connection './Data/1.csv'
2: In read.table(file = file, header = header, sep = sep, quote = quote, :
incomplete final line found by readTableHeader on './Data/1.csv'
> head(d)
[1] X.
<0 rows> (or 0-length row.names)
同时,如果不指定文件编码进行相同操作,则会产生以下结果:
> d <- read.csv("./Data/1.csv")
> head(d)
Ô. Ô²
1 1 10
2 2 20
当我运行 "file" 工具来查找文件的编码时,它显示为 UTF-8:
Data\1.csv: UTF-8 Unicode text, with CRLF line terminators
我正在使用RStudio,Windows 7操作系统,R版本为2.15.2,32位。
提前致谢。
encoding
代替,即read.csv(..., encoding="UTF-8")
可以读取文件,但标题不会显示为字母,而是显示为X.U.FEFF..U.0531. X.U.0532.
。 - eddia
#1 <U+0531> ` - eddiuser_name
和tweet
字段都包含非英文字符等。这里有一个包含数据样本的 gist。有什么好的方法可以正确地导入这个文件并设置正确的编码吗? - Clay