我正在通过RJDBC从MySQL数据库读取文件,并且在R中正确显示所有字母(例如,נווה שאנן)。
然而,即使使用write.csv和fileEncoding="UTF-8"导出,输出看起来像是
<U+0436>.<U+043A>. <U+041B><U+043E><U+0437><U+0435><U+043D><U+0435><U+0446>
(在这种情况下,这不是上面的字符串,而是保加利亚语)。对于像ã、ç等其他特殊字符,工作正常。
我怀疑这是由于UTF-8 BOM,但我在网上没有找到解决方案。
我的操作系统是德国Windows7。
编辑:
con<-file("file.csv",encoding="UTF-8")
write.csv(x,con,row.names=FALSE)
而且 (afaik) 等价于 write.csv(x, file="file.csv",fileEncoding="UTF-8",row.names=FALSE)
。