将包含德语Umlauts的CSV文件导入R

5
我正在使用R Studio并需要导入一个包含德语Umlauts的csv文件进行文本挖掘。然而,我无法正确地将这些Umlauts导入R中。使用read.table(X,fileEncoding="UTF-8")会出现错误。我错过了什么吗?
----更新----
我要读取的文件是: https://drive.google.com/file/d/0B4kGh2YwTmb9U3hkei1TTHlUME0/edit?usp=sharing 使用以下R代码: Sys.setlocale("LC_CTYPE", "german") dataset <- read.table("../processed/DE_all_CDM_201405050001_DE_all_CDM2014-05-05_rcout.csv", encoding="UTF-8", header=TRUE, sep=";", stringsAsFactors=F, as.is=T) dataset <- dataset[,c(1,11,30)] Encoding(dataset[,2]) <- "UTF-8"

是的,但我不确定我是否理解正确。我的区域设置是:“LC_COLLATE=German_Germany.1252;LC_CTYPE=German_Germany.1252;LC_MONETARY=German_Germany.1252;LC_NUMERIC=C;LC_TIME=German_Germany.1252”,而且我正在运行Windows操作系统... - hag o hi
你设置了 Sys.Locale 吗? - Rachel Gallen
1
你可能想阅读这篇文章。虽然是针对俄语的,但我相信同样适用于任何外语。http://quantifyingmemory.blogspot.ie/2013/01/r-and-foreign-characters.html - Rachel Gallen
抱歉,以上方法都不适用于我。我尝试设置语言环境:Sys.setlocale("LC_CTYPE", "german"),但会导致出现"Gel<e3>ndewagen"而非"Geländewagen"。同时,在read.table中设置fileEncoding="UTF-8"或encoding="UTF-8"也无效。使用Encoding(df) <- "UTF-8"同样没有结果。 - hag o hi
3
我不会为了下载你的文件而注册谷歌账户… - Roland
显示剩余5条评论
1个回答

3

好的,我刚刚发现这是R Studio GUI的问题。如果我在R控制台中运行代码,它可以正常工作。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接