之前的问题与我的困境并没有提供合适的答案: 1. 我有一个大小为2.3GB的csv文件,其中包含240万行希伯来文本,目前编码为ASCII。 由于我们要处理大文件,fread可能更可取,但是关于编码方面有什么建议呢? 有没有办法读取编码为ASCII的csv文件以避免著名的“字符串中嵌入了空字符”错误?
谢谢
之前的问题与我的困境并没有提供合适的答案: 1. 我有一个大小为2.3GB的csv文件,其中包含240万行希伯来文本,目前编码为ASCII。 由于我们要处理大文件,fread可能更可取,但是关于编码方面有什么建议呢? 有没有办法读取编码为ASCII的csv文件以避免著名的“字符串中嵌入了空字符”错误?
谢谢
text <- fread(file, encoding = 'UTF-8')
ASCII并不是一种明确的编码选项,但ASCII是有效的UTF-8编码,所以当您想读取希伯来文本时,可以指定使用UTF-8编码。
sessionInfo()
确认),但是出现了这个错误:“Error in fread("data.csv", encoding = "UTF-8") : unused argument (encoding = "UTF-8")”。 - Jeff