我有一个带有字节顺序标记(U+FEFF)开头的文本文件,我想在R中读取该文件。有没有办法避免字节顺序标记?
data.table
包中的fread
函数可以读取该文件,但会在第一个变量名的开头添加ļ»æ
:
> names(frame_pers)[1]
[1] "ļ»æreg_date"
对于read.csv
函数也是一样的。
目前我已经编写了一个函数,可以删除第一列列名中的BOM,但我相信应该有一种自动去除BOM的方法。
remove.BOM <- function(x) setnames(x, 1, substring(names(x)[1], 4))
> names(frame_pers)[1]
[1] "ļ»æreg_date"
> remove.BOM(frame_pers)
> names(frame_pers)[1]
[1] "reg_date"
我正在使用 R 会话的本地编码:
> options("encoding" = "")
> options("encoding")
$encoding
[1] ""