我有一个data.table基础。 在这个data.table中,我有一个term列。
class(base$term)
[1] character
length(base$term)
[1] 27486
我可以从一个字符串中删除重音符号。 我可以从一个字符串向量中删除重音符号。
iconv("Millésime",to="ASCII//TRANSLIT")
[1] "Millesime"
iconv(c("Millésime","boulangère"),to="ASCII//TRANSLIT")
[1] "Millesime" "boulangere"
但出于某些原因,当我将同样的函数应用到我的术语列时,它却不起作用。
base$terme[2]
[1] "Millésime"
iconv(base$terme[2],to="ASCII//TRANSLIT")
[1] "MillACsime"
有人知道这里发生了什么吗?
base$terme
是一个因子吗?尝试先转换为character
或者转换水平(levels)也许会有帮助。 - NJBurgoere””。
iconv文档指定
TRANSLIT`在不同系统上会产生不同的结果(这当然有点无用)。 - Konrad Rudolphiconv(base$terme[2], from="latin1", to="ASCII//TRANSLIT")
。如果不行,请提供Encoding(base$terme[2])
的输出结果。 - nicola