什么是从1600万个字符串变量向量中删除德语(或法语)口音的最佳方法?
例如:'Sjögren's syndrome' 变成 'Sjogren's syndrome'。
将单个字符转换为单个字符比使用音译更好,如:
ä => ae,ö => oe,ü => ue。
例如:使用正则表达式是一种选择,但是否有更好的选项(R包)?
例如:'Sjögren's syndrome' 变成 'Sjogren's syndrome'。
将单个字符转换为单个字符比使用音译更好,如:
ä => ae,ö => oe,ü => ue。
例如:使用正则表达式是一种选择,但是否有更好的选项(R包)?
gsub('ü','u',gsub('ö','o',"Sjögren's syndrome ( über) "))
非R平台的SO解决方案存在,但没有一个好的R解决方案。