我正在处理一个与大学专业数据清洗相关的项目。我发现很多专业名称拼写错误,因此我想使用函数
谢谢!
gsub()
将其替换为正确的拼写。例如,假设在名为Major的专业列表中“biolgy”被拼错了。如何让R检测到拼写错误并将其替换为正确的拼写?我尝试过gsub('biol', 'Biology', Major)
,但它只替换了“biolgy”中的前四个字母。如果我使用 gsub('biolgy', 'Biology', Major)
,那只适用于这个特定的情况,而无法检测出其他形式的“biology”拼写错误。谢谢!
agrep
返回向量索引,因此您可以使用下标轻松地分配值:animals[agrep("mou", animals)] <- "cheese"
。 - aL3xavalue = TRUE
返回近似匹配项,而不仅仅是索引。 - Richie Cotton