我有一个数据框,只有一列,共有235,886行。每一行对应英语单词中的一个单词。
例如:
[1] 抗传染主义者 抗传染的 反常规的 反常规主义 抗痉挛的 [6] 抗体决定因子
我想做的是根据每行中的字母将其转换为数字。因此,如果“a”= 1,“b”= 2,“c”= 3,“d”= 4,则“abcd”= 10。有人知道如何做到这一点吗?
我的最终目标是拥有一个函数,可以扫描数据框以查找给定的数字值,并返回所有具有该值的字符串,即单词。因此,从上面的示例继续,如果我要求值为9,则此函数将返回“dad”和任何其他具有数值9的行。
例如:
> words[10000:10005,1]
[1] 抗传染主义者 抗传染的 反常规的 反常规主义 抗痉挛的 [6] 抗体决定因子
我想做的是根据每行中的字母将其转换为数字。因此,如果“a”= 1,“b”= 2,“c”= 3,“d”= 4,则“abcd”= 10。有人知道如何做到这一点吗?
我的最终目标是拥有一个函数,可以扫描数据框以查找给定的数字值,并返回所有具有该值的字符串,即单词。因此,从上面的示例继续,如果我要求值为9,则此函数将返回“dad”和任何其他具有数值9的行。
sum(match(strsplit(x, "")[[1]], letters))
吗? - A5C1D2H2I1M1N2O1R2T1