我正在使用R语言处理数据框,其中包含姓名和对应的办公地址。但是地址与姓名并不完全匹配,因此我需要根据最频繁出现的值替换错误的地址。以下是一个示例:
ID Clients ADDRESS FIRST_NAME LAST_NAME
1 A Cobben Cui Z
2 B Beerstaat Cui Z
3 C River Cui Z
4 D Cobben Cui Z
5 E Cobben Cui Z
6 F Cobben Cui Z
6 F Hart Mike G
7 H Hart Mike G
8 I Sparren Mike G
我希望得到一个类似于此的数据框:
ID Clients ADDRESS FIRST_NAME LAST_NAME
1 A Cobben Cui Z
2 B Cobben Cui Z
3 C Cobben Cui Z
4 D Cobben Cui Z
5 E Cobben Cui Z
6 F Cobben Cui Z
6 F Hart Mike G
7 H Hart Mike G
8 I Hart Mike G
我认为可以通过创建频率表来完成,我想知道是否有更简单的方法。
非常感谢!