我是新手程序员。我有一个pandas数据框,其中包含两个字符串列。
数据框如下:
Col-1 Col-2
Update have a account
Account account summary
AccountDTH Cancel
Balance Balance Summary
Credit Card Update credit card
这里我需要检查Col-2元素与Col-1每个元素的相似性。也就是说,我需要将have a account
与Col-1
的所有元素进行比较。然后找到前3个最相似的元素。假设相似度得分为:Account(85),AccountDTH(80),Balance(60),Update(45),Credit Card(35)
。
期望输出结果为:
Col-2 Output
have a account Account(85),AccountDTH(80),Balance(60)