使用Python Pandas可以完成以下操作吗?
我有一个csv文件,类似于表A。
TABLE A
------------------------------------------------
Name Email
------------------------------------------------
Hinckley Joel hjoel@mail.com
Hinckley Joel hjoel@mail.com
Hinckley Joel hinkleyjoel@mail.com
Joel Hinckley hinkjoel@mail.com
Siegel Allison sallison@mail.com
Nielsen Tami ntami@mail.com
Nielsen Tami ntami@gmail.com
...
我想要去除重复姓名的行,并添加一个名为“Secondary Email”的新列。
次要电子邮件将是具有重复行的第一个电子邮件。
我要制作的最终表格是表B。
TABLE B
-----------------------------------------------------------
Name Email Secondary Email
-----------------------------------------------------------
Hinckley Joel hjoel@mail.com hinkleyjoel@mail.com
Siegel Allison sallison@mail.com
Nielsen Tami ntami@mail.com
从表A和B可以看出,即使名字的顺序不同(例如:“Hinckley Joel”和“Joel Hinckley”),我仍希望将其视为同一人。
此外,我想将第二电子邮件地址(例如:hinkleyjoel@mail.com)添加到新列中。
提前感谢您。