两个Pandas数据帧中共同的列列表

21

我正在考虑对具有大量列的数据帧执行合并操作。不希望结果出现两个相同名称的列。正在尝试查看两个数据帧之间共同的列名列表:

import pandas as pd

a = [{'A': 3, 'B': 5, 'C': 3, 'D': 2},{'A': 2,  'B': 4, 'C': 3, 'D': 9}]
df1 = pd.DataFrame(a)
b = [{'F': 0,  'M': 4,  'B': 2,  'C': 8 },{'F': 2,  'M': 4, 'B': 3, 'C': 9}]
df2 = pd.DataFrame(b)

df1.columns
>> Index(['A', 'B', 'C', 'D'], dtype='object')
df2.columns
>> Index(['B', 'C', 'F', 'M'], dtype='object')

(df2.columns).isin(df1.columns)
>> array([ True,  True, False, False])

我该如何在索引对象上操作NumPy布尔数组,以便它只返回共同列的列表?

1个回答

46

使用 numpy.intersect1dintersection

a = np.intersect1d(df2.columns, df1.columns)
print (a)
['B' 'C']

a = df2.columns.intersection(df1.columns)
print (a)
Index(['B', 'C'], dtype='object')

后一种选项的替代语法:

df1.columns & df2.columns

3
我该如何获取相反的结果?也就是两个数据框中不同的列?在这种情况下,是A、D和FM。 - raffa_sa
7
使用df2.columns.symmetric_difference(df1.columns)symmetric_difference - jezrael

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接