我希望能够总结多个列中分类值的发生情况,并得出特定分类值在多个列中出现的次数。
以下是我的数据框:
>>> import pandas as pd
>>> df = pd.DataFrame({'user_id': [1,2,3,4,5,6],
... 'position_1':['abc', 'bbc', 'ccd', 'kpd', 'mne', 'jbp'],
... 'position_2':['jkp', 'klp', 'abc', 'jbp', 'ccd', 'ppt'],
... 'position_3':['abc', 'bbc', 'ytz', 'mne', 'ppt', 'jbp']})
>>> df
user_id position_1 position_2 position_3
0 1 abc jkp abc
1 2 bbc klp bbc
2 3 ccd abc ytz
3 4 kpd jbp mne
4 5 mne ccd ppt
5 6 jbp ppt jbp
My desired output would look something like this:
value number of occurrences in selected columns
abc 4
jbp 3
bbc 2
ccd 2
and so on.
我尝试使用value_counts,但结果很令人困惑:
df.value_counts(['position_1', 'position_2', 'position_3'])
position_1 position_2 position_3
mne ccd ppt 1
kpd jbp mne 1
jbp ppt jbp 1
ccd abc ytz 1
bbc klp bbc 1
abc jkp abc 1
dtype: int64