I have the following pandas dataframe;
a = [['01', '12345', 'null'], ['02', '78910', '9870'], ['01', '23456', 'null'],['01', '98765', '8760']]
df_a = pd.DataFrame(a, columns=['id', 'order', 'location'])
我需要计算每个ID中出现的NULL值(NULL是一个字符串)的数量。因此,结果应如下所示:
id null_count
01 02
我可以使用groupby获取基本计数:
new_df = df_a.groupby(['id', 'location'])['id'].count()
但是结果返回的不仅仅是NULL值;
id location
01 8760 1
null 2
02 9870 1