我在DataFrame中有一个包含类别列表的列。例如:
0 [Pizza]
1 [Mexican, Bars, Nightlife]
2 [American, New, Barbeque]
3 [Thai]
4 [Desserts, Asian, Fusion, Mexican, Hawaiian, F...
6 [Thai, Barbeque]
7 [Asian, Fusion, Korean, Mexican]
8 [Barbeque, Bars, Pubs, American, Traditional, ...
9 [Diners, Burgers, Breakfast, Brunch]
11 [Pakistani, Halal, Indian]
我试图做两件事:
1)获取唯一的类别 - 我的方法是创建一个空集合,遍历系列并将每个列表附加到该集合中。
我的代码:
unique_categories = {'Pizza'}
for lst in restaurant_review_df['categories_arr']:
unique_categories = unique_categories | set(lst)
这让我得到了包含在该列中所有列表中的唯一类别集合。
2)生成类别计数的饼图,每个餐厅可以属于多个类别。例如:餐厅11属于巴基斯坦,印度和清真类别。我的方法是再次遍历类别,并通过系列进行一次迭代以获取计数。
是否有更简单或更优雅的方法?
提前致谢。