我有一个带有字符串列Posts
的pandas数据框df
,形式如下:
df['Posts']
0 "This is an example #tag1"
1 "This too is an example #tag1 #tag2"
2 "Yup, still an example #tag1 #tag1 #tag3"
当我尝试使用以下代码计算hashtag数量时:
count_hashtags = df['Posts'].str.extractall(r'(\#\w+)')[0].value_counts()
我明白了,
#tag1 4
#tag2 1
#tag3 1
但是我需要每行唯一的hashtag数量统计结果,就像这样:
#tag1 3
#tag2 1
#tag3 1