我有一个带有日期列的数据框,我想创建一个新列,告诉我数据集包含多少相同的日期。这是原始数据集的最小示例:
df1:
我想创建这个date_count,所以目标数据集是:
df1:
创建df1的实际代码:
df1:
date
2017/01/03
2017/01/03
2017/01/04
2017/01/04
2017/01/04
2017/01/05
我想创建这个date_count,所以目标数据集是:
df1:
date date_count
2017/01/03 2
2017/01/03 2
2017/01/04 3
2017/01/04 3
2017/01/04 3
2017/01/05 1
创建df1的实际代码:
dict1 = [{'date': '2017/01/03', 'date_count': 2},{'date': '2017/01/03', 'date_count': 2},
{'date': '2017/01/04', 'date_count': 3},{'date': '2017/01/04', 'date_count': 3},
{'date': '2017/01/04', 'date_count': 3},{'date': '2017/01/05', 'date_count': 1}]
df = pd.DataFrame(dict1, index=['s1', 's2','s3','s1','s2','s3'])
groupby
吗? - rpanaigroupby
和pd.merge
或transform
来完成这个编程任务。 - rpanaitransform('count')
。 - user3483203