我有一个数据框 news_count
,以下是它的列名,来自于 news_count.columns.values
的输出:
[('date', '') ('EBIX UW Equity', 'NEWS_SENTIMENT_DAILY_AVG') ('Date', '')
('day', '') ('month', '') ('year', '')]
我需要按年份和月份进行分组,并对'NEWS_SENTIMENT_DAILY_AVG'
的值进行求和。以下是我尝试过的代码,但都不起作用:
尝试1
news_count.groupby(['year','month']).NEWS_SENTIMENT_DAILY_AVG.values.sum()
'AttributeError: 'DataFrameGroupBy' object has no attribute'
尝试2
news_count.groupby(['year','month']).iloc[:,1].values.sum()
AttributeError: Cannot access callable attribute 'iloc' of 'DataFrameGroupBy' objects, try using the 'apply' method
输入数据:
ticker date EBIX UW Equity month year
field NEWS_SENTIMENT_DAILY_AVG
0 2007-05-25 0.3992 5 2007
1 2007-11-06 0.3936 11 2007
2 2007-11-07 0.2039 11 2007
3 2009-01-14 0.2881 1 2014
news_count.groupby(['year','month']).NEWS_SENTIMENT_DAILY_AVG.sum()
吗? - cs95NEWS_SENTIMENT_DAILY_AVG
列。错误信息 -AttributeError:'DataFrameGroupBy'对象没有'NEWS_SENTIMENT_DAILY_AVG'属性
。 - Arvinth Kumardf.columns = ['date', 'avg', 'day', 'month', 'year', ...]
等等。如果您可以这样做,请更新您的数据框架,并再次尝试我的第一条评论中的建议。 - cs95