我有一个非常庞大的数据集:https://archive.ics.uci.edu/ml/datasets/individual+household+electric+power+consumption
它包含约250万行。Pandas数据帧索引是一个时间戳,然后有几列。
我想过滤数据集,只看到例如所有年份的早上9点(09:00:00)行(约1400行->365*4)
我尝试了这个:
dataset.groupby(dataset.index.hour == '09:00:00')
但是它不起作用。我也尝试了没有成功的方法:
dataset['09:00:00']
谢谢
==09:00:00
而不是使用== 9
。感谢你的帮助。 - Marc