我对Python和编程完全不熟悉。我的数据是按每分钟为间隔采集的,但有些时间可能会丢失。我想填补这些缺失的时间并将相应的数据点设为NaN值。目前我的代码会将所有数据点都设为NaN,而不仅仅是缺失的数据点。
import pandas as pd
df = pd.read_csv("data3.csv", index_col="DateTime")
df = df.reindex(pd.date_range("11-1-2014 12:00:00", "11-1-2014 12:10:00", freq="1min"), fill_value="NaN")
df.to_csv("test3.csv")
我正在阅读的文件
NSERC_CB04_A0401
DateTime
11/1/2014 0:00 1.121889
11/1/2014 0:01 1.121889
11/1/2014 0:02 1.121889
11/1/2014 0:03 1.121889
11/1/2014 0:04 1.118503
11/1/2014 0:05 1.121889
11/1/2014 0:06 1.121889
11/1/2014 0:07 1.121889
11/1/2014 0:09 1.121889
11/1/2014 0:10 1.121889
我正在编写的文件
NSERC_CB04_A0401
2014-11-01 12:00:00 NaN
2014-11-01 12:01:00 NaN
2014-11-01 12:02:00 NaN
2014-11-01 12:03:00 NaN
2014-11-01 12:04:00 NaN
2014-11-01 12:05:00 NaN
2014-11-01 12:06:00 NaN
2014-11-01 12:07:00 NaN
2014-11-01 12:08:00 NaN
2014-11-01 12:09:00 NaN
2014-11-01 12:10:00 NaN
我希望你能做什么:
NSERC_CB04_A0401
DateTime
11/1/2014 0:00 1.121889
11/1/2014 0:01 1.121889
11/1/2014 0:02 1.121889
11/1/2014 0:03 1.121889
11/1/2014 0:04 1.118503
11/1/2014 0:05 1.121889
11/1/2014 0:06 1.121889
11/1/2014 0:07 1.121889
2014-11-01 12:08:00 NaN
11/1/2014 0:09 1.121889
11/1/2014 0:10 1.121889