更改DateTimeIndex的日期

14

我有一个名为 data.csv 的csv文件,例如

TS;val
10:00;0.1
10:05;0.2
10:10;0.3
10:15;0.4

我使用这个脚本读取了这个csv文件

#!/usr/bin/env python
import pandas as pd

if __name__ == "__main__":
    yyyy = 2013
    mm = 2
    dd = 1

    df = pd.read_csv('data.csv', sep=';', parse_dates=[0], index_col=0)

    print(df)

我明白了

                     val
TS                      
2013-06-17 10:00:00  0.1
2013-06-17 10:05:00  0.2
2013-06-17 10:10:00  0.3
2013-06-17 10:15:00  0.4

我想将每个DateTimeIndex的日期更改为2013-02-01

                     val
TS                      
2013-02-01 10:00:00  0.1
2013-02-01 10:05:00  0.2
2013-02-01 10:10:00  0.3
2013-02-01 10:15:00  0.4

有什么更简单的方法来做这件事吗?


2
你可以在日期上使用 datetime.replace(year, month, day) - cmd
3个回答

19
时间戳有一个 replace 方法(就像日期时间一样):
In [11]: df.index.map(lambda t: t.replace(year=2013, month=2, day=1))
Out[11]:
array([Timestamp('2013-02-01 10:00:00', tz=None),
       Timestamp('2013-02-01 10:05:00', tz=None),
       Timestamp('2013-02-01 10:10:00', tz=None),
       Timestamp('2013-02-01 10:15:00', tz=None)], dtype=object)

所以将您的索引设置为此值:
In [12]: df.index = df.index.map(lambda t: t.replace(year=2013, month=2, day=1))

值得一提的是,您可以向read_csv传递一个date_parser函数,这可能更符合您的需求:
In [21]: df = pd.read_csv(file_name, sep=';', parse_dates=[0], index_col=0, 
                          date_parser=lambda time: pd.Timestamp('2013/02/01 %s' % time))

In [22]: df
Out[22]:
                     val
TS
2013-02-01 10:00:00  0.1
2013-02-01 10:05:00  0.2
2013-02-01 10:10:00  0.3
2013-02-01 10:15:00  0.4

1
与安迪的答案略有不同:df.index = [ Timestamp('20130201') + timedelta(hours=t.hour,minutes=t.minute) for t in df.index.time ] - Jeff
它可以正常工作,但我想知道是否使用不同的参数与read_csv更有效率。因为read_csv将日期设置为今天,而我们需要替换日期...也许我们可以只用一步来完成这个过程? - scls
@AndyHayden TOTD,我刚刚发布了相同的内容 :( - Jeff
这会报“TypeError: replace()不接受关键字参数”的错误。 - muon
@muon 当条目是时间戳或日期时间时,此方法有效(其中replace方法接受上述kwargs)。如果它是一个字符串,你会看到你所描述的错误。 - Andy Hayden
谢谢@AndyHayden,我通过转换为日期时间格式让它正常工作了,忘记更新注释了 :( - muon

1
提供一个date_parser
In [50]: pd.read_csv(StringIO(data), sep=';', parse_dates=[0], 
                     index_col=0, date_parser=lambda x: Timestamp('20130201 %s' % x))
Out[50]: 
                     val
TS                      
2013-02-01 10:00:00  0.1
2013-02-01 10:05:00  0.2
2013-02-01 10:10:00  0.3
2013-02-01 10:15:00  0.4

0

我看到有两种方法可以做到这一点。第一种是最简单的:使用'string'.split(' ')。对于字符串bb jj,它将返回一个由2个元素bbjj组成的列表,所以只需获取第一个元素。

第二个选项是从字符串创建一个datetime对象,并按照您想要的方式重新格式化它。在我看来,这个解决方案更好。如果明天你想要另一种格式,这将更容易。 要这样做:使用此处记录的strptime函数:http://docs.python.org/2/library/datetime.html#datetime.datetime.strptime

然后要从datetime对象返回字符串,只需使用strftime函数即可。所有不同的格式都在此处提供:http://docs.python.org/2/library/datetime.html#strftime-and-strptime-behavior


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接