使用strptime将带有偏移量的时间戳转换为datetime对象

66

我正在尝试使用strptime方法将格式为“2012-07-24T23:14:29-07:00”的时间戳转换为Python中的日期时间对象。问题出在末尾的时间偏移量(-07:00)上。如果没有这个偏移量,我可以成功地完成。

time_str = "2012-07-24T23:14:29"

time_obj=datetime.datetime.strptime(time_str,'%Y-%m-%dT%H:%M:%S')

但是使用我尝试过的偏移量

time_str = "2012-07-24T23:14:29-07:00"

time_obj=datetime.datetime.strptime(time_str,'%Y-%m-%dT%H:%M:%S-%z').

但是它会出现一个值错误,指出“z”是一个不好的指令。

有任何解决方法吗?


如何在Python中解析ISO 8601格式的日期? - jfs
4个回答

76
Python 2中的strptime()函数确实不支持%z格式用于时区(因为底层的time.strptime()函数不支持)。您有两个选择:
  • Ignore the timezone when parsing with strptime:

    time_obj = datetime.datetime.strptime(time_str[:19], '%Y-%m-%dT%H:%M:%S')
    
  • use the dateutil module, it's parse function does deal with timezones:

    from dateutil.parser import parse
    time_obj = parse(time_str)
    

以下是命令提示符的快速演示:

>>> from dateutil.parser import parse
>>> parse("2012-07-24T23:14:29-07:00")
datetime.datetime(2012, 7, 24, 23, 14, 29, tzinfo=tzoffset(None, -25200))

您也可以升级到Python 3.2或更高版本,在那里时区支持已经得到改进,以至于%z将起作用,只要您从输入中删除最后一个:,并且在%z之前删除-即可。
>>> import datetime
>>> time_str = "2012-07-24T23:14:29-07:00"
>>> datetime.datetime.strptime(time_str, '%Y-%m-%dT%H:%M:%S%z')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Users/mj/Development/Library/buildout.python/parts/opt/lib/python3.4/_strptime.py", line 500, in _strptime_datetime
    tt, fraction = _strptime(data_string, format)
  File "/Users/mj/Development/Library/buildout.python/parts/opt/lib/python3.4/_strptime.py", line 337, in _strptime
    (data_string, format))
ValueError: time data '2012-07-24T23:14:29-07:00' does not match format '%Y-%m-%dT%H:%M:%S%z'
>>> ''.join(time_str.rsplit(':', 1))
'2012-07-24T23:14:29-0700'
>>> datetime.datetime.strptime(''.join(time_str.rsplit(':', 1)), '%Y-%m-%dT%H:%M:%S%z')
datetime.datetime(2012, 7, 24, 23, 14, 29, tzinfo=datetime.timezone(datetime.timedelta(-1, 61200)))

解析器不幸地无法使用默认的Apache日志日期解析器。parse('24/Jun/2015:00:01:03 +0200') - Gunstick
2
所以这个赢得了互联网,它可以愉快地解析Apache日志文件的时间戳parser.parse('24 / Jun / 2015:00:01:03 +0200'.replace(':',' ',1)) - Gunstick

29

在Python 3.7+中:

from datetime import datetime

time_str = "2012-07-24T23:14:29-07:00"
dt_aware = datetime.fromisoformat(time_str)
print(dt_aware.isoformat('T'))
# -> 2012-07-24T23:14:29-07:00

在Python 3.2+版本中:

from datetime import datetime

time_str = "2012-07-24T23:14:29-0700"
dt_aware = datetime.strptime(time_str, '%Y-%m-%dT%H:%M:%S%z')
print(dt_aware.isoformat('T'))
# -> 2012-07-24T23:14:29-07:00

注意:在Python 3.7之前的版本中,此变体不支持-0700部分中的:rfc 3339允许使用两种格式)。请参见datetime: add ability to parse RFC 3339 dates and times
在旧版本的Python中,例如Python 2.7,您可以手动解析UTC偏移量:
from datetime import datetime

time_str = "2012-07-24T23:14:29-0700"
# split the utc offset part
naive_time_str, offset_str = time_str[:-5], time_str[-5:]
# parse the naive date/time part
naive_dt = datetime.strptime(naive_time_str, '%Y-%m-%dT%H:%M:%S')
# parse the utc offset
offset = int(offset_str[-4:-2])*60 + int(offset_str[-2:])
if offset_str[0] == "-":
   offset = -offset
dt = naive_dt.replace(tzinfo=FixedOffset(offset))
print(dt.isoformat('T'))

这里定义了FixedOffset


6

ValueError: 'z'是格式中的错误指令...

(注意:在我的情况下,我必须坚持使用Python 2.7)

我曾经遇到过类似的问题,从git log --date=iso8601的输出中解析提交日期,但实际上它并不是ISO8601格式(因此在后来的版本中添加了--date=iso8601-strict)。

由于我正在使用django,因此可以利用其中的实用程序。

https://github.com/django/django/blob/master/django/utils/dateparse.py

>>> from django.utils.dateparse import parse_datetime
>>> parse_datetime('2013-07-23T15:10:59.342107+01:00')
datetime.datetime(2013, 7, 23, 15, 10, 59, 342107, tzinfo=+0100)

你可以使用自己的正则表达式代替 strptime


2

使用Python 3.5.2
26 Sep 2000 05:11:00 -0700 转换为:

from datetime import datetime    
dt_obj = datetime.strptime("26 Sep 2000 05:11:00 -0700", '%d %b %Y %H:%M:%S %z')

2012-07-24T23:14:29 -0700 转换为

dt_obj = datetime.strptime('2012-07-24T23:14:29 -0700', '%Y-%m-%dT%H:%M:%S %z')

Python 3.5.2不支持-07:00时区偏移,应该去掉“:”


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接