如何将ISO 8601日期时间字符串转换为Python日期时间对象?

604
我得到了一个类似于"2009-05-28T16:15:00"这样的日期时间字符串(我认为这是ISO 8601格式)。一种可行的方法似乎是使用time.strptime解析字符串,并将元组的前六个元素传递给datetime构造函数,例如:
datetime.datetime(*time.strptime("2007-03-04T21:08:12", "%Y-%m-%dT%H:%M:%S")[:6])

我还没有找到更好的方法来做这件事。有吗?


27
值得注意的是,这个问题并不完全是与它被关闭的问题重复。相关问题具体指的是RFC 3339字符串,而这个问题涉及到ISO 8601字符串。RFC 3339语法是ISO 8601语法的子集(在非免费的ISO 8601标准中定义,像大多数ISO标准一样,您必须要么盗版,要么支付巨额费用才能阅读)。在这个问题中展示的日期时间字符串是一个ISO 8601日期时间,但不是RFC 3339日期时间。UTC偏移量在RFC 3339日期时间中是强制性的,在这里没有提供。 - Mark Amery
11个回答

925

我更喜欢使用dateutil库来处理时区和日期解析。如果你碰到像这样的一个 ISO 8601 字符串: 2010-05-08T23:41:54.000Z 并且不确定其中是否包含时区信息,用 strptime 解析会很令人头疼。我在使用中遇到了一些问题(请查看它们的追踪器),而 pyiso8601 已经好几年没有更新了。相比之下,dateutil 活跃并且对我有用:

from dateutil import parser
yourdate = parser.parse(datestring)

5
对的,pyiso8601存在一些非常微妙的问题,当它已经在整个代码中传播时,你可能会注意到这些问题。dateutil.parser非常好用,但如果必要的话,应该手动强制执行tz-awareness。 - Daniel F
5
2014年2月初pyiso8601的更新解决了许多问题。它可以处理更广泛的有效ISO8601字符串。这值得再次关注。 - Dave Hein
5
请您指正我是否有误,您所提到的时间示例中的 Z 是否特别指示了一个 UTC 时间? - dicroce
170
从Python 3.7开始,你可以使用datetime.datetime.fromisoformat函数。详情请参阅https://docs.python.org/3/library/datetime.html#datetime.datetime.fromisoformat - Yuri Ritvin
71
您提供的链接中的官方文档有一个警告:这种方法不能解析任意的ISO 8601格式字符串,它只是datetime.isoformat()的倒数操作。更全面的ISO 8601解析器可在第三方包dateutil中使用。所以即使对于Python 3.7版本,我们仍需使用dateutil包。 - Voicu
显示剩余7条评论

311

自 Python 3.7 开始,无需使用外部库,您可以使用 fromisoformat 函数从 datetime 模块中获取:

datetime.datetime.fromisoformat('2019-01-04T16:41:24+02:00')

Python 2不支持%z格式说明符,所以最好在可能的情况下明确使用Zulu时间:

datetime.datetime.strptime("2007-03-04T21:08:12Z", "%Y-%m-%dT%H:%M:%SZ")

3
也许你是在寻找datetime模块级别的函数,而不是datetime.datetime类方法。 - tzot
48
不过你得承认,这与Python的理念相矛盾,显得不够明显... strptime?他们为什么不能使用一个更有意义的名称,而要沿用一个古老且糟糕的C语言名称呢? - Roman Starkov
11
请注意,这仅解析 ISO 8601 的子集。如果您告诉客户您可以解析所有 8601 的日期时间,他们可能会发送没有破折号、没有冒号、使用周数而不是月份等等的日期时间格式给您。 - Peter
4
自Python 3.7起,标准库中新增了一个类方法:datetime.datetime.fromisoformat(date_string)。详见 https://docs.python.org/3/library/datetime.html#datetime.datetime.fromisoformat 和 https://dev59.com/8HVC5IYBdhLWcg3w-mVO#49784038。 - pabouk - Ukraine stay strong
10
文档中写道:“警告:该方法不支持解析任意的 ISO 8601 字符串,它只是 datetime.isoformat() 方法的反向操作。如果需要更全面的 ISO 8601 解析器,可以使用第三方包 dateutil 中的 dateutil.parser.isoparse。”特别要注意的是,文档中给出的示例无法正常运行,会抛出“ValueError: Invalid isoformat string:” 的异常。 - Mark Lakata
显示剩余6条评论

66

因为ISO 8601允许出现许多可选的冒号和破折号,基本格式为CCYY-MM-DDThh:mm:ss[Z|(+|-)hh:mm]。如果你想使用strptime,需要首先去除这些变体。

目标是生成一个UTC日期时间对象。


如果您只想处理带有Z后缀的UTC基本情况,例如2016-06-29T19:36:29.3453Z

datetime.datetime.strptime(timestamp.translate(None, ':-'), "%Y%m%dT%H%M%S.%fZ")
如果您想处理时区偏移量,例如2016-06-29T19:36:29.3453-04002008-09-03T20:56:35.450686+05:00,请使用以下方法。这将把所有变体转换为没有可变分隔符的形式,例如20080903T205635.450686+0500,使其更一致/更容易解析。
import re
# This regex removes all colons and all
# dashes EXCEPT for the dash indicating + or - utc offset for the timezone
conformed_timestamp = re.sub(r"[:]|([-](?!((\d{2}[:]\d{2})|(\d{4}))$))", '', timestamp)
datetime.datetime.strptime(conformed_timestamp, "%Y%m%dT%H%M%S.%f%z" )
如果你的系统不支持%z strptime 指令(你会看到类似于ValueError: 'z' is a bad directive in format '%Y%m%dT%H%M%S.%f%z' 的错误信息),那么你需要手动计算时间偏移量,从 Z(UTC)开始。请注意,在 Python 版本<3 上,%z 可能无法在您的系统上正常工作,因为它依赖于 C 库支持,而 C 库的支持因系统/Python 构建类型(例如 Jython Cython 等)而异。
import re
import datetime

# This regex removes all colons and all
# dashes EXCEPT for the dash indicating + or - utc offset for the timezone
conformed_timestamp = re.sub(r"[:]|([-](?!((\d{2}[:]\d{2})|(\d{4}))$))", '', timestamp)

# Split on the offset to remove it. Use a capture group to keep the delimiter
split_timestamp = re.split(r"([+|-])",conformed_timestamp)
main_timestamp = split_timestamp[0]
if len(split_timestamp) == 3:
    sign = split_timestamp[1]
    offset = split_timestamp[2]
else:
    sign = None
    offset = None

# Generate the datetime object without the offset at UTC time
output_datetime = datetime.datetime.strptime(main_timestamp +"Z", "%Y%m%dT%H%M%S.%fZ" )
if offset:
    # Create timedelta based on offset
    offset_delta = datetime.timedelta(hours=int(sign+offset[:-2]), minutes=int(sign+offset[-2:]))

    # Offset datetime with timedelta
    output_datetime = output_datetime + offset_delta

1
注意,这个程序适当地处理了时区(请注意 .%fZ)。 - theannouncer
1
这将无法处理有效的ISO 8601日期时间,例如“20160628T100000”。 - Seppo Erviälä
11
哦,亲爱的Python。你到底在干什么?!? - Robino
1
@mhwh 很好的发现,我已经更新了代码。 - theannouncer
1
如果在模式中使用捕获括号,则模式中所有组的文本也作为结果列表的一部分返回。哈哈,因为我刚刚在上面留下了“使用捕获组来保留分隔符”的注释。 - theannouncer
显示剩余4条评论

46

Arrow 看起来很有前途:

>>> import arrow
>>> arrow.get('2014-11-13T14:53:18.694072+00:00').datetime
datetime.datetime(2014, 11, 13, 14, 53, 18, 694072, tzinfo=tzoffset(None, 0))

Arrow是一个Python库,提供了一种明智、智能的方式来创建、操作、格式化和转换日期和时间。Arrow简单、轻量级,受到moment.jsrequests的启发。


19

当比较非时区感知的日期时间与时区感知的日期时间时,您应该特别注意时区信息,否则可能会遇到问题。

最好始终使它们有时区意识(即使只是 UTC),除非您确切知道为什么不这样做没有任何用处。

#-----------------------------------------------
import datetime
import pytz
import dateutil.parser
#-----------------------------------------------

utc = pytz.utc
BERLIN = pytz.timezone('Europe/Berlin')
#-----------------------------------------------

def to_iso8601(when=None, tz=BERLIN):
  if not when:
    when = datetime.datetime.now(tz)
  if not when.tzinfo:
    when = tz.localize(when)
  _when = when.strftime("%Y-%m-%dT%H:%M:%S.%f%z")
  return _when[:-8] + _when[-5:] # Remove microseconds
#-----------------------------------------------

def from_iso8601(when=None, tz=BERLIN):
  _when = dateutil.parser.parse(when)
  if not _when.tzinfo:
    _when = tz.localize(_when)
  return _when
#-----------------------------------------------

9

我还没有尝试过,但pyiso8601承诺支持这个功能。


4
pyiso8601仅接受非常有限的日期时间格式,建议使用dateutil.parser代替。目前支持处理以下格式:1) 2006-01-01T00:00:00Z 2) 2006-01-01T00:00:00[+-]00:00。在ISO标准下,使用[+-]0000作为时区信息同样有效。如果使用[+-]0000,它将丢弃时区信息... - Daniel F
1
pyiso8601 最近进行了更新(大约在2014年2月),现在可以处理 [+-]0000,同时也可以处理仅包含日期的情况。我一直在成功地使用 pyiso8601。 - Dave Hein

8
import datetime, time
def convert_enddate_to_seconds(self, ts):
    """Takes ISO 8601 format(string) and converts into epoch time."""
    dt = datetime.datetime.strptime(ts[:-7],'%Y-%m-%dT%H:%M:%S.%f')+\
                datetime.timedelta(hours=int(ts[-5:-3]),
                minutes=int(ts[-2:]))*int(ts[-6:-5]+'1')
    seconds = time.mktime(dt.timetuple()) + dt.microsecond/1000000.0
    return seconds

这也包括毫秒和时区。

如果时间是“2012-09-30T15:31:50.262-08:00”,则会转换为时间戳。

>>> import datetime, time
>>> ts = '2012-09-30T15:31:50.262-08:00'
>>> dt = datetime.datetime.strptime(ts[:-7],'%Y-%m-%dT%H:%M:%S.%f')+ datetime.timedelta(hours=int(ts[-5:-3]), minutes=int(ts[-2:]))*int(ts[-6:-5]+'1')
>>> seconds = time.mktime(dt.timetuple()) + dt.microsecond/1000000.0
>>> seconds
1348990310.26

6

双向转换:

从Epoch时间到ISO时间:

isoTime = time.strftime('%Y-%m-%dT%H:%M:%SZ', time.gmtime(epochTime))

ISO时间转换为Epoch时间:

epochTime = time.mktime(time.strptime(isoTime, '%Y-%m-%dT%H:%M:%SZ'))

2
但你只能使用UTC时间(z)。 - confiq
2
不解析小数秒和时区(除了“Z”)。 - Robino
不错的建议,不过你可以修改文本字符串参数以适应你特定的格式。https://docs.python.org/2/library/time.html 你只需要操作字符串以适应你的输入即可。 - billmanH
1
此外,您可以设置任意格式而不是ISO:time.strftime("%d-%m-%y %H:%M", time.localtime(EPOCH_TIME)) - whtyger

5

Isodate似乎有最完整的支持。


2
语法如下:dt = isodate.parse_datetime(ts) - ryantuck

4

aniso8601 可以处理这个问题。它还能理解时区、支持 Python 2 和 Python 3,并且对 ISO 8601 其余部分有较为全面的覆盖,如果您需要的话。

import aniso8601
aniso8601.parse_datetime('2007-03-04T21:08:12')

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接