如何将Windows时区转换为pytz理解的时区?

14
在Windows Python环境中,我可以这样获取本地时区,但在使用pytz时无法使用:
>>> import win32timezone
>>> win32timezone.TimeZoneInfo.local()
TimeZoneInfo(u'US Mountain Standard Time', True)
>>> win32timezone.TimeZoneInfo.local().timeZoneName
u'US Mountain Standard Time'
>>> tz = pytz.timezone(win32timezone.TimeZoneInfo.local().timeZoneName)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "C:\Python27\lib\site-packages\pytz\__init__.py", line 185, in timezone
    raise UnknownTimeZoneError(zone)
pytz.exceptions.UnknownTimeZoneError: 'US Mountain Standard Time'

有什么好的方式可以将输出转换为pytz.timezone()能够理解的时区名称?


这里是使用tzlocal的答案(感谢Matt):

>>> from tzlocal.win32 import get_localzone_name
>>> get_localzone_name()
'America/Phoenix'
>>> tz = pytz.timezone(get_localzone_name())
>>> tz
<DstTzInfo 'America/Phoenix' MST-1 day, 17:00:00 STD>
2个回答

14
不要根据Windows时区ID的名称来做任何假设。例如,US Mountain Standard Time实际上是Windows时区适用于大多数亚利桑那州的时区,因为它不实行夏令时而永久在MST时区。但是山脉时区的其余部分的Windows ID是Mountain Standard Time - 在山地日光节约时间期间会实行夏令时,但时区ID不会改变!这两个区域ID之间唯一的区别是前缀“US”。在IANA / Olson数据库中,这是两个非常不同的区域 - America/PhoenixAmerica/Denver
您需要的是Unicode CLDR项目提供的从Windows到Olson时区ID的映射。请阅读TimeZone tag wiki以获取信息和链接。我不确定Python中是否已经有一个实现这一点的库 - 您可能需要进行一些研究,或从原始数据中自己实现它。
更新
经过一番搜索,我找到了一个名为tzlocal的Python库,其中包含CLDR映射。它甚至很友好地包括一个脚本,可以从CLDR网站获取当前映射并更新自己。我自己没有尝试过,但它似乎采用了正确的方法。它主要专注于返回当前系统时区,在适用于pytz的IANA / Olson id中。请参阅作者的博客文章以了解其使用方式。

Matt,谢谢你指出这一点。这似乎比我最初想象的要复杂得多。奇怪的是,没有一个Windows Python库考虑到所有这些问题... - Chris Matta
Olson 数据库在几乎所有方面都是优越的,这也是 pytz 实现的内容。您是否有必要使用 Windows 时区呢? - Matt Johnson-Pint
我可能错过了,但是有没有一种方法可以使用pytz来获取机器当前时区的Olsen名称? - Chris Matta
@ChrisMatta:最近的Windows可以直接使用Olson数据库。 (http://www.iana.org/time-zones/repository/tz-link.html) - jfs
@J.F.Sebastian - 是的,但 Python 能调用 Windows 运行时 API 吗?我不确定。 - Matt Johnson-Pint
@MattJohnson:我不知道你是否需要WinRT才能访问tz数据。理想情况下,您可以以tzfile格式获取tz数据并将其提供给pytz - jfs

7

Anurag Uniyal发布了一种替代方法来发现时区名称,与计算机报告的tzname和utcoffset一致。


继续Matt Johnson的解决方案,以下是如何加载Unicode Common Locale Data Repository (CLDR)映射从Windows时区ID到Olson时区名称:

import lxml.etree as ET
import collections
import pprint
result = {}
doc = ET.parse('http://unicode.org/repos/cldr/trunk/common/supplemental/windowsZones.xml')
for zone in doc.xpath('//mapZone'):
    attrib = zone.attrib
    if attrib['territory'] == '001':
        result[attrib['other']] = attrib['type']
pprint.pprint(dict(result))

产量
{'AUS Central Standard Time': 'Australia/Darwin',
 'AUS Eastern Standard Time': 'Australia/Sydney',
 'Afghanistan Standard Time': 'Asia/Kabul',
 'Alaskan Standard Time': 'America/Anchorage',
 'Arab Standard Time': 'Asia/Riyadh',
 'Arabian Standard Time': 'Asia/Dubai',
 'Arabic Standard Time': 'Asia/Baghdad',
 'Argentina Standard Time': 'America/Buenos_Aires',
 'Atlantic Standard Time': 'America/Halifax',
 'Azerbaijan Standard Time': 'Asia/Baku',
 'Azores Standard Time': 'Atlantic/Azores',
 'Bahia Standard Time': 'America/Bahia',
 'Bangladesh Standard Time': 'Asia/Dhaka',
 'Canada Central Standard Time': 'America/Regina',
 'Cape Verde Standard Time': 'Atlantic/Cape_Verde',
 'Caucasus Standard Time': 'Asia/Yerevan',
 'Cen. Australia Standard Time': 'Australia/Adelaide',
 'Central America Standard Time': 'America/Guatemala',
 'Central Asia Standard Time': 'Asia/Almaty',
 'Central Brazilian Standard Time': 'America/Cuiaba',
 'Central Europe Standard Time': 'Europe/Budapest',
 'Central European Standard Time': 'Europe/Warsaw',
 'Central Pacific Standard Time': 'Pacific/Guadalcanal',
 'Central Standard Time': 'America/Chicago',
 'Central Standard Time (Mexico)': 'America/Mexico_City',
 'China Standard Time': 'Asia/Shanghai',
 'Dateline Standard Time': 'Etc/GMT+12',
 'E. Africa Standard Time': 'Africa/Nairobi',
 'E. Australia Standard Time': 'Australia/Brisbane',
 'E. Europe Standard Time': 'Asia/Nicosia',
 'E. South America Standard Time': 'America/Sao_Paulo',
 'Eastern Standard Time': 'America/New_York',
 'Egypt Standard Time': 'Africa/Cairo',
 'Ekaterinburg Standard Time': 'Asia/Yekaterinburg',
 'FLE Standard Time': 'Europe/Kiev',
 'Fiji Standard Time': 'Pacific/Fiji',
 'GMT Standard Time': 'Europe/London',
 'GTB Standard Time': 'Europe/Bucharest',
 'Georgian Standard Time': 'Asia/Tbilisi',
 'Greenland Standard Time': 'America/Godthab',
 'Greenwich Standard Time': 'Atlantic/Reykjavik',
 'Hawaiian Standard Time': 'Pacific/Honolulu',
 'India Standard Time': 'Asia/Calcutta',
 'Iran Standard Time': 'Asia/Tehran',
 'Israel Standard Time': 'Asia/Jerusalem',
 'Jordan Standard Time': 'Asia/Amman',
 'Kaliningrad Standard Time': 'Europe/Kaliningrad',
 'Korea Standard Time': 'Asia/Seoul',
 'Magadan Standard Time': 'Asia/Magadan',
 'Mauritius Standard Time': 'Indian/Mauritius',
 'Middle East Standard Time': 'Asia/Beirut',
 'Montevideo Standard Time': 'America/Montevideo',
 'Morocco Standard Time': 'Africa/Casablanca',
 'Mountain Standard Time': 'America/Denver',
 'Mountain Standard Time (Mexico)': 'America/Chihuahua',
 'Myanmar Standard Time': 'Asia/Rangoon',
 'N. Central Asia Standard Time': 'Asia/Novosibirsk',
 'Namibia Standard Time': 'Africa/Windhoek',
 'Nepal Standard Time': 'Asia/Katmandu',
 'New Zealand Standard Time': 'Pacific/Auckland',
 'Newfoundland Standard Time': 'America/St_Johns',
 'North Asia East Standard Time': 'Asia/Irkutsk',
 'North Asia Standard Time': 'Asia/Krasnoyarsk',
 'Pacific SA Standard Time': 'America/Santiago',
 'Pacific Standard Time': 'America/Los_Angeles',
 'Pacific Standard Time (Mexico)': 'America/Santa_Isabel',
 'Pakistan Standard Time': 'Asia/Karachi',
 'Paraguay Standard Time': 'America/Asuncion',
 'Romance Standard Time': 'Europe/Paris',
 'Russian Standard Time': 'Europe/Moscow',
 'SA Eastern Standard Time': 'America/Cayenne',
 'SA Pacific Standard Time': 'America/Bogota',
 'SA Western Standard Time': 'America/La_Paz',
 'SE Asia Standard Time': 'Asia/Bangkok',
 'Samoa Standard Time': 'Pacific/Apia',
 'Singapore Standard Time': 'Asia/Singapore',
 'South Africa Standard Time': 'Africa/Johannesburg',
 'Sri Lanka Standard Time': 'Asia/Colombo',
 'Syria Standard Time': 'Asia/Damascus',
 'Taipei Standard Time': 'Asia/Taipei',
 'Tasmania Standard Time': 'Australia/Hobart',
 'Tokyo Standard Time': 'Asia/Tokyo',
 'Tonga Standard Time': 'Pacific/Tongatapu',
 'Turkey Standard Time': 'Europe/Istanbul',
 'US Eastern Standard Time': 'America/Indianapolis',
 'US Mountain Standard Time': 'America/Phoenix',
 'UTC': 'Etc/GMT',
 'UTC+12': 'Etc/GMT-12',
 'UTC-02': 'Etc/GMT+2',
 'UTC-11': 'Etc/GMT+11',
 'Ulaanbaatar Standard Time': 'Asia/Ulaanbaatar',
 'Venezuela Standard Time': 'America/Caracas',
 'Vladivostok Standard Time': 'Asia/Vladivostok',
 'W. Australia Standard Time': 'Australia/Perth',
 'W. Central Africa Standard Time': 'Africa/Lagos',
 'W. Europe Standard Time': 'Europe/Berlin',
 'West Asia Standard Time': 'Asia/Tashkent',
 'West Pacific Standard Time': 'Pacific/Port_Moresby',
 'Yakutsk Standard Time': 'Asia/Yakutsk'}

如果您不希望程序依赖于lxml或网络连接,您可以将此字典放入一个模块中,并从那里使用它。

有趣的技巧...我明天会在一些常见的时区中运行它,并告诉你它的效果如何! - Chris Matta
当你谈论任何东西的ID时,紧密匹配并不是一个好主意。如果它们只是名称,那没问题。但每个区域的特定ID具有非常特定的含义。请参阅我的答案以获取更多详细信息。 - Matt Johnson-Pint
你更新中的链接很有趣。但我很好奇,这对Windows区域有什么帮助呢?此外,我不明白他们在那篇文章中查看了哪些源数据,他们声称从Linux的“TZ”变量获取值,但据我所知,那已经是一个Olson标识符了,不是吗? - Matt Johnson-Pint
@MattJohnson:Uniyal的解决方案没有使用Windows时区ID或Unix TZ环境变量。为了演示其用法,他设置了TZ以更改计算机的时区,但是在正常使用中,您不需要设置或甚至具有TZ环境变量。他的解决方案使用time模块来查找本地计算机的UTC偏移和tzname(复数形式,因为time为使用DST的那些地区提供了时区和altzone)。然后,它查找在pytz.all_timezones中列出的所有具有与本地计算机的UTC偏移和tzname相匹配的时区。 - unutbu
所以它依赖于偏移匹配加缩写?这很奇怪,因为Windows不一定会给你一个有效的缩写,而且缩写可能会有歧义。听起来类似于JavaScript中的jsTimeZoneDetect - 但他们明确表示这只是一个猜测。对于任何真实世界的情况,我不会相信除了CLDR验证映射之外的任何东西。 - Matt Johnson-Pint
谢谢您的发布。此外,看起来已经有一个库可以做到这一点。我刚刚发现它,所以我不能保证它的可靠性,但它看起来是在正确的轨道上。请查看我的更新答案。感谢您的对话! :) - Matt Johnson-Pint

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接