解决Windows系统上datetime timestamp()在1970-01-01之前日期的问题

5

我目前正在尝试将日期转换为时间戳以在数据集中生成数值特征。如果在Mac上运行,它可以完美地工作,在Windows上会抛出一个错误:

OS Error: [Errno 22] Invalid argument

这可能是由于Windows不支持1970年01月01日之前的Unix时间戳引起的(链接1)。我有从1955年开始的日期。以下是我的代码:

import time
import datetime

current_timestamp = time.time()
df.loc[:, "FEATURE_num"] = df["FEATURE"].apply(lambda d: datetime.datetime.strptime(d, '%Y-%m-%d').timestamp() if isinstance(d, str) else current_timestamp)

我曾在某处看到建议使用datetime.timedelta(),但我无法弄清如何集成它。
1个回答

3
你可以(隐式地)使用datetime.timedelta来计算“公历”时间戳,该时间戳适用于1582年10月15日至今天的日期(或者您想要使用的其他“纪元”)。正如函数的文档字符串所示,默认情况下,日期字符串将使用'%Y-%m-%d' strptime-like 格式字符串参数进行解析,但可以被覆盖。
from datetime import datetime


GREGORIAN_EPOCH = datetime.strptime('1582-10-15', '%Y-%m-%d')


def gregorian_timestamp(date, format='%Y-%m-%d'):
    """ Calculate timestamp using start of Gregorian calender as epoch.

        The date parameter can be either a string or a datetime.datetime
        object. Strings will be parsed using the '%Y-%m-%d' format by default
        unless a different one is specfied via the optional format parameter.
    """
    try:
        date = datetime.strptime(date, format)
    except TypeError:
        pass
    return (date - GREGORIAN_EPOCH).total_seconds()  # The timedelta in seconds.


if __name__ == '__main__':

    current_date = datetime.now()
    timestamp = gregorian_timestamp(current_date)
    print('gregorian timestamp:', timestamp)  # -> gregorian timestamp: 13768250461.136208

    timestamp = gregorian_timestamp('1970-01-01')
    print('gregorian timestamp:', timestamp)  # -> gregorian timestamp: 12219292800.0

    timestamp = gregorian_timestamp('1955-02-28')
    print('gregorian timestamp:', timestamp)  # -> gregorian timestamp: 11750918400.0

    timestamp = gregorian_timestamp('1582-10-15')
    print('gregorian timestamp:', timestamp)  # -> gregorian timestamp: 0.0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接