在 Pandas 中将 SAS 数字日期转换为日期时间

8

我正在使用Pandas 0.18read_sas来加载一个sas7bdat数据集。

在Pandas数据框中,日期的格式如下:

Out[56]: 
0    19411.0
1    19325.0
2    19325.0
3    19443.0
4    19778.0
Name: sas_date, dtype: float64

pd.to_datetime无法识别此格式。我应该如何正确解析日期?

谢谢!


1
请告诉我们这些数字对应的日期是什么。 - unutbu
1个回答

19
根据此链接

[A] SAS日期值是代表从1960年1月1日到指定日期之间的天数的值。

因此,如果我们将这些数字转换为Pandas Timedeltas并将它们添加到1960-1-1,我们就可以恢复出日期:
import numpy as np
import pandas as pd

ser = pd.Series([19411.0, 19325.0, 19325.0, 19443.0, 19778.0])
ser = pd.to_timedelta(ser, unit='D') + pd.Timestamp('1960-1-1')
产出。
0   2013-02-22
1   2012-11-28
2   2012-11-28
3   2013-03-26
4   2014-02-24
dtype: datetime64[ns]

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接