使用Python Pandas减去一列中的最后一个和第一个元素

Question

使用Python Pandas减去一列中的最后一个和第一个元素

3

I have a dataframe like this:

A B C Date
2 3 6 03/19/2012 2:33:34.270103 PM
4 8 2 03/19/2012 2:33:34.270308 PM
...
6 2 0 03/19/2012 2:34:04.611729 PM

我需要计算“日期”列中最后一个元素和第一个元素之间的时间差。我需要以秒为单位的时间差。

(10/21/2014 2:34:04.611729 PM) - (03/19/2012 2:33:34.270103 PM) =  ANSWER to print out

同时，我手头的日期格式正是如上所示。有什么想法吗？

- mane

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- WGS · Accepted Answer

首先使用to_datetime方法将Date系列转换为日期时间，然后进行简单的计算即可。

In [24]: df = pd.read_csv("test.csv")

In [25]: df['Date'] = pd.to_datetime(df['Date'])

In [26]: delta = df['Date'].iat[-1] - df['Date'].iat[0]

In [27]: delta
Out[27]: numpy.timedelta64(30300000000,'ns')

In [28]: delta / np.timedelta64(1, 's')
Out[28]: 30.300000000000001

第28行代码是将结果标准化为秒，因为初始结果是以纳秒为单位的。

编辑:

根据您上传的CSV文件，问题在于您的日期格式无法直接转换为datetime格式。在转换前需要删除前两个字符和最后一个字符。下面的代码可以正常工作并提供正确的目标值。

In [1]: import numpy as np

In [2]: import pandas as pd

In [3]: df = pd.read_csv("dummy.csv")

In [4]: str_ = lambda x:x[2:-1]

In [5]: df["Timestamp"] = df["Timestamp"].map(str_)

In [6]: df["Timestamp"] = pd.to_datetime(df["Timestamp"])

In [7]: delta_ = df["Timestamp"].iat[-1] - df["Timestamp"].iat[0]

In [8]: delta_
Out[8]: numpy.timedelta64(36981327000,'ns')

In [9]: delta_ / np.timedelta64(1, "s")
Out[9]: 36.981327

请告诉我们这是否有效。