我大约两周前开始使用pandas库,学习新的功能。我需要帮助解决以下问题。
我有一列日期数据,格式混合。这里有两种格式:
mm/dd/yyyy
dd/mm/yyyy
数据集的一个摘录:
Dates
6/5/2016
7/5/2016
7/5/2016
7/5/2016
9/5/2016
9/5/2016
9/5/2016
9/5/2016
5/13/2016
5/14/2016
5/14/2016
我很难将它们转换为一种通用格式。我尝试使用pandas的“to_datetime”。但它不起作用。 我也不确定在这种情况下如何使用正则表达式会有所帮助。
另一个信息是,日期是按顺序排列的。是否可以使用info做些什么。
编辑1: 我知道如果单独看6/4/2016和5/6/2016,无法区分它们。然而,我希望由于日期按升序排列,并且实际数据集分布在一年之内,会有一种方法来理解它。是否有人知道可以根据日期升序排列的事实来理解给定格式的函数?
编辑2: 两个月的样本:2016年4月和5月。请注意,没有模式。因此,请不要基于下面数据的模式提出任何解决方案。
4/1/2016 4/1/2016 4/3/2016 4/3/2016 3/4/2016 4/4/2016 4/4/2016 4/5/2016 4/5/2016 4/7/2016 4/7/2016 4/8/2016 4/8/2016 4/14/2016 4/16/2016 6/4/2016 7/4/2016 8/4/2016 11/4/2016 11/4/2016 11/4/2016 11/4/2016 11/4/2016 12/4/2016 12/4/2016 12/4/2016 13/4/2016 13/4/2016 13/4/2016 13/4/2016 14/04/2016 15/4/2016 16/4/2016 16/4/2016 18/4/2016 18/4/2016 19/4/2016 19/4/2016 20/4/2016 20/4/2016 21/4/2016 21/4/2016 21/4/2016 22/4/2016 23/4/2016 23/4/2016 25/4/2016 25/4/2016 26/4/2016 26/4/2016 26/4/2016 26/4/2016 26/4/2016 26/4/2016 29/4/2016 29/4/2016 29/4/2016 30/4/2016 2/5/2016 2/5/2016 3/5/2016 3/5/2016 3/5/2016 3/5/2016 4/5/2016 5/4/2016 5/4/2016 5/4/2016 6/5/2016 6/5/2016 7/5/2016 7/5/2016 7/5/2016 9/5/2016 9/5/2016 9/5/2016 9/5/2016 10/5/2016 10/5/2016 11/5/2016 11/5/2016 12/5/2016 5/13/2016 5/14/2016 5/14/2016 5/15/2016 5/16/2016 5/16/2016 5/16/2016 5/16/2016 5/16/2016 5/16/2016 5/16/2016 5/17/2016 5/17/2016 5/18/2016 5/18/2016 5/19/2016 5/19/2016 5/20/2016 5/20/2016 5/20/2016 5/20/2016 5/20/2016 5/21/2016 5/23/2016 5/23/2016 5/23/2016 5/23/2016 5/23/2016 5/23/2016 5/24/2016 5/24/2016 5/25/2016 5/26/2016 5/26/2016 5/26/2016 5/27/2016 5/27/2016 5/27/2016 5/27/2016 5/27/2016 5/27/2016 5/27/2016 5/28/2016 5/30/2016 5/30/2016