我正在Jupyter Notebook中使用python/pySpark进行工作,并尝试弄清楚以下问题:
我有一个类似于数据框的东西。
我需要将MainDate与Date1-Date4中的每个日期进行比较,如果MainDate == Date#,则创建一个新列REAL = Date#,如果没有匹配,则REAL =“None”,所有日期都以日期格式给出。另外,真实数据框具有Date1到Date72,可能只有一个匹配,如果有任何匹配。 最终结果:
提前感谢您。
我有一个类似于数据框的东西。
MainDate Date1 Date2 Date3 Date4
2015-10-25 2015-09-25 2015-10-25 2015-11-25 2015-12-25
2012-07-16 2012-04-16 2012-05-16 2012-06-16 2012-07-16
2005-03-14 2005-07-14 2005-08-14 2005-09-14 2005-10-14
我需要将MainDate与Date1-Date4中的每个日期进行比较,如果MainDate == Date#,则创建一个新列REAL = Date#,如果没有匹配,则REAL =“None”,所有日期都以日期格式给出。另外,真实数据框具有Date1到Date72,可能只有一个匹配,如果有任何匹配。 最终结果:
MainDate Date1 Date2 Date3 Date4 REAL
2015-10-25 2015-09-25 2015-10-25 2015-11-25 2015-12-25 Date2
2012-07-16 2012-04-16 2012-05-16 2012-06-16 2012-07-16 Date4
2005-03-14 2005-07-14 2005-08-14 2005-09-14 2005-10-14 None
提前感谢您。