我想从概念上了解为什么在使用str(Series).split()和Series.str.split()分割日期这个series对象时会有输出差异。str(Series).split()并没有给我想要的结果,而另一种方法使用Series.str.split(),但是我听说使用[dot]访问器不被看好。我在网上搜索,但没有得到令人满意的答案。有人能帮我并解释一下吗?我正在使用以下系列对象。
df5 = pd.Series(["04/20/2009", "04/20/09", "4/20/09", "4/3/09", "Mar-20-2009", "Mar 20, 2009", "March 20, 2009", "Mar. 20, 2009", "Mar 20 2009", "20 Mar 2009","20 March 2009", "20 Mar. 2009", "20 March, 2009", "Mar 20th, 2009", "Mar 21st, 2009", "Mar 22nd, 2009", "Feb 2009", "Sep 2009", "Oct 2010", "6/2008","12/2009", "2009", "2010"])
str(Series)
会返回序列的字符串表示形式,因此str(Series).split()
会将该字符串分割成多个部分。而Series.str.split()
则会将序列中的每个单元格都看作字符串并将这些字符串分割开来。请注意,翻译时需保持原意,同时使语言通俗易懂。 - Quang Hoangdf['col name']
可以正常工作,而df.col name
则无法正常工作。 - anky