在pandas中,我可以使用
但是因为我的csv文件非常大,而且最后几行比前面的几行更重要,所以我想读取最后的10000行。然而,即使我知道文件的长度,要跳过一个1000000行的csv文件的前990000行,使用
如何获取具有第0行标题的csv文件的最后10000行,最好不知道文件的行数?
pandas.io.parser.read_csv("file.csv", nrows=10000)
来获取csv文件的前10000行。但是因为我的csv文件非常大,而且最后几行比前面的几行更重要,所以我想读取最后的10000行。然而,即使我知道文件的长度,要跳过一个1000000行的csv文件的前990000行,使用
pandas.io.parser.read_csv("file.csv", nrows=10000, skiprows=990000)
也会跳过包含文件头的第一行。(header=0
是在应用了 skiprows
后进行计算的,所以它也无法帮助。)如何获取具有第0行标题的csv文件的最后10000行,最好不知道文件的行数?
tail -n 10000 file > file2
可能是最简单的方法... - Martin TournoijPython
,你可以在subprocess.call()
中调用它 :P - Patrick the Cathead -n 1 file > file2; tail -n 10000 file >> file2
。 - Anton Protopopovhead -1 file > file2; tail -10000 file >> file2
。我少打了四个键。 - Patrick the Cat