我有一个包含数百个(可能超过1k)时间顺序数据的csv数据文件夹。理想情况下,这些数据应该在一个csv文件中,以便我可以一次性分析全部数据。我想知道的是,是否有一种使用Python将所有文件追加到彼此上的方法。
我的文件存在以下类似位置的文件夹中:
C:\Users\folder\Database Files\1st September
C:\Users\folder\Database Files\1st October
C:\Users\folder\Database Files\1st November
C:\Users\folder\Database Files\1st December
etc
在每个文件夹中都有3个csv文件(我使用csv这个术语是因为这些文件实际上保存为.txt文件,其中包含用“|”分隔的值)
假设这些文件名为:
MonthNamOne.txt
MonthNamTwo.txt
MonthNameOneTwoMurged.txt
我该如何编写代码,或者是否有可能编写代码来遍历这个目录中的所有文件夹,并将所有名为OneTwoMerged.txt
的文件合并在一起?
os.path.walk()
开始。这将为您提供一种查找所有文件的简单方法。在掌握了这个之后,先不要考虑csv
部分。然后,剩下的将会很容易 :-) 或者可以从更简单的os.walk()
开始。在一开始会比较少混淆。 - Tim Peterscat mydir/**/*OneTwoMurged.txt > my_merged_file.txt
将所有文件合并到一个文件中。 - kalharttos.path.walk
已被弃用并且在 3.x 中也不再使用,我认为 OP 应该忽略os.path.walk
。 - Jon Clements