如何在Python中按创建日期排序获取目录列表?

213

如何在Windows机器上使用Python以特定的排序方式[按创建日期|修改日期]获取目录中所有文件的列表?

19个回答

201
我曾经为一个Python脚本完成过这样的任务:确定目录中最后更新的文件。
import glob
import os

search_dir = "/mydir/"
# remove anything from the list that is not a file (directories, symlinks)
# thanks to J.F. Sebastion for pointing out that the requirement was a list 
# of files (presumably not including directories)  
files = list(filter(os.path.isfile, glob.glob(search_dir + "*")))
files.sort(key=lambda x: os.path.getmtime(x))

基于文件的修改时间来判断,这应该可以达到你所要求的效果。

编辑:请注意,如果需要的话,您还可以使用os.listdir()代替glob.glob()。我在原始代码中使用 glob() 的原因是我想使用它来仅搜索具有特定文件扩展名的文件,而 glob() 更适合此目的。如果要使用listdir,代码如下:

import os

search_dir = "/mydir/"
os.chdir(search_dir)
files = filter(os.path.isfile, os.listdir(search_dir))
files = [os.path.join(search_dir, f) for f in files] # add path to each file
files.sort(key=lambda x: os.path.getmtime(x))

2
files.sort(key=lambda fn: os.path.getmtime(os.path.join(search_dir, fn))) - jfs
42
只需使用files.sort(key=os.path.getmtime)即可(无需使用lambda),这应该可以正常工作。 - jfs
注意:在os.chdir(search_dir)之后,您不需要os.listdir(search_dir);您可以使用os.listdir(os.curdir)代替,因此您也不需要os.path.join(search_dir, f)。您可以用以下代码替换最后三行:files = sorted(filter(os.path.isfile, os.listdir(os.curdir)), key=os.path.getmtime) - jfs
如果文件夹很大,而且只想要最后一个文件,那么没有更有效的方法了,对吧? - FooBar
要监视文件夹中的新文件,您可以使用“watchdog”模块。要在给定目录中仅一次查找最后创建的文件,“max()”+“os.scandir()”或“os.listdir()”就足够了。这里是代码示例(俄文) - jfs
显示剩余10条评论

186

更新:在Python 3中按修改日期对dirpath的条目进行排序:

import os
from pathlib import Path

paths = sorted(Path(dirpath).iterdir(), key=os.path.getmtime)

如果您已经有一个文件名列表files,并且想要在Windows上按创建时间就地排序(请确保该列表包含绝对路径):

(将@Pygirl的答案放在这里以获得更高的可见性)

files.sort(key=os.path.getctime)

你可以获取文件列表,例如使用glob,如@Jay的回答所示。


旧回答 这是@Greg Hewgill的回答的更详细版本。它最符合问题的要求。它区分了创建日期和修改日期(至少在Windows上)。

#!/usr/bin/env python
from stat import S_ISREG, ST_CTIME, ST_MODE
import os, sys, time

# path to the directory (relative or absolute)
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)

# leave only regular files, insert creation date
entries = ((stat[ST_CTIME], path)
           for stat, path in entries if S_ISREG(stat[ST_MODE]))
#NOTE: on Windows `ST_CTIME` is a creation date 
#  but on Unix it could be something else
#NOTE: use `ST_MTIME` to sort by a modification date
        
for cdate, path in sorted(entries):
    print time.ctime(cdate), os.path.basename(path)

例子:

$ python stat_creation_date.py
Thu Feb 11 13:31:07 2009 stat_creation_date.py

1
这个完美地运行了。我正在尝试比较两个目录的cdate。有没有一种方法可以比较两个cdate之间的秒数? - Federer
@cdate 是自纪元以来的秒数的浮点数。 - jfs
4
这很有效,但最简洁的解决方案在 https://dev59.com/Mm855IYBdhLWcg3wKw9Y#4500607。 - jmoz
@jmoz:你的意思是像这样吗?你提供的解决方案是错误的:它没有过滤常规文件。注意:我的解决方案每个dir.entry只调用一次stat - jfs
抱歉,Sebastian 提供的链接更加简洁!谢谢。 - jmoz
显示剩余2条评论

43

有一个os.path.getmtime函数,它返回自纪元以来的秒数并且应该比os.stat更快。

import os 

os.chdir(directory)
sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)

26

这是我的版本:

def getfiles(dirpath):
    a = [s for s in os.listdir(dirpath)
         if os.path.isfile(os.path.join(dirpath, s))]
    a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s)))
    return a

首先,我们建立文件名列表。使用isfile()跳过目录;如果需要包含目录,则可以省略该函数。然后,我们原地对列表进行排序,将修改日期作为键。


它按照最旧的文件先排序到最新的。当我想要最新的5个文件时,我必须执行以下操作:a[-5:] - Daniel Butler

22

这是一行代码:

import os
import time
from pprint import pprint

pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])

这将调用 os.listdir() 以获取文件名列表,然后依次调用 os.stat() 来获取创建时间,最后根据创建时间进行排序。

请注意,此方法每个文件仅调用一次 os.stat(),这比在排序中每次比较都调用该函数更加高效。


1
虽然这样做可以解决问题,但这并不是很符合Python的编程风格(免责声明:未测试代码)。 - Adriano Varoli Piazza
此解决方案未从列表中排除目录。 - Constantin
@Constantin:没错,但是一个快速的[... if stat.S_ISREG(x)]就可以处理这个问题。 - Greg Hewgill

20

在Python 3.5版本及以上

from pathlib import Path
sorted(Path('.').iterdir(), key=lambda f: f.stat().st_mtime)

5
创建日期,使用f.stat().st_ctime代替。 - alanjds
你应该将 PosixPath 对象转换为 str 类型,以便执行字符串方法。 - Franco Gil
也许我误解了这个评论。 您能澄清一下是哪个“str”方法吗?我们正在按“st_mtime”排序,而不是“PosixPath”。 - ignorant

17

不改变目录:

import os    

path = '/path/to/files/'
name_list = os.listdir(path)
full_list = [os.path.join(path,i) for i in name_list]
time_sorted_list = sorted(full_list, key=os.path.getmtime)

print time_sorted_list

# if you want just the filenames sorted, simply remove the dir from each
sorted_filename_list = [ os.path.basename(i) for i in time_sorted_list]
print sorted_filename_list

15
from pathlib import Path
import os

sorted(Path('./').iterdir(), key=lambda t: t.stat().st_mtime)

或者

sorted(Path('./').iterdir(), key=os.path.getmtime)

或者

sorted(os.scandir('./'), key=lambda t: t.stat().st_mtime)

其中 m 时间是修改时间。


12

以下是使用glob而不使用筛选器,按日期顺序阅读特定扩展名文件的Python 3代码示例:

dataset_path='/mydir/'   
files = glob.glob(dataset_path+"/morepath/*.extension")   
files.sort(key=os.path.getmtime)

10
# *** the shortest and best way ***
# getmtime --> sort by modified time
# getctime --> sort by created time

import glob,os

lst_files = glob.glob("*.txt")
lst_files.sort(key=os.path.getmtime)
print("\n".join(lst_files))

please provide context - Claire
“最好”的标准是主观的。如果您能解释为什么认为这是最佳方式,那么您的答案会更好。 - Bryan Oakley
如果你想要“最好的”,那么肯定不会使用glob,因为它非常慢。 - user136036

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接