import os
Current_Directory = os.getcwd() # Should be ...\archive
CORPUS_PATHS = sorted([os.path.join("archive", directories) for directories in os.listdir(Current_Directory)])
filenames = []
for items in CORPUS_PATHS:
filenames.append(sorted([os.path.join(CORPUS_PATHS, fn) for fn in os.listdir(items)]))
print filenames
我正在运行来自名为archive的文件的代码,在archive中有更多的文件夹,每个文件夹中都有一个或多个文本文件。我想制作一个包括每个文件夹路径的列表。但是出现了以下错误。
[Error 3] The system cannot find the path specified:
目前我有一个Python脚本,在与存档文件相同的文件夹中编写了这段代码,但会触发此错误。为了避免此错误并获取所有文件路径,我应该怎么做?
我对使用os不太熟练,并且并不经常使用它,所以如果这是一个简单的问题,我很抱歉。
编辑
import os
startpath = "archive"
corpus_path = sorted([os.path.join("archive/", directories) for directories in os.listdir(startpath)])
filenames = []
for items in corpus_path:
print items
path = [os.path.join(corpus_path, fn) for fn in os.listdir(items)]
print path
我已经取得了一些进展,现在我的语料库路径基本上是一个包含所有所需文件夹路径的列表。现在我想要做的就是获取这些文件夹中所有文本文件的路径,但我仍然遇到问题,不知道如何解决错误,例如:
File "C:\Users\David\Anaconda\lib\ntpath.py", line 65, in join
result_drive, result_path = splitdrive(path)
File "C:\Users\David\Anaconda\lib\ntpath.py", line 116, in splitdrive
normp = p.replace(altsep, sep)
AttributeError: 'list' object has no attribute 'replace'