这是我的问题。
有许多 .csv 文件(或其他文件),Pandas 是一种将它们读取并保存为 Dataframe
格式的简单方法。但当文件数量很多时,我想使用多进程来读取文件以节省时间。
我的早期尝试
我手动将文件分成不同的路径。分别使用:
os.chdir("./task_1")
files = os.listdir('.')
files.sort()
for file in files:
filename,extname = os.path.splitext(file)
if extname == '.csv':
f = pd.read_csv(file)
df = (f.VALUE.as_matrix()).reshape(75,90)
然后将它们组合在一起。
如何使用 pool
运行它们以解决我的问题?
任何建议将不胜感激!