在pandas文档中,它指出:
值得注意的是,concat(因此也包括append)会创建数据的完整副本,并且经常重复使用此函数可能会导致性能下降。如果您需要在多个数据集上使用该操作,请使用列表推导式。
frames = [process_your_file(f) for f in files] result = pd.concat(frames)
我的当前情况是,我将一份新的数据框与一个不断增长的数据框列表连接起来。这将导致可怕数量的连接。
我担心性能问题,不确定如何在这种情况下使用列表推导式。我的代码如下。
我认为下载数据和创建数据框的部分并不相关,我的关注点是常量拼接。
在这种情况下,我该如何实现列表推导式?
值得注意的是,concat(因此也包括append)会创建数据的完整副本,并且经常重复使用此函数可能会导致性能下降。如果您需要在多个数据集上使用该操作,请使用列表推导式。
frames = [process_your_file(f) for f in files] result = pd.concat(frames)
我的当前情况是,我将一份新的数据框与一个不断增长的数据框列表连接起来。这将导致可怕数量的连接。
我担心性能问题,不确定如何在这种情况下使用列表推导式。我的代码如下。
df = first_data_frame
while verify == True:
# download data (new data becomes available through each iteration)
# then turn [new] data into data frame, called 'temp'
frames = [df, temp]
df = concat(frames)
if condition_met:
verify == False
我认为下载数据和创建数据框的部分并不相关,我的关注点是常量拼接。
在这种情况下,我该如何实现列表推导式?