如何将一个相同的DataFrame数组合并成一个单独的DataFrame?

3

我该如何在pandas中合并或组合一个DataFrames数组?

dfs = []
for df in pd.read_csv(....chunksize=chunk_size):
  df1 = df
  # ....
  if condition:
    dfs.append(df1)

如您所见,它们都具有相同的结构,我只需要将它们合并到一个单独的DataFrame中。


你在结尾处尝试过使用'result = concat(dfs)'吗? - user 12321
2个回答

3
通常情况下,您可以将数据框的数组连接起来,这样您就可以拥有:
dfs = []
for df in pd.read_csv(....chunksize=chunk_size):
  df1 = df
  # ....
  if condition:
    dfs.append(df1)
result=concat(dfs)

您可以在这里查找更多信息,点击这里


1
这是首选方法,因为反复追加以周期方式增长数据帧的性能表现不佳。 - EdChum
NameError: 名称 'concat' 未定义 - user266003
1
拜托了,把导入语句 from pandas import concat 加到你的答案里。如果你已经导入了 pandas import pandas as pd,你可以使用 pd.concat() - Dimitri L.

-1
Pandas DataFrame已经有一个append方法来合并两个DataFrame了。请参阅文档
import pandas
dfs = pandas.DataFrame()
for df in pd.read_csv(....chunksize=chunk_size):
  df1 = df
  # ....
  if condition:
    dfs.append(df1)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接