将Pandas数据框存储在字典中还是面板中更好?

5
我希望这不会听起来像一个讨论性问题。我将提供一些关于我的具体情况的细节。
我是Pandas的新手,需要存储多个二维数组,其中列代表频率,行代表方向(如果您感兴趣,这是2D波谱)。每个数组代表特定时间。
我将这些数组存储为Pandas DataFrames,但为了将它们保存在单个对象中,我考虑了两个选项:
1. 将DataFrames存储在字典中,其中键是时间戳。 2. 将DataFrames存储在Pandas Panel中,其中项目是时间戳。
第一种选择似乎很简单,并且具有存储具有不同大小、索引和列名的数组的灵活性。第二个选项在处理数据方面似乎更好,因为Panel具有特定的方法,并且也可以轻松地保存或导出(例如到csv或pickle)。
就速度、内存使用、灵活性和数据分析而言,哪个选项更适合?
问候

抱歉,我正在编辑我的问题。我没有解释清楚我已经将数据存储在数据框架中了。我的问题是,将DataFrames保持在单个对象中的最佳选项是什么? - jcdoming
1
你考虑过嵌套数据框吗? - kilojoules
尝试使用一个例子会更加清晰明了。 - kilojoules
我会做并让你知道。谢谢。 - jcdoming
2
很好。还可以查看这个关于列长度不同的数据框的问题:https://dev59.com/jWIj5IYBdhLWcg3w8ZUF - kilojoules
显示剩余2条评论
1个回答

1
我认为你不需要一个面板。我建议采用嵌套数据框架的方法。

抱歉,你能告诉我如何做吗?我需要在循环内将每个数据框附加到父数据框中,但似乎不起作用。也许一个示例代码可以帮助我。到目前为止,我使用字典这样做:E[dates] = pd.DataFrame(Aux,index=f,columns=dirs)。其中E是一个字典,dates是一个浮点数,而Auxfdirs则是列表。 - jcdoming
一个简单且可重复的示例会使回答这个问题变得更加容易。产生了什么错误?基本上,您希望在没有有效条目的地方插入 NaN - kilojoules

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接