有序字典与Pandas系列数据的区别

6

我还不太熟悉这个领域,如果我问了一些愚蠢的问题,请见谅。Python有序字典和pandas系列之间有什么区别?

唯一想到的区别是,orderedDict可以在数据中包含嵌套字典。这就是全部吗?这是真的吗?

使用其中一个与另一个相比,是否会有性能差异?

我的项目是销售预测,大部分数据将是这样的:{第1周:400个单位,第2周:550个单位}...也许有序字典会显得多余,因为与周数相比,输入顺序是无关紧要的?

再次感谢,我正在努力学习。

谢谢!

-Stephen


到目前为止,我非常喜欢学习Pandas,但是他们的文档对于初学者来说并不友好(除了他们的“10分钟入门Pandas”,它并没有回答这个问题)。我没有教授或同事可以问这些问题,这里不是正确的地方吗? - Stephen
2个回答

2
最重要的是,pd.Seriespandas 库的一部分,因此它具有许多附加功能 - 请参阅 attributesmethods,当您向下滚动 pd.Series 文档 时。这与 OrderDict 相比较:文档
对于您的用例,使用 pd.Seriespd.DataFrame(这可能是使用 nested dictionaries 的一种方式,因为它具有一个 index 和多个 columns)似乎非常适合。如果您查看 pandas 文档,您还会发现相当全面的时间序列功能,这对于周销售预测项目非常有用。
由于 pandas 建立在专业的科学计算包 numpy 上,因此性能非常好。

谢谢!我没有想到pandas中还有这样的附加功能。这绝对有助于我保持正确的方向。 - Stephen

1

有序字典是Python集合库的一部分。这些集合是针对特定用例而设计的非常快速的容器。如果您只需要字典相关功能(例如本例中的顺序),我会选择它。虽然您说您将在pandas真正适用的领域进行更深入的分析(例如绘图,填充缺失值)。因此,我建议您选择pandas.Series。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接