它们看起来非常相似,我很好奇哪个软件包对金融数据分析更有益。
pandas提供了建立在NumPy之上的高级数据操作工具。NumPy本身是一种相当低级的工具,类似于MATLAB。另一方面,pandas提供了丰富的时间序列功能、数据对齐、NA友好的统计学、分组、合并和连接方法以及许多其他便利功能。近年来,在金融应用中它变得非常流行。在我的即将出版的书中,我将有一个章节专门介绍如何使用pandas进行金融数据分析。
Numpy是pandas(以及Python中几乎所有数值工具)所必需的。Scipy并非pandas所必需,但被列为“可选依赖项”。我不会说pandas是Numpy和/或Scipy的替代品,而是它是一个额外的工具,为在Python中使用数字和表格数据提供了更简化的方法。您可以使用pandas数据结构,但可以自由地利用Numpy和Scipy函数来操作它们。
Pandas提供了一种很好的操作表格的方式,你可以轻松地进行分箱(在Python中使用pandas对数据框进行分箱)和计算统计量。另一个在Pandas中非常出色的功能是Panel类,你可以使用groupby函数将具有不同属性的系列层级联并组合起来。