Python中的Pandas和NumPy + SciPy有什么区别?

它们看起来都非常相似,我很好奇哪个包对财务数据分析更有利。

的确,pandas提供了build立在NumPy之上的高级数据处理工具。 NumPy本身是一个相当低级的工具,并将非常类似于使用MATLAB。 另一方面,pandas提供了丰富的时间序列function,数据alignment,NA友好统计,groupby,合并和连接方法以及其他许多便利。 它近年来在金融应用中变得非常stream行。 在我即将出版的书中,我将有一章致力于使用pandas进行财务数据分析。

numpy是pandas所必需的(几乎所有的Python数值工具)。 大pandas不是严格要求大pandas,但被列为“可选依赖”。 我不会说pandas是Numpy和/或Scipy的替代品。 相反,这是一个额外的工具,它提供了一种更简单的方式来处理Python中的数字和表格数据。 您可以使用pandas数据结构,但可以自由地使用Numpy和Scipy函数来操作它们。

pandas提供了一个很好的方式来操作表格,因为你可以很容易地将binning( Python中的数据框装入pandas中 )并计算统计数据。 其他的东西,大pandas是伟大的面板类,你可以join一系列具有不同属性的图层,并结合使用groupby函数。