在学习 Pandas 的过程中,整理了一份学习图谱,希望也能够帮助到同样想入门 pandas 的同学。
Pandas 是基于 Numpy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas 提供了大量快速便捷地处理数据的函数和方法,是使 Python 成为强大而高效的数据分析环境的重要因素之一。
构建和处理两个或更多个维数组是一项繁琐的任务,用户在编写函数时要考虑数据集的方向。 但是使用Pandas数据结构,减少了用户的思考。例如,使用表格数据(DataFrame),在语义上更有用于考虑索引(行)和列,而不是轴0和轴1。
Pandas 两个重要的数据结构,Seriers 和 DataFrame,多个 Seriers 组成了 DataFrame,就像 ndArray 一样,是我们使用 pandas 操作数据的基本数据结构。我们在掌握了 Pandas 的数据之后,重点关注各种数据分析的方法,以工具的角度来学习 Pandas,将常用的方法整理出来,后面用到时查找即可。