Pandas简介

img

Pandas 是非常著名的开源数据处理库,可以通过它完成对数据集进行快速读取、转换、过滤、分析等一系列操作。除此之外,Pandas 拥有强大的缺失数据处理与数据透视功能,可谓是数据预处理中的必备利器。

同样,Pandas 已经被证明为是非常强大的用于处理时间序列数据的工具。

Pandas 基于 NumPy 开发,该工具是 Scipy 生态中为了解决数据分析任务而设计。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的函数和方法。

特有的数据结构是 Pandas 的优势和核心。简单来讲,可以将任意格式的数据转换为 Pandas 的数据类型,并使用 Pandas 提供的一系列方法进行转换、操作,最终得到期望的结果。

官方:

安装:

pip3 install pandas==1.5.3

使用:

# Load the library
import numpy as np