Numpy 是Python的高性能科学计算基础库。
Numpy 参考 numpy
Pandas是基于Numpy构建的搞性能数据统计库。它提供了Series、DataFrame、Panel三种数据结构。
| 数据结构 | 说明 |
|---|---|
| Series | 一位维数组,带有标签作为索引。 |
| DataFrame | 二维数组,与 SQL 的表结构类似。可以理解为 Series 为 value 的 Map 数据结构。 |
| Panel | 三维数组,可以理解为 DataFrame 为 value 的 Map 数据结构。 |
| Panel4D\PanelND | 已废弃 |
相关操作:
- 数据创建
- 数据查看
- 数据选择
- 数据设置
- 缺失值处理
- 汇总与统计
- 类 SQL 操作
- 时间序列
- 文件I\O
参考 pandas
Scipy 是一款高性能数学计算函数库,包含常见的数学方法实现。 Scipy 根据不同的功能应用划分为不同的子模块,子模块之间基本是相互独立的。
| 模块 | 说明 |
|---|---|
| cluster | 矢量量化 / Kmeans |
| fftpack | 离散傅立叶变换算法 |
| integrate | 数值积分 |
| interpolate | 插值 |
| io | 输入输出 |
| linalg | 线性代数 |
| linalg.blas | Wrappers to BLAS library |
| linalg.lapack | Wrappers to LAPACK library |
| misc | Various utilities that don't have another home |
| ndimage | n维图像包 |
| odr | 正交距离回归 |
| optimize | Optimization Tools |
| signal | Signal Processing Tools |
| signal.windows | Window functions |
| sparse | 稀疏矩阵 |
| sparse.linalg | 稀疏线性代数 |
| sparse.linalg.dsolve | 线性求解 |
| sparse.linalg.dsolve.umfpack | :Interface to the UMFPACK library: Conjugate Gradient Method (LOBPCG) |
| sparse.linalg.eigen | 稀疏特征值求解 |
| sparse.linalg.eigen.lobpcg | Locally Optimal Block Preconditioned Conjugate Gradient Method (LOBPCG) |
| spatial | 空间数据结构和算法 |
| special | Special functions |
| stats | 统计功能 |
Matplotlib 是绘制高质量2D图像的Python库。 1、面向过程作图 面向过程作图是指利用 pyplot 包提供的函数来逐步绘图。步骤如下:
- 创建figure,类似于图纸
- 创建坐标
- 绘制图像
- 调整刻度和标签、添加注释
2、面向过程作图 Matplotlib 提供了 Object Container 的概念,它有 Figure、Axes、Axis、Tick 四种类型的对象容器。
| 容器 | 说明 |
|---|---|
| Figure | 负责图像大小、位置等操作 |
| Axes | 负责坐标系位置、绘图等操作 |
| Axis | 负责坐标抽的操作 |
| Tick | 负责刻度的相关操作 |
notes: 四种对象容器之间是层层包含的关系。
作图过程如下:
- 实例化 Figure 对象
- Figure 定位图像大小、位置,返回 Axes 对象
- Axes 对象绘制图像,调整坐标抽位置,返回 Axis 对象
- Axis 对象设置X、Y坐标的显示长度,刻度,标签等,返回 Tick 对象
- Tick 对象格式化刻度的样式等
Matplotlib 参考 matplotlib
Matplotlib 基础


