Python Pandas(一) --数据的结构
pandas
是专门用于数据分析的库,它有两种主要的数据结构,即 Series对象
和 DataFrame对象
系列
环境
操作系统 : windows10
开发工具 : VSCode
python版本 : 3.8.6
pandas版本 : 1.0.3
安装
pandas
是一个非标准库,需要额外安装,使用 pipenv 安装
1 | pipenv install pandas |
Series对象
Series对象
由一组数据以及这组数据所对应的索引组成(一维数据)
创建 Series对象
格式
pd.Series(data)
data
: 一般传入一个列表
1 | import pandas as pd |
DataFrame对象
DataFrame对象
是一种表格型的数据结构,包含行索引、列索引以及它们所对应的数据(二维数据)
创建 DataFrame对象
格式
pd.DataFrame(data)
data
: 一般传入一个字典,注意字典的 值
的长度要一致
1 | import pandas as pd |
Series对象与DataFrame对象的区别和联系
区别
Series对象
只包含一组索引(行索引)DataFrame对象
包含两组索引(行索引和列索引),比 Series对象
能呈现更丰富的信息
联系
DataFrame对象
可以看作由 Series对象
构成的字典,并且这些 Series对象
共用同一组 行索引
1 | import pandas as pd |
DataFrame对象
的各个列都是一个 Series对象