文章目录
专栏导读
1、Series简介
Series是一种一维数组结构,它由两个部分组成:索引和值。索引是一个标签数组,可以用来标识数据。值可以是任何类型的数据,例如整数、浮点数、字符串等。Series提供了类似于Numpy数组的操作,同时也支持类似于Python字典的操作。
函数如下:
pandas.Series( data, index, dtype, name, copy)
参数说明:
-
data:一组数据(ndarray 类型)。
-
index:数据索引标签,如果不指定,默认从 0 开始。
-
dtype:数据类型,默认会自己判断。
-
name:设置名称。
-
copy:拷贝数据,默认为 False。
2、创建Series
创建Series的方式非常简单,可以使用Python列表、Numpy数组或者字典来创建Series。
使用列表创建Series:
import pandas as pd
# 使用列表创建Series
s1 = pd.Series([1, 2, 3, 4, 5])
print(s1)
使用Numpy数组创建Series:
import numpy as np
s2 = pd.Series(np.array([10, 20, 30, 40, 50]))
print(s2)
使用字典创建Series:
# 使用字典创建Series
s3 = pd.Series({'apple': 3, 'banana': 2, 'orange': 5})
print(s3)
3、Series索引
Series的索引可以通过索引标签或者整数位置来访问。
例如:
通过索引标签访问元素
s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])
print(s)
# 通过索引标签访问元素
print(s['a'])
print(s['c'])
通过整数位置访问元素
s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])
print(s)
# 通过整数位置访问元素
print(s[0])
print(s[2])
使用.loc属性访问元素
# 使用.loc属性访问元素
print(s.loc['a'])
print(s.loc['c'])
使用.iloc属性访问元素
# 使用.iloc属性访问元素
print(s.iloc[0])
print(s.iloc[2])
4、Series切片
除了访问单个元素,还可以使用切片来访问Series中的一部分数据。使用切片需要指定开始索引和结束索引,语法与Python中的切片语法类似。
例如:
使用索引标签切片
import pandas as pd
s = pd.Series([1, 2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'])
print(s)
# 使用索引标签切片
print(s['a':'c'])
使用整数位置切片
# 使用整数位置切片
print(s[0:3])