pandas进阶--pivot函数重塑Dataframe-CFANZ编程社区

文章目录

欢迎关注公众号【Python开发实战】, 获取更多内容!
pivot函数

参数解析：

index：str或object或str的列表（pandas 1.1.0版本之后可以接受列表），用于制作新Dataframe的索引，如果为None，则使用现在的索引。
columns：str或object或str的列表（pandas 1.1.0版本之后可以接受列表），用于制作新Dataframe的列。
**values：**str或object或str的列表，用于填充新Dataframe的值，如果未指定，将使用所有剩余的列，并且新Dataframe的列将具有多级索引。

返回：

重塑的Dataframe。

引起ValueError:

当按指定的index、columns和values取新Dataframe的值时，如果有多个值，会引起ValueError报错。

用例1

导入pandas

import pandas as pd

df = pd.DataFrame({
    'foo': ['one', 'one', 'one', 'two', 'two', 'two'], 
     'bar': ['A', 'B', 'C', 'A', 'B', 'C'], 
     'baz': [1, 2, 3, 4, 5, 6], 
     'zoo': ['x', 'y', 'z', 'q', 'w', 't']
})
df

输出：

使用foo列的值作为新Dataframe的索引，使用bar列的值作为新Dataframe的列，使用baz列的值作为新Dataframe的值。

df.pivot(index='foo', columns='bar', values='baz')

输出：

使用foo列的值作为新Dataframe的索引，使用bar列的值作为新Dataframe的列，values不指定，会指定剩余所有的列。

df.pivot(index='foo', columns='bar')

输出：

对上面具有多级索引的Dataframe的进行索引取值。

df.pivot(index='foo', columns='bar')['baz']

输出：

用例2

df2 = pd.DataFrame({
    'lev1': [1, 1, 1, 2, 2, 2],
    'lev2': [1, 1, 2, 1, 1, 2],
    'lev3': [1, 2, 1, 2, 1, 2],
    'lev4': [1, 2, 3, 4, 5, 6],
    'values': [0, 1, 2, 3, 4, 5],
})
df2

输出：

index和columns传入列表。（需要pandas版本在1.1.0之后）

df2.pivot(index="lev1", columns=["lev2", "lev3"],values="values")

输出：

df2.pivot(index=['lev1', 'lev2'], columns=['lev3'], values='values')

输出：

用例3

df3 = pd.DataFrame({
    'foo': ['one', 'one', 'two', 'two'],
    'bar': ['A', 'A', 'B', 'C'],
    'baz': [1, 2, 3, 4],
})
df3

输出：

如果指定index为foo，columns为bar，则df3的前两行是相同的，会引起ValueError报错。

try:
    df3.pivot(index='foo', columns='bar', values='baz')
except ValueError as e:
    print(e)

输出：

Index contains duplicate entries, cannot reshape