0
点赞
收藏
分享

微信扫一扫

Pandas——DataFrame常见操作

深夜瞎琢磨 2022-03-19 阅读 90
大数据
  1. 使用进程池对dataframe进行处理时,会返回由各个进程返回的dataframe组成的list。比如:如下的res是由df_split中各个返回结果dataframe组成的list。
import numpy as np
df_split = np.array_split(df, num_partitions)
with Pool(num_partitions) as pool:
	res = pool.map(func, df_split) 

在各个dataframe的列名一致的情况下,可以使用concat函数进行拼接。

import pandas as pd
out_df = pd.concat(res)
举报

相关推荐

0 条评论