《Python机器学习手册:从数据预处理到深度学习》学习笔记
作者:【美】克里斯·阿尔本(Chris Albon)
第3 章 数据整理
3.10 删除一列
- dataframe.drop
3.11 删除一行
- dataframe.drop
3.12 删除重复行
- dataframe.drop_duplicates()
3.13 根据值对行分组
- dataframe.groupby('Sex').mean()
3.14 按时间段对行分组
- time_index=pd.date_range('06/06/2017',periods=100000,freq='305')
- dataframe=pd.DataFrame(index=time_index)
- dataframe['Sale_Amount']=np.random.randint(1,10,100000)
- dataframe.resample('W').sum()
3.15 遍历一个列的数据
- 以大写的形式打印前两行中的名字
- for name in dataframe['Name'][0:2]:
- print(name.upper())
3.16 对一列的所有元素应用某个函数
- 使用apply对一列的所有元素应用一个内置的或自定义的函数
3.17 对所有分组应用一个函数
- dataframe.groupby('Sex').apply(lamda x:x.count())
3.18 连接多个数据帧
- 使用concat 并设置参数 axis=0 ,沿着行的方向来连接数据帧。
3.19 合并两个数据帧
- 要进行等值连接,就需要使用merge并用on 参数来指定那些列要合并。