0
点赞
收藏
分享

微信扫一扫

Python之机器学习(4):数据整理

《Python机器学习手册:从数据预处理到深度学习》学习笔记
作者:【美】克里斯·阿尔本(Chris Albon)

第3 章 数据整理

3.10 删除一列

  • dataframe.drop

3.11 删除一行

  • dataframe.drop

3.12 删除重复行

  • dataframe.drop_duplicates()

3.13 根据值对行分组

  • dataframe.groupby('Sex').mean()

3.14 按时间段对行分组

  • time_index=pd.date_range('06/06/2017',periods=100000,freq='305')
  • dataframe=pd.DataFrame(index=time_index)
  • dataframe['Sale_Amount']=np.random.randint(1,10,100000)
  • dataframe.resample('W').sum()

3.15 遍历一个列的数据

  • 以大写的形式打印前两行中的名字
  • for name in dataframe['Name'][0:2]:
  • print(name.upper())

3.16 对一列的所有元素应用某个函数

  • 使用apply对一列的所有元素应用一个内置的或自定义的函数

3.17 对所有分组应用一个函数

  • dataframe.groupby('Sex').apply(lamda x:x.count())

3.18 连接多个数据帧

  • 使用concat 并设置参数 axis=0 ,沿着行的方向来连接数据帧。

3.19 合并两个数据帧

  • 要进行等值连接,就需要使用merge并用on 参数来指定那些列要合并。
举报

相关推荐

0 条评论