0
点赞
收藏
分享

微信扫一扫

去哪儿网数据分析

嚯霍嚯 2022-01-05 阅读 72
import pandas as pd
import numpy as np
df=pd.read_csv('C:/Users/15451/data/1.csv')
df

df.info()

df[df.价格<1000]

df[(df.价格<1200)&(df.出发地=='成都')]

df[df.价格.between(1000,2000)].sort_values(by='价格')

df.groupby('出发地')['路线名'].size()

df.groupby('出发地')['价格'].agg([np.size,np.mean])

df.groupby(by=['出发地','目的地'])['价格'].agg([np.size,np.mean])

df.pivot_table(values=['价格'],index=['出发地'],columns=['目的地'],aggfunc=[np.size,np.mean])

df.head(2)

df['价格'].corr(df['星级'])
举报

相关推荐

0 条评论