0
点赞
收藏
分享

微信扫一扫

Python Pandas数据统计函数

肉肉七七 2022-03-30 阅读 49

有如下一张表s3:
在这里插入图片描述
1.汇总类统计

#生成各项数字列的汇总数据
s3.describe() 
s3["aqi"].max()
s3["aqi"].min()
s3["aqi"].mean()

2.唯一去重和按值计数
唯一去重:用于枚举列的各种属性值,一般不用于数值列

s3["fengxiang"].unique()

结果:在这里插入图片描述
按值计数:统计列中属性值出现的次数

s3["fengxiang"].value_counts()

结果:在这里插入图片描述

3.相关系数和协方差
概念:
1 协方差:衡量同向反向程度,如果协方差为正,说明X,Y同向变化,协方差越大说明同向程度越高;如果协方差为负,说明X,Y反向运动,协方差越小说明反向程度越高。

2 相关系数:衡量相似度程度,当他们的相关系数为1时,说明两个变量变化时的正向相似度最大,当相关系数为-1时,说明两个变量变化的反向相似度最大

s3.cov() #协方差
s3.corr() #相关系数
s3["aqi"].corr(s3["yWendu"]) #单独查看某两列的相关系数 
举报

相关推荐

0 条评论