有如下一张表s3:
1.汇总类统计
#生成各项数字列的汇总数据
s3.describe()
s3["aqi"].max()
s3["aqi"].min()
s3["aqi"].mean()
2.唯一去重和按值计数
唯一去重:用于枚举列的各种属性值,一般不用于数值列
s3["fengxiang"].unique()
结果:
按值计数:统计列中属性值出现的次数
s3["fengxiang"].value_counts()
结果:
3.相关系数和协方差
概念:
1 协方差:衡量同向反向程度,如果协方差为正,说明X,Y同向变化,协方差越大说明同向程度越高;如果协方差为负,说明X,Y反向运动,协方差越小说明反向程度越高。
2 相关系数:衡量相似度程度,当他们的相关系数为1时,说明两个变量变化时的正向相似度最大,当相关系数为-1时,说明两个变量变化的反向相似度最大
s3.cov() #协方差
s3.corr() #相关系数
s3["aqi"].corr(s3["yWendu"]) #单独查看某两列的相关系数