0
点赞
收藏
分享

微信扫一扫

python 数据文件为“luohu.csv”,先进行数据预处理年龄分布【简单易懂,代码直接运行】

至此,python作业已经全部更新完毕

该题目的数据我放到资源里面的,但是我不知道那个收费不收费,我有时间了把他存到百度云盘/阿里云盘里面供大家下载

** 2、统计年龄分布情况(5岁的间隔统计),绘制出年龄分布图**
代码如下:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams["font.family"] = ['SimHei']
plt.rcParams["axes.unicode_minus"] = False
#导入数据
data = pd.read_csv("luohu3.csv",sep=',')
#进行数据清洗
data.dropna(axis=0,how='any',inplace=True)
#计算年龄
data['年龄'] = [2021 - dt.year for dt in pd.to_datetime(data["出生年月"])]
# print(data["年龄"])
#由此出来观察年龄的最大值
######################考试的时候出现这种求最大值的请何况怎么办?
print(data.describe())
##############最大值为63,最小值为36
#设置分区bins
bins = np.arange(35,70,5)
#对数据进行离散化处理
age = pd.cut(data["年龄"],bins,True)
#print(age)
#将数组分组处理
age_group = data.groupby(age)["年龄"].count()
print(age_group)
#画图
age_group.plot(kind = 'bar')
# # #显示图片
plt.show()

点个👍吧,秋梨膏!!
运行结果如图:
请添加图片描述

至此,python作业已经全部更新完毕

举报

相关推荐

0 条评论