【python数据分析刷题】-N07.合并-CFANZ编程社区

【python数据分析刷题】-N07.合并_数据分析

文章目录

前言

🐴 DA37 统计运动会项目报名人数
🐴 DA38 统计运动会项目报名人数(二)
🐴 DA39 多报名表的运动项目人数统计
🐴 DA40 统计职能部分运动会某项目的报名信息

前言

Python实际针对数据分析的学习是库，用库来解决一系列的数据分析问题

🐴 DA37 统计运动会项目报名人数

🚀 描述

某公司计划举办一场运动会，现有运动会项目数据集items.csv。 包含以下字段：

item_id：项目编号；
item_name:项目名称；
location:比赛场地。
有员工报名情况数据集signup.csv。包含以下字段：

employee_id：员工编号；
name：员工姓名；
sex：性别；
department：所属部门；
item_id：报名项目id
请你统计各类型项目的报名人数。

📖 输入描述

数据集可以从当前目录下items.csv、signup.csv读取。

items.csv

【python数据分析刷题】-N07.合并_字段_02

signup.csv

【python数据分析刷题】-N07.合并_数据集_03

📖 输出描述：

只输出报名人数不为0的项目及其对应的报名人数。以上数据集的输出如下：

【python数据分析刷题】-N07.合并_字段_04

🍌🍌 答案

import pandas as pd
signup = pd.read_csv('signup.csv')
items = pd.read_csv('items.csv')

new=pd.merge(items,signup, on='item_id')
print(new.groupby('item_name').employee_id.count())

【python数据分析刷题】-N07.合并_字段_05

🐴 DA38 统计运动会项目报名人数(二)

🚀 描述

某公司计划举办一场运动会，现有运动会项目数据集items.csv。 包含以下字段：

item_id：项目编号；
item_name:项目名称；
location:比赛场地。
有员工报名情况数据集signup.csv。包含以下字段：

employee_id：员工编号；
name：员工姓名；
sex：性别；
department：所属部门；
item_id：报名项目id
请你统计各类型项目的报名人数。

📖 输入描述

数据集可以从当前目录下items.csv、signup.csv读取。

items.csv

【python数据分析刷题】-N07.合并_字段_02

signup.csv

【python数据分析刷题】-N07.合并_数据集_03

📖 输出描述：

输出items.csv中所有项目的报名人数（没有人报名的项目的报名人数输出为0即可）。
以上数据集的输出如下：

【python数据分析刷题】-N07.合并_python_08

🍌🍌 答案

import pandas as pd
signup = pd.read_csv('signup.csv')
items = pd.read_csv('items.csv')

a=pd.merge(items,signup,on='item_id',how='left')
print(a.groupby('item_name')['employee_id'].count())

【python数据分析刷题】-N07.合并_开发语言_09

🐴 DA39 多报名表的运动项目人数统计

🚀 描述

某公司计划举办一场运动会，现有部分运动会项目数据集items.csv。 包含以下字段：

item_id：项目编号；
item_name:项目名称；
location:比赛场地。
有员工报名情况数据集signup.csv。包含以下字段：

employee_id：员工编号；
name：员工姓名；
sex：性别；
department：所属部门；
item_id：报名项目id。
另有signup1.csv，是education部门的报名情况，包含字段同signup.csv。

请你将signup.csv与signup1.csv的数据集合并后，统计各类型项目的报名人数。

📖 输入描述

数据集可以从当前目录下items.csv、signup.csv、signup1.csv读取。

items.csv

【python数据分析刷题】-N07.合并_开发语言_10

signup.csv

【python数据分析刷题】-N07.合并_数据分析_11

signup1.csv

【python数据分析刷题】-N07.合并_开发语言_12

📖 输出描述：

只输出报名人数不为0的项目及其对应的报名人数。

以上数据集的输出如下：

【python数据分析刷题】-N07.合并_数据集_13

🍌🍌 答案

import pandas as pd
signup = pd.read_csv('signup.csv')
signup1 = pd.read_csv('signup1.csv')
items = pd.read_csv('items.csv')

signup2=pd.concat([signup,signup1],axis=0)
result1=pd.merge(items,signup2,how='inner',on='item_id')
result=result1.groupby('item_name')
print(result.size())

【python数据分析刷题】-N07.合并_数据分析_14

🐴 DA40 统计职能部分运动会某项目的报名信息

🚀 描述

某公司计划举办一场运动会，现有运动会项目数据集items.csv。 包含以下字段：

item_id：项目编号；
item_name:项目名称；
location:比赛场地。
有员工报名情况数据集signup.csv。包含以下字段：

employee_id：员工编号；
name：员工姓名；
sex：性别；
department：所属部门；
item_id：报名项目id
请你统计职能部门（functional）中报名标枪(javenlin)的所有员工的员工编号（employee_id）、姓名（name）及性别（sex）。

📖 输入描述

数据集可以从当前目录下items.csv、signup.csv读取。

items.csv

【python数据分析刷题】-N07.合并_字段_02

signup.csv

【python数据分析刷题】-N07.合并_数据集_03

📖 输出描述：

输出职能部门（functional）中报名标枪(javenlin)的所有员工的员工编号（employee_id）、姓名（name）及性别（sex）。

以上数据集的输出如下（注意：结果中行标签从0开始顺序排序）：

【python数据分析刷题】-N07.合并_字段_17

🍌🍌 答案

import pandas as pd
signup = pd.read_csv('signup.csv')
items = pd.read_csv('items.csv')

df = pd.merge(signup,items,on="item_id")
df1 = df[(df["department"] == "functional") & (df["item_name"] == "javelin")]
df2 = df1[["employee_id","name","sex"]]
print(df2)

【python数据分析刷题】-N07.合并_开发语言_18