前言
软科中国大学排以专业、客观、透明的优势赢得了高等教育领域和社会的广泛关注和认可,本次将利用Python对我国大学排名和分布情况进行一番研究。
涉及到的内容:
Pandas — 数据处理
Pyecharts — 数据可视化
背景描述
数据为2021年中国大学综合排名数据,用于分析大学排名、分布情况
数据说明
项目 | 数据类型 | 说明 |
---|---|---|
排名 | int | 综合排名 |
升/降 | float | 较前一年排名升/降 |
学校名称 | string | 学校名称 |
英文名称 | string | 英文名称 |
省市 | string | 所在地 |
类型 | string | 学校类型 |
总分 | float | 综合得分 |
办学层次 | float | 分项得分 |
学科水平 | float | 分项得分 |
办学资源 | Text | 分项得分 |
师资规模与结构 | float | 分项得分 |
人才培养 | float | 分项得分 |
科学研究 | float | 分项得分 |
服务社会 | float | 分项得分 |
学术人才 | float | 分项得分 |
重大项目与成果 | float | 分项得分 |
国际竞争力 | float | 分项得分 |
数据来源
数据来自👉软科排名
问题描述
适用于分析场景:
1、中国大学综合排名
2、中国大学各省市分布情况
3、各省市大学排名波动情况
4、其他
1. 导入模块
In [1]:
from pyecharts.charts import Map
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts import options as opts
import pandas as pd
2. Pandas数据处理
2.1 读取数据
In [2]:
df = pd.read_csv('/home/mw/input/06024378/中国大学综合排名2021.csv', encoding='gb2312')
df.head()
Out[2]:
排名 | 升/降 | 学校名称 | 英文名称 | 省市 | 类型 | 总分 | 办学层次 | 学科水平 | 办学资源 | 师资规模与结构 | 人才培养 | 科学研究 | 服务社会 | 学术人才 | 重大项目与成果 | 国际竞争力 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 0.0 | 清华大学 | Tsinghua University | 北京 | 综合 | 969.2 | 37.9 | 74.3 | 39.4 | 48.7 | 343.0 | 88.0 | 37.9 | 90.8 | 129.1 | 80.1 |
1 | 2 | 0.0 | 北京大学 | Peking University | 北京 | 综合 | 855.3 | 36.1 | 72.9 | 25.9 | 49.2 | 315.7 | 88.0 | 12.8 | 92.6 | 102.9 | 59.2 |
2 | 3 | 0.0 | 浙江大学 | Zhejiang University | 浙江 | 综合 | 768.7 | 34.3 | 65.4 | 21.8 | 47.7 | 285.7 | 91.4 | 32.2 | 67.7 | 79.4 | 42.9 |
3 | 4 | 0.0 | 上海交通大学 | Shanghai Jiao Tong University | 上海 | 综合 | 723.4 | 35.5 | 53.1 | 21.6 | 44.9 | 260.0 | 98.2 | 18.8 | 65.1 | 86.8 | 39.2 |
4 | 5 | 0.0 | 南京大学 | Nanjing University | 江苏 | 综合 | 654.8 | 35.1 | 47.9 | 10.8 | 48.1 | 272.0 | 72.4 | 4.9 | 61.2 | 72.0 | 30.4 |
2.2 查看表格数据类型
In [3]:
df.dtypes
Out[3]:
排名 int64
升/降 float64
学校名称 object
英文名称 object
省市 object
类型 object
总分 float64
办学层次 float64
学科水平 float64
办学资源 float64
师资规模与结构 float64
人才培养 float64
科学研究 float64
服务社会 float64
学术人才 float64
重大项目与成果 float64
国际竞争力 float64
dtype: object
2.3 查看表格数据描述
In [4]:
df.describe()
Out[4]:
排名 | 升/降 | 总分 | 办学层次 | 学科水平 | 办学资源 | 师资规模与结构 | 人才培养 | 科学研究 | 服务社会 | 学术人才 | 重大项目与成果 | 国际竞争力 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
count | 582.000000 | 566.000000 | 582.000000 | 100.000000 | 100.000000 | 100.000000 | 100.000000 | 100.000000 | 100.000000 | 100.000000 | 100.00000 | 100.000000 | 100.000000 |
mean | 291.347079 | -2.886926 | 169.319244 | 29.993000 | 27.642000 | 7.365000 | 39.689000 | 165.487000 | 33.595000 | 7.666000 | 16.68700 | 20.596000 | 18.963000 |
std | 168.058284 | 28.047203 | 113.628205 | 3.277233 | 12.299061 | 5.662733 | 4.674515 | 48.212911 | 19.312279 | 7.426233 | 17.88975 | 21.706536 | 10.331433 |
min | 1.000000 | -82.000000 | 58.200000 | 23.400000 | 6.000000 | 2.200000 | 29.500000 | 98.800000 | 12.100000 | 0.000000 | 2.00000 | 1.200000 | 8.100000 |
25% | 146.250000 | -19.000000 | 97.925000 | 27.675000 | 19.775000 | 3.875000 | 36.600000 | 128.150000 | 19.550000 | 2.375000 | 6.20000 | 7.175000 | 13.000000 |
50% | 291.500000 | -2.000000 | 132.400000 | 29.900000 | 23.800000 | 5.500000 | 38.550000 | 149.800000 | 27.150000 | 5.500000 | 10.50000 | 13.650000 | 15.750000 |
75% | 436.750000 | 9.000000 | 194.675000 | 32.225000 | 33.750000 | 9.250000 | 43.275000 | 191.525000 | 42.000000 | 10.350000 | 19.42500 | 23.550000 | 22.525000 |
max | 582.000000 | 130.000000 | 969.200000 | 40.000000 | 74.300000 | 39.400000 | 50.500000 | 343.000000 | 98.200000 | 37.900000 | 92.60000 | 129.100000 | 80.100000 |
可以看到数据一个有582条,升/降数据只有566条,办学层次、学科水平。。。等只有100条,存在数据缺失。
2.4 查看表格缺失数据
In [5]:
df.isnull().sum()
Out[5]:
排名 0
升/降 16
学校名称 0
英文名称 0
省市 0
类型 0
总分 0
办学层次 482
学科水平 482
办学资源 482
师资规模与结构 482
人才培养 482
科学研究 482
服务社会 482
学术人才 482
重大项目与成果 482
国际竞争力 482
dtype: int64
2.5 填充某一列缺失数据
填充升/降数据,以填充0为例:
In [6]:
df['升/降'].fillna(0, inplace=True)
df.isnull().sum()
Out[6]:
排名 0
升/降 0
学校名称 0
英文名称 0
省市 0
类型 0
总分 0
办学层次 482
学科水平 482
办学资源 482
师资规模与结构 482
人才培养 482
科学研究 482
服务社会 482
学术人才 482
重大项目与成果 482
国际竞争力 482
dtype: int64
2.6 一次性填充所有缺失数据
一次性填充所有缺失数据,以填充0为例:
In [7]:
df.fillna(0, inplace=True)
df.isnull().sum()
Out[7]:
排名 0
升/降 0
学校名称 0
英文名称 0
省市 0
类型 0
总分 0
办学层次 0
学科水平 0
办学资源 0
师资规模与结构 0
人才培养 0
科学研究 0
服务社会 0
学术人才 0
重大项目与成果 0
国际竞争力 0
dtype: int64
In [8]:
df.describe()
Out[8]:
排名 | 升/降 | 总分 | 办学层次 | 学科水平 | 办学资源 | 师资规模与结构 | 人才培养 | 科学研究 | 服务社会 | 学术人才 | 重大项目与成果 | 国际竞争力 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
count | 582.000000 | 582.00000 | 582.000000 | 582.000000 | 582.000000 | 582.000000 | 582.000000 | 582.000000 | 582.000000 | 582.000000 | 582.000000 | 582.000000 | 582.000000 |
mean | 291.347079 | -2.80756 | 169.319244 | 5.153436 | 4.749485 | 1.265464 | 6.819416 | 28.434192 | 5.772337 | 1.317182 | 2.867182 | 3.538832 | 3.258247 |
std | 168.058284 | 27.66235 | 113.628205 | 11.404365 | 11.605604 | 3.632635 | 15.108292 | 65.572676 | 14.980980 | 4.215933 | 9.707016 | 11.863912 | 8.333417 |
min | 1.000000 | -82.00000 | 58.200000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 |
25% | 146.250000 | -18.00000 | 97.925000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 |
50% | 291.500000 | -1.00000 | 132.400000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 |
75% | 436.750000 | 8.00000 | 194.675000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 | 0.000000 |
max | 582.000000 | 130.00000 | 969.200000 | 40.000000 | 74.300000 | 39.400000 | 50.500000 | 343.000000 | 98.200000 | 37.900000 | 92.600000 | 129.100000 | 80.100000 |
可以看到所有列数据均有582条,填充完成。
2.7 统计所有排名未改变的学校
In [9]:
df[df['升/降']==0]
Out[9]:
排名 | 升/降 | 学校名称 | 英文名称 | 省市 | 类型 | 总分 | 办学层次 | 学科水平 | 办学资源 | 师资规模与结构 | 人才培养 | 科学研究 | 服务社会 | 学术人才 | 重大项目与成果 | 国际竞争力 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 0.0 | 清华大学 | Tsinghua University | 北京 | 综合 | 969.2 | 37.9 | 74.3 | 39.4 | 48.7 | 343.0 | 88.0 | 37.9 | 90.8 | 129.1 | 80.1 |
1 | 2 | 0.0 | 北京大学 | Peking University | 北京 | 综合 | 855.3 | 36.1 | 72.9 | 25.9 | 49.2 | 315.7 | 88.0 | 12.8 | 92.6 | 102.9 | 59.2 |
2 | 3 | 0.0 | 浙江大学 | Zhejiang University | 浙江 | 综合 | 768.7 | 34.3 | 65.4 | 21.8 | 47.7 | 285.7 | 91.4 | 32.2 | 67.7 | 79.4 | 42.9 |
3 | 4 | 0.0 | 上海交通大学 | Shanghai Jiao Tong University | 上海 | 综合 | 723.4 | 35.5 | 53.1 | 21.6 | 44.9 | 260.0 | 98.2 | 18.8 | 65.1 | 86.8 | 39.2 |
4 | 5 | 0.0 | 南京大学 | Nanjing University | 江苏 | 综合 | 654.8 | 35.1 | 47.9 | 10.8 | 48.1 | 272.0 | 72.4 | 4.9 | 61.2 | 72.0 | 30.4 |
5 | 6 | 0.0 | 复旦大学 | Fudan University | 上海 | 综合 | 649.7 | 36.6 | 48.4 | 16.6 | 46.2 | 255.8 | 78.6 | 4.8 | 65.0 | 60.1 | 37.6 |
6 | 7 | 0.0 | 中国科学技术大学 | University of Science and Technology of China | 安徽 | 理工 | 577.0 | 40.0 | 37.7 | 11.9 | 45.9 | 232.1 | 61.4 | 0.8 | 58.6 | 46.6 | 42.1 |
7 | 8 | 0.0 | 华中科技大学 | Huazhong University of Science and Technology | 湖北 | 综合 | 574.3 | 32.1 | 44.7 | 11.3 | 45.2 | 232.2 | 74.2 | 22.9 | 35.2 | 45.2 | 31.3 |
8 | 9 | 0.0 | 武汉大学 | Wuhan University | 湖北 | 综合 | 567.9 | 31.8 | 49.6 | 10.4 | 45.7 | 255.4 | 61.7 | 9.5 | 35.0 | 43.0 | 25.7 |
16 | 17 | 0.0 | 东南大学 | Southeast University | 江苏 | 综合 | 488.1 | 34.3 | 37.7 | 12.4 | 44.5 | 223.0 | 44.8 | 9.1 | 20.1 | 36.2 | 25.8 |
17 | 18 | 0.0 | 中国人民大学 | Renmin University of China | 北京 | 综合 | 487.8 | 34.5 | 42.1 | 10.3 | 46.2 | 224.6 | 39.9 | 0.2 | 31.8 | 42.6 | 15.8 |
23 | 24 | 0.0 | 吉林大学 | Jilin University | 吉林 | 综合 | 435.7 | 30.4 | 42.2 | 9.0 | 50.5 | 203.0 | 46.8 | 4.1 | 13.6 | 17.2 | 18.8 |
28 | 29 | 0.0 | 华东师范大学 | East China Normal University | 上海 | 师范 | 401.8 | 35.2 | 34.4 | 8.0 | 43.1 | 170.8 | 41.2 | 2.9 | 23.2 | 24.0 | 18.8 |
29 | 30 | 0.0 | 中国农业大学 | China Agricultural University | 北京 | 农业 | 400.4 | 31.8 | 34.7 | 7.8 | 45.0 | 161.1 | 38.4 | 6.6 | 22.2 | 34.9 | 18.0 |
32 | 33 | 0.0 | 北京科技大学 | University of Science and Technology Beijing | 北京 | 理工 | 379.4 | 32.2 | 23.8 | 6.1 | 41.0 | 180.5 | 34.1 | 13.9 | 12.1 | 19.0 | 16.8 |
33 | 34 | 0.0 | 重庆大学 | Chongqing University | 重庆 | 综合 | 365.5 | 29.9 | 30.9 | 7.3 | 40.6 | 165.3 | 38.8 | 10.6 | 10.8 | 13.6 | 17.7 |
34 | 35 | 0.0 | 南京航空航天大学 | Nanjing University of Aeronautics and Astronau… | 江苏 | 理工 | 358.6 | 28.6 | 22.9 | 3.3 | 40.3 | 185.7 | 28.0 | 11.3 | 10.9 | 13.7 | 13.9 |
71 | 72 | 0.0 | 江苏大学 | Jiangsu University | 江苏 | 综合 | 276.9 | 26.5 | 21.8 | 3.6 | 38.2 | 127.5 | 21.3 | 8.7 | 3.7 | 8.9 | 16.7 |
79 | 80 | 0.0 | 华北电力大学 | North China Electric Power University | 北京 | 理工 | 263.2 | 27.1 | 16.2 | 4.0 | 35.0 | 129.5 | 17.4 | 8.7 | 5.1 | 6.5 | 13.6 |
84 | 85 | 0.0 | 首都师范大学 | Capital Normal University | 北京 | 师范 | 261.1 | 29.9 | 23.1 | 5.5 | 38.4 | 120.4 | 16.8 | 0.2 | 8.0 | 7.0 | 11.8 |
89 | 90 | 0.0 | 安徽大学 | Anhui University | 安徽 | 综合 | 243.1 | 26.0 | 19.3 | 3.3 | 31.0 | 128.0 | 17.1 | 0.9 | 3.8 | 3.3 | 10.4 |
96 | 97 | 0.0 | 河南大学 | Henan University | 河南 | 综合 | 234.6 | 24.6 | 22.6 | 3.5 | 33.7 | 109.0 | 19.2 | 2.1 | 3.9 | 4.0 | 12.0 |
110 | 111 | 0.0 | 浙江理工大学 | Zhejiang Sci-Tech University | 浙江 | 理工 | 221.8 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
138 | 138 | 0.0 | 中国计量大学 | China Jiliang University | 浙江 | 理工 | 201.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
189 | 190 | 0.0 | 长江大学 | Yangtze University | 湖北 | 综合 | 168.4 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
195 | 196 | 0.0 | 哈尔滨理工大学 | Harbin University of Science and Technology | 黑龙江 | 理工 | 165.5 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
197 | 198 | 0.0 | 延边大学 | Yanbian University | 吉林 | 综合 | 165.4 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
250 | 251 | 0.0 | 浙大宁波理工学院 | NingboTech University | 浙江 | 理工 | 145.1 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
325 | 326 | 0.0 | 浙大城市学院 | Zhejiang University City College | 浙江 | 理工 | 123.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
361 | 362 | 0.0 | 无锡学院 | Nanjing University of Information Science and … | 江苏 | 综合 | 113.3 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
415 | 416 | 0.0 | 河北科技工程职业技术大学 | North China Electric Power University Science … | 河北 | 理工 | 101.2 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
426 | 427 | 0.0 | 河北工业职业技术大学 | Polytechnic College of Hebei University of Sci… | 河北 | 理工 | 99.5 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
433 | 434 | 0.0 | 南京特殊教育师范学院 | Nanjing Normal University of Special Education | 江苏 | 师范 | 98.4 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
467 | 467 | 0.0 | 湖州学院 | Huzhou University Qiuzhen College | 浙江 | 师范 | 93.5 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
474 | 474 | 0.0 | 苏州城市学院 | Wenzheng College of Soochow University | 江苏 | 综合 | 92.3 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
493 | 494 | 0.0 | 山东石油化工学院 | Shengli College, China University of Petroleum | 山东 | 理工 | 89.8 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
533 | 533 | 0.0 | 赣南科技学院 | College of Applied Science, Jiangxi University… | 江西 | 理工 | 83.4 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
537 | 538 | 0.0 | 阿坝师范学院 | Aba Teachers University | 四川 | 师范 | 82.8 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
550 | 551 | 0.0 | 温州理工学院 | Wenzhou University Oujiang College | 浙江 | 师范 | 79.2 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
558 | 559 | 0.0 | 吕梁学院 | Luliang University | 山西 | 师范 | 76.3 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
566 | 567 | 0.0 | 广西科技师范学院 | Guangxi Science and Technology Normal University | 广西 | 师范 | 71.5 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
569 | 570 | 0.0 | 河北石油职业技术大学 | Hebei University of Technology City College | 河北 | 理工 | 70.7 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
574 | 575 | 0.0 | 新疆政法学院 | College of Science & Technology Shihezi Univer… | 新疆 | 综合 | 66.9 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
576 | 577 | 0.0 | 赣东学院 | East China Institute of Technology, Yangtze Ri… | 江西 | 理工 | 64.2 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
2.8 统计前50名中排名下降的学校
In [10]:
df.loc[(df['排名']<50) & (df['升/降']<0),:]
Out[10]:
排名 | 升/降 | 学校名称 | 英文名称 | 省市 | 类型 | 总分 | 办学层次 | 学科水平 | 办学资源 | 师资规模与结构 | 人才培养 | 科学研究 | 服务社会 | 学术人才 | 重大项目与成果 | 国际竞争力 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
11 | 12 | -2.0 | 中山大学 | Sun Yat-Sen University | 广东 | 综合 | 519.3 | 30.9 | 46.7 | 13.7 | 48.3 | 194.6 | 74.0 | 8.4 | 37.8 | 31.4 | 33.3 |
14 | 15 | -2.0 | 北京航空航天大学 | Beihang University | 北京 | 理工 | 513.8 | 32.8 | 33.9 | 11.1 | 42.6 | 221.4 | 46.1 | 20.7 | 26.7 | 54.7 | 23.8 |
15 | 16 | -1.0 | 同济大学 | Tongji University | 上海 | 理工 | 508.3 | 33.2 | 40.3 | 12.2 | 43.9 | 221.0 | 58.9 | 12.5 | 29.1 | 35.0 | 22.1 |
19 | 20 | -1.0 | 南开大学 | Nankai University | 天津 | 综合 | 465.3 | 31.5 | 35.2 | 9.2 | 45.5 | 216.0 | 44.3 | 2.4 | 29.1 | 27.3 | 24.9 |
21 | 22 | -1.0 | 天津大学 | Tianjin University | 天津 | 理工 | 444.3 | 32.7 | 33.5 | 8.5 | 45.2 | 198.1 | 45.0 | 13.4 | 22.7 | 23.4 | 21.8 |
25 | 26 | -3.0 | 厦门大学 | Xiamen University | 福建 | 综合 | 427.8 | 32.7 | 36.7 | 9.4 | 41.6 | 184.6 | 46.5 | 4.8 | 25.3 | 23.1 | 23.1 |
26 | 27 | -2.0 | 华南理工大学 | South China University of Technology | 广东 | 理工 | 419.8 | 30.5 | 33.7 | 9.4 | 42.7 | 183.1 | 41.7 | 12.1 | 18.5 | 21.9 | 26.3 |
27 | 28 | -1.0 | 大连理工大学 | Dalian University of Technology | 辽宁 | 理工 | 418.2 | 30.2 | 31.0 | 6.4 | 42.9 | 190.5 | 42.9 | 9.0 | 16.4 | 32.2 | 16.8 |
31 | 32 | -1.0 | 湖南大学 | Hunan University | 湖南 | 综合 | 393.5 | 31.4 | 29.4 | 5.8 | 39.5 | 176.6 | 35.7 | 9.3 | 16.8 | 22.6 | 26.4 |
36 | 37 | -1.0 | 南京理工大学 | Nanjing University of Science and Technology | 江苏 | 理工 | 356.0 | 30.9 | 24.2 | 3.2 | 40.0 | 173.5 | 26.5 | 14.3 | 8.3 | 18.9 | 16.2 |
41 | 42 | -3.0 | 华中农业大学 | Huazhong Agricultural University | 湖北 | 农业 | 338.5 | 28.5 | 27.4 | 4.8 | 38.0 | 156.5 | 34.0 | 1.5 | 14.5 | 17.1 | 16.0 |
43 | 44 | -6.0 | 苏州大学 | Soochow University (China) | 江苏 | 综合 | 327.0 | 28.7 | 31.2 | 5.8 | 41.2 | 120.0 | 33.2 | 8.1 | 14.4 | 16.8 | 27.8 |
44 | 45 | -3.0 | 华东理工大学 | East China University of Science and Technology | 上海 | 理工 | 324.5 | 29.7 | 20.2 | 5.5 | 39.3 | 149.8 | 29.7 | 7.5 | 13.1 | 13.6 | 16.0 |
45 | 46 | -2.0 | 华中师范大学 | Central China Normal University | 湖北 | 师范 | 322.0 | 30.6 | 26.0 | 5.0 | 37.9 | 149.8 | 28.8 | 0.2 | 11.7 | 12.8 | 19.3 |
2.9 统计各省市大学数量
In [11]:
g = df.groupby('省市')
# 各省份大学数量
df_counts = g.count()['排名']
df0 = df_counts.copy()
df0.sort_values(ascending=False, inplace=True)
df0
Out[11]:
省市
江苏 38
山东 33
河南 31
河北 28
北京 27
辽宁 27
陕西 26
四川 26
广东 25
湖南 25
湖北 25
浙江 25
安徽 24
江西 22
黑龙江 19
吉林 18
上海 18
山西 17
福建 17
云南 16
广西 15
贵州 13
甘肃 12
内蒙古 12
新疆 11
天津 11
重庆 11
海南 4
青海 2
西藏 2
宁夏 2
Name: 排名, dtype: int64
2.10 各省市大学平均分排序
In [12]:
df_means0 = g.mean()['总分']
df_means = df_means0.round(2)
df1 = pd.concat([df_counts, df_means], join='outer', axis=1)
df1.columns = ['数量', '平均分']
df1.sort_values(by=['平均分'], ascending=False, inplace=True)
df1
Out[12]:
数量 | 平均分 | |
---|---|---|
省市 | ||
北京 | 27 | 333.61 |
上海 | 18 | 286.61 |
江苏 | 38 | 215.17 |
天津 | 11 | 214.79 |
湖北 | 25 | 206.57 |
陕西 | 26 | 191.44 |
广东 | 25 | 190.71 |
浙江 | 25 | 184.38 |
重庆 | 11 | 173.46 |
辽宁 | 27 | 163.20 |
黑龙江 | 19 | 161.19 |
福建 | 17 | 159.42 |
四川 | 26 | 159.22 |
山东 | 33 | 157.97 |
青海 | 2 | 155.85 |
吉林 | 18 | 155.02 |
湖南 | 25 | 153.84 |
安徽 | 24 | 152.82 |
甘肃 | 12 | 139.54 |
宁夏 | 2 | 137.70 |
西藏 | 2 | 135.40 |
河南 | 31 | 127.99 |
江西 | 22 | 127.24 |
海南 | 4 | 127.12 |
河北 | 28 | 118.24 |
云南 | 16 | 115.86 |
广西 | 15 | 115.59 |
内蒙古 | 12 | 115.29 |
新疆 | 11 | 111.44 |
贵州 | 13 | 108.94 |
山西 | 17 | 108.44 |
3. Pyecharts数据可视化
3.1 各省市大学数量和平均分柱状图(横向)
In [17]:
df1.sort_values(by=['平均分'], ascending=False, inplace=True)
d1 = df1.index.tolist()
d2 = df1['数量'].values.tolist()
d3 = df1['平均分'].values.tolist()
bar0 = (
Bar()
.add_xaxis(d1)
.add_yaxis('数量', d2)
.add_yaxis('平均分数', d3)
.set_global_opts(
title_opts=opts.TitleOpts(title='中国大学排名'),
yaxis_opts=opts.AxisOpts(name='量'),
xaxis_opts=opts.AxisOpts(name='省份'),
)
)
bar0.render('各省市大学数量和平均分柱状图(横向).html')
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UyhwLccv-1645683799486)(C:\Users\wangchaojie\Desktop\Python案例分析\中国大学综合排名2021\讲义\中国大学综合排名案例分析.assets\1628130179176.png)]
3.2 各省市大学数量和平均分柱状图(纵向)
In [18]:
df1.sort_values(by=['平均分'], inplace=True)
d1 = df1.index.tolist()
d2 = df1['数量'].values.tolist()
d3 = df1['平均分'].values.tolist()
bar1 = (
Bar()
.add_xaxis(d1)
.add_yaxis('数量', d2)
.add_yaxis('平均分数', d3)
.reversal_axis()
.set_series_opts(label_opts=opts.LabelOpts(position='right'))
.set_global_opts(
title_opts=opts.TitleOpts(title='中国大学排名'),
yaxis_opts=opts.AxisOpts(name='省份'),
xaxis_opts=opts.AxisOpts(name='量'),
)
)
bar1.render('各省市大学数量和平均分柱状图(纵向).html')
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fOOdCfTw-1645683799488)(C:\Users\wangchaojie\Desktop\Python案例分析\中国大学综合排名2021\讲义\中国大学综合排名案例分析.assets\1628130232642.png)]
3.3 各省市大学数量玫瑰图
In [19]:
name = df_counts.index.tolist()
count = df_counts.values.tolist()
c0 = (
Pie()
.add(
'',
[list(z) for z in zip(name, count)],
radius=['20%', '60%'],
center=['50%', '65%'],
rosetype="radius",
label_opts=opts.LabelOpts(is_show=False),
)
.set_series_opts(label_opts=opts.LabelOpts(formatter='{b}: {c}'))
)
c0.render('各省市大学数量玫瑰图.html')
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hezY61cU-1645683799489)(C:\Users\wangchaojie\Desktop\Python案例分析\中国大学综合排名2021\讲义\中国大学综合排名案例分析.assets\1628130268764.png)]
3.4 各省市大学数量南丁格尔玫瑰图
In [20]:
provinces = df0.index.tolist()
num = df0.values.tolist()
c1 = (
Pie()
.add('', [list(z) for z in zip(provinces, num)],
radius=['30%', '105%'],
rosetype='area'
)
.set_global_opts(title_opts=opts.TitleOpts(title='中国大学排名'),
legend_opts=opts.LegendOpts(is_show=False),
toolbox_opts=opts.ToolboxOpts())
.set_series_opts(label_opts=opts.LabelOpts(is_show=True, position="inside", font_size=12,
formatter='{b}: {c}', font_style='italic',
font_weight='bold', font_family='Microsoft YaHei'
))
)
c1.render('各省市大学数量南丁格尔玫瑰图.html')
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1dpcXLVV-1645683799489)(C:\Users\wangchaojie\Desktop\Python案例分析\中国大学综合排名2021\讲义\中国大学综合排名案例分析.assets\1628130298969.png)]
3.5 各省市大学数量地图分布
In [21]:
name = df0.index.tolist()
count = df0.values.tolist()
m = (
Map()
.add('', [list(z) for z in zip(name, count)], 'china')
.set_global_opts(
title_opts=opts.TitleOpts(title='中国大学排名'),
visualmap_opts=opts.VisualMapOpts(max_=40, split_number=8, is_piecewise=True),
)
)
m.render('各省市大学数量地图分布.html')
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kUF4NsAe-1645683799490)(C:\Users\wangchaojie\Desktop\Python案例分析\中国大学综合排名2021\讲义\中国大学综合排名案例分析.assets\1628130320617.png)]
总结
- 大学数量较多的省市:江苏、山东、河南、河北、北京、辽宁 、陕西、四川 、广东 、湖南 、湖北、浙江等地(只看学校数量),后期探索可根据学校排名
- 排名前20的大学较前一年的波动较小(这也符合常理,毕竟前几的学校都是多年沉淀下来的)
- 西部地区大学数量较少
name = df0.index.tolist()
count = df0.values.tolist()
m = (
Map()
.add('', [list(z) for z in zip(name, count)], 'china')
.set_global_opts(
title_opts=opts.TitleOpts(title='中国大学排名'),
visualmap_opts=opts.VisualMapOpts(max_=40, split_number=8, is_piecewise=True),
)
)
m.render('各省市大学数量地图分布.html')
[外链图片转存中…(img-kUF4NsAe-1645683799490)]
总结
- 大学数量较多的省市:江苏、山东、河南、河北、北京、辽宁 、陕西、四川 、广东 、湖南 、湖北、浙江等地(只看学校数量),后期探索可根据学校排名
- 排名前20的大学较前一年的波动较小(这也符合常理,毕竟前几的学校都是多年沉淀下来的)
- 西部地区大学数量较少
- 本数据集不包含港、澳、台大学(网站未统计)