一、Numpy
numpy相当于一个数组但又不等于数组
1.基本操作
导入库之后使用查看生成数组以及格式
可以对不同数组进行操作,也可以对一个数组里的内容进行操作
产生一个二维数组
也可以根据需要生成全为0/1/随机数的数组
2.切片
可以生成一个数组并输出其中的某些值/对某些值进行修改。这样修改会改变原本数组的内容,若希望对其重新幅值但不改变其中的内容,则需要一个副本
将数组的某些数取出来赋给一个新变量,然后对新变量进行幅值,不改变原有的数组值。
二、Pandas
Pandas主要是使用的其中Series,DataFrame两个函数,前者更像一维数组,后者更像多维数组(表格)
1。Series.基本使用
Series其实就是对numpy的array进行了封装,添加了索引功能
也可以对索引单独赋值
对对应索引的值进行更改以及查看某个索引是否属于数组内
2.字典与Series关系
将字典改为S形式
对索引进行修改
2。DataFrame基本使用
创建一个数组,dataframe按二维的方式输出,且可以让输出按照指定的顺序
有两种方法都能对指定的数组进行提取
还可以对数组进行新增操作
对输出进行转置操作
先对索引进行重命名,若重命名后索引值大于开始给定的值,可以使用fill_value进行重新幅值
也可以不进行幅值,直接使用上面的值/下面的值进行幅值
2.删除NA
对省略的值直接进行删除
上面与下面的不同是上面语句将有NA的全部行删除(删除两列)而下面只删除全部为缺省的数据
要删除全为缺省的一列,则需要对axis赋值为1
还可以对缺省值进行填充处理,这是对data2的副本进行处理,所以输出为data2.fillna(0)
若要直接对data2进行处理
三、numpy的层次处理
这样使得a对应3个值,b对应三个值以此类推。
还可以对上面输出的一维数组进行转二维数组以及还原成一维数组的操作
还可以对数组指定的索引进行输出
四、matplotlib绘图
确定横纵坐标后进行描点作图
还可以调用np函数进行取点
显示多条线使用for循环,figure函数只是创建图表,后面的dpi越大文件越大越清晰
直方图用来统计数据出现次数
散点图
五、urllib采集数据
给定网址,使用request去打开
post与get请求基本相同
request库更加简便
get请求
post请求