Python 数据归一化、标准化、正则化（机器学习）-CFANZ编程社区

Python 数据归一化、标准化、正则化（机器学习）

🌠 『精品学习专栏导航帖』

🐳最适合入门的100个深度学习实战项目🐳
🐙【PyTorch深度学习项目实战100例目录】项目详解 + 数据集 + 完整源码🐙
🐶【机器学习入门项目10例目录】项目详解 + 数据集 + 完整源码🐶
🦜【机器学习项目实战10例目录】项目详解 + 数据集 + 完整源码🦜
🐌Java经典编程100例🐌
🦋Python经典编程100例🦋
🦄蓝桥杯历届真题题目+解析+代码+答案🦄
🐯【2023王道数据结构目录】课后算法设计题C、C++代码实现完整版大全🐯

文章目录

✌ 数据归一化、标准化、正则化

1、✌ 归一化
2、✌ 标准化
3、✌ 正则化
4、✌ 代码测试

4.1 ✌ 导库
4.2 ✌ 创建数据
4.3 ✌ 查看原始数据的均值、方差
4.4 ✌ 归一化
4.5 ✌ 标准化
4.6 ✌ 正则化

✌ 数据归一化、标准化、正则化

1、✌ 归一化

是将数据放缩到0~1区间，利用公式（x-min）/（max-min）

2、✌ 标准化

将数据转化为标准的正态分布，均值为0，方差为1

3、✌ 正则化

正则化的主要作用是防止过拟合，对模型添加正则化项可以限制模型的复杂度，使得模型在复杂度和性能达到平衡。

常用的正则化方法有L1正则化和L2正则化。L1正则化和L2正则化可以看作是损失函数的惩罚项。所谓“惩罚”就是对损失函数中的某些参数做一些限制。

4、✌ 代码测试

4.1 ✌ 导库

import pandas as pd
import numpy as np

from sklearn.preprocessing import MinMaxScaler
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import Normalizer

4.2 ✌ 创建数据

x=np.random.randint(1,1000,(10000,5))
x=pd.DataFrame(x)

Python 数据归一化、标准化、正则化（机器学习）_数据挖掘

4.3 ✌ 查看原始数据的均值、方差

display(x.mean())
display(x.var())

Python 数据归一化、标准化、正则化（机器学习）_数据分析_02

4.4 ✌ 归一化

from sklearn.preprocessing import MinMaxScaler
x_min=MinMaxScaler().fit_transform(x)
x_min=pd.DataFrame(x_min)
display(x_min.mean())
display(x_min.var())

Python 数据归一化、标准化、正则化（机器学习）_正则化_03

4.5 ✌ 标准化

from sklearn.preprocessing import StandardScaler
x_std=StandardScaler().fit_transform(x)
x_std=pd.DataFrame(x_std)
display(x_std.mean())
display(x_std.var())

Python 数据归一化、标准化、正则化（机器学习）_数据挖掘_04

4.6 ✌ 正则化

from sklearn.preprocessing import Normalizer
x_nor=Normalizer().fit_transform(x)
x_nor=pd.DataFrame(x_nor)

Python 数据归一化、标准化、正则化（机器学习）_数据分析_05

0 条评论

Python 数据归一化、标准化、正则化 （机器学习）