前言
PCA降维也称为主成分分析法,是一种使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。
01实例分析
本篇将一个三维数据降维成二维的数据,并进行可视化。
02原理解析
标准化
降维
-
计算相关系数矩阵
计算相关系数矩阵R,使用皮尔逊相关系数计算各指标间的相关系数,即列与列之间的相关系数。
-
计算R的特征值和特征向量
计算出特征值并把它们按照从大到小的顺序排列,对应的特征向量也相应排列。