PCA (Principal Component Analysis)即主成分分析,是一种常用的无监督降维算法,Python3中的Scikit-learn库提供了PCA实现。
from sklearn.decomposition import PCA #假设有m个n维数据 m, n = data.shape #设置PCA维度 pca_dim = 2 #创建PCA对象 pca = PCA(n_components=pca_dim) #对数据进行降维 new_data = pca.fit_transform(data)
使用PCA进行降维需要注意的是,新得到的维度应该是原来数据的一个子集。因为根据奇异值分解的结论,每次取前k个奇异值降维时,其实是选择了前k个特征向量组成的基,只考虑这几个特征的组合能够解释原始数据的大部分信息。如果新得到的维度比原来的维度要大,降维效果不好,有可能反而会增加特征维度的数量.
总之,PCA是一种常用的降维算法,可以用于解决数据高维度问题。在Python3中,Scikit-learn库提供了PCA的实现,使用简单方便。
上一篇 jquery 上下页 插件
下一篇 python3。7用途