当前位置:   article > 正文

降维(Dimensionality Reduction)

降维(Dimensionality Reduction)

1.动机一:数据可视化

将数据可视化,我们便能寻找到一个更好的解决方案,降维可以帮助我们。
在这里插入图片描述
假使我们有有关于许多不同国家的数据,每一个特征向量都有 50 个特征(如 GDP,人均 GDP,平均寿命等)。如果要将这个 50 维的数据可视化是不可能的。使用降维的方法将其降至 2 维,我们便可以将其可视化了。
降维的算法只负责减少维数,将多维数据降成低维,然后再进行数据处理。

2.动机二:数据压缩

数据压缩不仅允许我们压缩数据,因而使用较少的计算机内存或磁盘空间,但它也让我们加快我们的学习算法。
将数据从二维降至一维: 假使我们要采用两种不同的仪器来测量一些东西的尺寸,其中一个仪器测量结果的单位是英寸,另一个仪器测量的结果是厘米,我们希望将测量的结果作为我们机器学习的特征。现在的问题的是,两种仪器对同一个东西测量的结果不完全相等
由于误差、精度等),而将两者都作为特征有些重复,因而,我们希望将这个二维的数据降至一维。
在这里插入图片描述

3.主成分分析问题

主成分分析(PCA)是最常见的降维算法
在 PCA 中,我们要做的是找到一个方向向量(Vector direction),当我们把所有的数据都投射到该向量上时,我们希望投射平均均方误差能尽可能地小。方向向量是一个经过原点的向量,而投射误差是从特征向量向该方向向量作垂线的长度。
在这里插入图片描述
下面给出主成分分析问题的描述:
问题是要将

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/article/detail/42385
推荐阅读
相关标签