降维(Dimensionality Reduction)

作者：编程探险家 | 2024-01-29 08:47:05

踩

1.动机一：数据可视化

将数据可视化，我们便能寻找到一个更好的解决方案，降维可以帮助我们。
在这里插入图片描述
假使我们有有关于许多不同国家的数据，每一个特征向量都有 50 个特征（如 GDP，人均 GDP，平均寿命等）。如果要将这个 50 维的数据可视化是不可能的。使用降维的方法将其降至 2 维，我们便可以将其可视化了。
降维的算法只负责减少维数，将多维数据降成低维，然后再进行数据处理。

2.动机二：数据压缩

数据压缩不仅允许我们压缩数据，因而使用较少的计算机内存或磁盘空间，但它也让我们加快我们的学习算法。
将数据从二维降至一维：假使我们要采用两种不同的仪器来测量一些东西的尺寸，其中一个仪器测量结果的单位是英寸，另一个仪器测量的结果是厘米，我们希望将测量的结果作为我们机器学习的特征。现在的问题的是，两种仪器对同一个东西测量的结果不完全相等
由于误差、精度等），而将两者都作为特征有些重复，因而，我们希望将这个二维的数据降至一维。
在这里插入图片描述

3.主成分分析问题

主成分分析(PCA)是最常见的降维算法。
在 PCA 中，我们要做的是找到一个方向向量（Vector direction），当我们把所有的数据都投射到该向量上时，我们希望投射平均均方误差能尽可能地小。方向向量是一个经过原点的向量，而投射误差是从特征向量向该方向向量作垂线的长度。
在这里插入图片描述
下面给出主成分分析问题的描述：
问题是要将

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/article/detail/42385