使用与未使用预训练词向量的区别_预训练词向量的作用

作者：繁依Fanyi0 | 2024-07-24 09:58:58

踩

预训练词向量的作用

预训练词向量

对于训练数据较少的情况下，使用预先训练好的词向量可以使一些目前可解释或不可解释的先验词语信息嵌入到词向量中，而这些先验知识对于下游词向量训练任务，尤其是小数据集来讲很有帮助。预训练词向量的选择主要考虑两个因素：语料和维度。

通过已训练好的词与词/字与字之间的相关性特征（上下文语言结构）来适用于与之类似的上下文特征，弥补训练数据不足以学习出该语言结构的一般特点。

使用预训练词向量将表征具有该预训练词与词关系的语义信息；
随机生成初始化词向量不能通过特定上下文单词的出现来预测target词；
也就是说，如果训练数据中出现该预训练集中存在上下文单词，就可以在之后的神经网络训练后生成一个准确的taget，不需要再反向传播更新传入的权重值，否则需要不断更新权重参数来实现梯度下降到最低点找到最优值。（实际上预训练词向量可以简化梯度下降<模型收敛>的过程，个人理解）

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/874008