赞
踩
对于训练数据较少的情况下,使用预先训练好的词向量可以使一些目前可解释或不可解释的先验词语信息嵌入到词向量中,而这些先验知识对于下游词向量训练任务,尤其是小数据集来讲很有帮助。预训练词向量的选择主要考虑两个因素:语料和维度。
通过已训练好的词与词/字与字之间的相关性特征(上下文语言结构)来适用于与之类似的上下文特征,弥补训练数据不足以学习出该语言结构的一般特点。