赞
踩
答:文档频率、信息增益、互信息、X^2统计、TF-IDF
负采样这个点引入word2vec非常巧妙,两个作用,1.加速了模型计算,2.保证了模型训练的效果,一个是模型每次只需要更新采样的词的权重,不用更新所有的权重,那样会很慢,第二,中心词其实只跟它周围的词有关系,位置离着很远的词没有关系,也没必要同时训练更新,作者这点非常聪明。
NLP Interview Questions 百度云链接 提取码:h9k8
https://github.com/songyingxin/NLPer-Interview
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。