当前位置:   article > 正文

自然语言处理面试题_自然语言处理面试题库

自然语言处理面试题库

tfidf

tf是啥?词频

idf是啥?逆词频

 

max_df 选择词频的上界

min_df  选择词频的下界

max_features 选择的最大特征数

利用sklearn tfidf实例

导包

from sklearn.feature_extraction.text import TfidfVectorizer

实例化 

  1. word_vec = TfidfVectorizer(analyzer='word',
  2. ngram_range=(1,2),#(1,3)
  3. min_df=3, # 4 5
  4. max_df=0.9, # 0.95 1.0
  5. use_idf=True,
  6. smooth_idf=True,
  7. sublinear_tf=True)

用fit_transform训练

用transform预测<

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/喵喵爱编程/article/detail/997417
推荐阅读
相关标签
  

闽ICP备14008679号