当前位置:   article > 正文

Python 利用Word2Vec计算词语相似度(gensim实现)_gensim计算两个句子word2vec相似度

gensim计算两个句子word2vec相似度

使用 gensim 训练中文词向量,计算词语之间的相似度。

输入:语料库,txt文件。

输出:余弦相似度

实现代码:

  1. # -*- coding: utf-8 -*-
  2. import logging
  3. from gensim import models
  4. from gensim.models import word2vec
  5. def main():
  6. logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
  7. sentences = word2vec.LineSentence("output.txt")
  8. model = word2vec.Word2Vec(sentences, size=250)
  9. # 保存模型,供以后使用
  10. model.save("word2vec.model")
  11. # 模型读取
  12. # model = word2vec.Word2Vec.load("your_model_name")
  13. logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
  14. model = models.Word2Vec.load('word2vec.model')
  15. print("提供 3 种测试模式\n")
  16. print("输入一个词,则去寻找前一百个该词的相似词")
  17. print("输入两个词,则去计算两个词的余弦相似度")
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/878008
推荐阅读
相关标签
  

闽ICP备14008679号