Python 利用Word2Vec计算词语相似度（gensim实现）_gensim计算两个句子word2vec相似度

作者：知新_RL | 2024-07-25 02:59:41

踩

gensim计算两个句子word2vec相似度

使用 gensim 训练中文词向量，计算词语之间的相似度。

输入：语料库，txt文件。

输出：余弦相似度。

实现代码：


# -*- coding: utf-8 -*-
 
import logging
 
from gensim import models
from gensim.models import word2vec
 
 
def main():
    logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
    sentences = word2vec.LineSentence("output.txt")
    model = word2vec.Word2Vec(sentences, size=250)
 
    # 保存模型，供以后使用
    model.save("word2vec.model")
 
    # 模型读取
    # model = word2vec.Word2Vec.load("your_model_name")
 
    logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
    model = models.Word2Vec.load('word2vec.model')
 
    print("提供 3 种测试模式\n")
    print("输入一个词，则去寻找前一百个该词的相似词")
    print("输入两个词，则去计算两个词的余弦相似度")

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/知新_RL/article/detail/878008