当前位置:   article > 正文

【python报错】LDA可视化报错_pyldavis.gensim.prepare(lda, corpus, dictionary)un

pyldavis.gensim.prepare(lda, corpus, dictionary)unicodeencodeerror: 'ascii

LDA可视化最后一步

pyLDAvis.gensim.prepare(lda_model, corpus, dictionary)
  • 1

运行pyLDAvis.gensim.prepare(lda_model, corpus, dictionary)时
出现错误UnicodeEncodeError: ‘ascii’ codec can’t encode character ‘\u5b59’ in position 18: ordinal not in range(128)

求助了一下chitGPT
这个错误可能是因为在准备可视化之前没有正确地设置默认编码。尝试在代码开头添加以下行:

import sys  
reload(sys)  
sys.setdefaultencoding('utf8')
  • 1
  • 2
  • 3

如果这不起作用,您可以尝试将字典和语料库中的文本转换为ASCII编码。在创建字典和语料库时使用以下代码:

dictionary = corpora.Dictionary([doc.encode('ascii', 'ignore').split() for doc in documents])
corpus = [dictionary.doc2bow(doc.encode('ascii', 'ignore').split()) for doc in documents]
  • 1
  • 2

这将忽略所有非ASCII字符并将文本转换为ASCII编码。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/码创造者/article/detail/794626
推荐阅读
相关标签
  

闽ICP备14008679号