当前位置:   article > 正文

wordcloud(词云)_wordcloud词云的特点

wordcloud词云的特点

1.分词

当今在R界最流行的中文分词包莫过于jiebaR了,有人用segmentCN,问题重重。
jiebaR分词后的词性worker=(“tag”),tagger<=”words“,即可展示分词后词的词性。
tips:
  1. \t \r \n都是转义字符,空格就是单纯的空格,输入时可以输入空格
  2. \t 的意思是 横向跳到下一制表符位置
  3. \r 的意思是 回车
  4. \n 的意思是回车换行

2.频数

其实这是很重要的一步,没有这一步,Wordcloud只能做梦了。我的方法里面没有建立频数数据框,方便了但数据框有时候用来分析更有用,所以
tips:
  1. library(plyr)
  2. table_seg<-count(seg) 数据框的话,后面可以使用table_seg[,1],table_seg[,2]
  3. 但是我用的时候有bug,缓存的table_seg在后面不能引用,说是找不到

3.云词

##windows
library(jiebaR) 
library(jiebaRD)
library(plyr)
library(RColorBrewer)
library(wordcloud)

f<-scan('F:\\huaqiangu_sense.txt',sep='\n',what='',encoding="cp936")##what为数据类型
seg1<-qseg[f]
seg2<-seg1[nchar(seg1)>1]

seg<-table(seg2)
colors=brewer.pal(8,"Dark2")
wordcloud(names(seg),seg,colors=rainbow(length(names(seg))),random.order=F,random.color=F,ordered.colors=T)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
最后的云词展示:这里写图片描述
tips:
  1. 想不想有好看、花哨的云词? 跨网找云词成像制作工具。
  2. 他的名字叫:TagxeDo
本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号