赞
踩
我们以R语言抓取的推特数据为例,对数据进行文本挖掘,进一步进行情感分析,从而得到很多有趣的信息(点击文末“阅读原文”获取完整代码数据)。
找到推特来源是苹果手机或者安卓手机的样本,清理掉其他来源的样本。
- tweets <-tweets_df>%select(id, statusSource, text, created) %>%
- extract(statusSource, "source", "Twitter for (.*?)<")>%filter(source %in%c("iPhone", "Android"))
对数据进行可视化计算不同时间对应的推特比例.。
并且对比安卓手机和苹果手机上的推特数量的区别。
从对比图中我们可以发现,安卓手机和苹果手机发布推特的时间有显著的差别,安卓手机倾向于在5点到10点之间发布推特,而苹果手机一般在10点到20点左右发布推特。同时我们也可以看到,安卓手机发布推特数量的比例要高于苹果手机。
点击标题查阅往期内容
NLP自然语言处理—主题模型LDA案例:挖掘人民网留言板文本数据
左右滑动查看更多
01
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。