当前位置:   article > 正文

python数据分析:词性标注_词性标注 python

词性标注 python

词性标注

就是给每一个词确定一个词性分类。很多场景需要做词性标注,然后基于标注的词性可以做进一步应用。例如统计竞争对手新闻稿的主要词语分布、分词结果筛选和过滤、配合文章标签的提取等。
结巴分词的词性标注方法采用和ictclas兼容的标记法。常用的分类如下:
在这里插入图片描述

简单实现:

使用jieba.posseg做带有词性标注的分词,并通过循环得到每个分词的词语和类别结果;

import newspaper
import pandas as pd
import jieba.posseg as pseg

# 加载停用词
stopWords = [line
  • 1
  • 2
  • 3
  • 4
  • 5
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/355514
推荐阅读
相关标签
  

闽ICP备14008679号