赞
踩
ElasticSearch默认是standard.standard没有办法对中文进行合理分词的,只是将每个中文字符一个一个的切割开来,比如说中国人会切割成 “中” “国” “人” 这三个词汇
在搜索引擎领域,比较成熟和流行的,就是ik分词器
词汇 中国人很喜欢吃油条
如果是standard分词器分词: “中” “国” “人” “很” “喜” “欢” “吃” “油” “条”
如果是ik分词器分词: “中国人” “很” “喜欢” “吃” “油条”
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。