赞
踩
同事说ES搜索,有些能搜索到,而有些确定是有数据的但是无法搜索出来。
向同事要了所要搜索的索引 和 字段以及搜索参数,验证下同事使用姿势是否正确。结果果然如同事所说,问题重现,无法匹配。
发现这个字段是一个type为text 分词方式为 自定义正则分词器以“,”(逗号)分割。
使用_analyze分词一个测试数据 一切正常
GET picture/_analyze
{
"text": "复式,北欧,2014,1-5W",
"field": "tag3"
}
结果
{ "tokens": [ { "token": "复式", "start_offset": 0, "end_offset": 2, "type": "word", "position": 0 }, { "token": "北欧", "start_offset": 3, "end_offset": 5, "type": "word", "position": 1 }, { "token": "2014", "start_offset": 6, "end_offset": 10, "type": "word", "position": 2 }, { "token": "1-5w",//注意这里W 已经变成小写了 "start_offset": 11, "end_offset": 15, "type": "word", "position": 3 } ] }
文档存储这边一切正常,那么就是查询的时候 姿势有问题,分析DSL查询语句发现使用的term进行的匹配,上面重现问题中已经发现匹配中文的数据正常,带有字母的就会有问题。term匹配是最小的单位不会处理匹配词,试用match匹配可以成功搜索到数据。match会对匹配词进行处理 譬如分词,大写变小写。经过对比发现,果然文档内存储的是小写字母,而匹配词却是大写字母,所以使用term是无法匹配到数据的。
term是不会处理搜索词,输入什么样就是什么样,所以当使用term进行匹配的时候要注意目标字段是否使用了分词器,注意大小写。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。