当前位置:   article > 正文

ES term之大小写_es text类型大小写问题

es text类型大小写问题


如果不想看啰嗦的事由可以直接跳到结论

问题

同事说ES搜索,有些能搜索到,而有些确定是有数据的但是无法搜索出来。

解决问题

重现问题

向同事要了所要搜索的索引 和 字段以及搜索参数,验证下同事使用姿势是否正确。结果果然如同事所说,问题重现,无法匹配。

查看mapping映射以及_analyze API测试

发现这个字段是一个type为text 分词方式为 自定义正则分词器以“,”(逗号)分割。
使用_analyze分词一个测试数据 一切正常

GET picture/_analyze
{
  "text": "复式,北欧,2014,1-5W",
  "field": "tag3"
}
  • 1
  • 2
  • 3
  • 4
  • 5

结果

{
  "tokens": [
    {
      "token": "复式",
      "start_offset": 0,
      "end_offset": 2,
      "type": "word",
      "position": 0
    },
    {
      "token": "北欧",
      "start_offset": 3,
      "end_offset": 5,
      "type": "word",
      "position": 1
    },
    {
      "token": "2014",
      "start_offset": 6,
      "end_offset": 10,
      "type": "word",
      "position": 2
    },
    {
      "token": "1-5w",//注意这里W 已经变成小写了
      "start_offset": 11,
      "end_offset": 15,
      "type": "word",
      "position": 3
    }
  ]
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32

定位问题

文档存储这边一切正常,那么就是查询的时候 姿势有问题,分析DSL查询语句发现使用的term进行的匹配,上面重现问题中已经发现匹配中文的数据正常,带有字母的就会有问题。term匹配是最小的单位不会处理匹配词,试用match匹配可以成功搜索到数据。match会对匹配词进行处理 譬如分词,大写变小写。经过对比发现,果然文档内存储的是小写字母,而匹配词却是大写字母,所以使用term是无法匹配到数据的。

结论

term是不会处理搜索词,输入什么样就是什么样,所以当使用term进行匹配的时候要注意目标字段是否使用了分词器,注意大小写

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/article/detail/45933
推荐阅读
相关标签
  

闽ICP备14008679号