当前位置:   article > 正文

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_elastic search的ik分词器的ik是指什么

elastic search的ik分词器的ik是指什么

前言:本文学习并总结自:https://www.bilibili.com/video/BV17a4y1x7zq?p=8

1 ES 核心概念

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
分片(Shard):ES的“分片(shard)”机制可将一个索引内部的数据分布地存储于多个节点,它通过将一个ES索引切分为多个底层物理的Lucene索引 + 倒排索引的数据结构,完成索引数据的分割存储功能,这每一个物理的Lucene索引称为一个分片(shard)。这样的好处是可以把一个大的索引拆分成多个,分布到不同的节点上。降低单服务器的压力,构成分布式搜索,提高整体检索的效率(分片数的最优值与硬件参数和数据量大小有关)。分片的数量只能在索引创建前指定,并且索引创建后不能更改。副本是一个分片的精确复制,每个分片可以有零个或多个副本。副本的作用一是提高系统的容错性,当某个节点某个分片损坏或丢失时可以从副本中恢复。二是提高es的查询效率,es会自动对搜索请求进行负载均衡

2 什么是 IK 分词器

在这里插入图片描述

3 安装 IK 分词器

GitHub 上的下载地址

新建 ik 目录
在这里插入图片描述

将这个插件的压缩包解压到 ES 的 plugins 目录下的 ik 目录下
在这里插入图片描述

之后,重启 / 启动 ES,在打印的日志中,会看到加载 ik 插件的信息
在这里插入图片描述


补充:如何查看已安装的插件:

利用这个可执行文件:
在这里插入图片描述
在这里插入图片描述


重启 / 启动 Kibana

4 使用 IK 分词器

打开开发工具
在这里插入图片描述
在这里写语句即可

1、ik_smart:最大粒度切分

输入:
在这里插入图片描述

输出:
在这里插入图片描述

2、ik_max_word:最细粒度切分

输入:
在这里插入图片描述
输出:
在这里插入图片描述

3、输入字典中不存在的词,例如自己名字

输入:

在这里插入图片描述

输出:
在这里插入图片描述

可见,字典中不存在的词,被拆分了

4、自定义的词,需要自己添加到分词器的字典中

新建自己的自定义词库文件
在这里插入图片描述
把自定义的词,加入进去
在这里插入图片描述
在 ik 配置中指定此配置文件
在这里插入图片描述
重启 ES,再次测试,即可看到已将自定义的词单独拆出
在这里插入图片描述

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop】
推荐阅读
相关标签
  

闽ICP备14008679号