赞
踩
前言:本文学习并总结自:https://www.bilibili.com/video/BV17a4y1x7zq?p=8
分片(Shard):ES的“分片(shard)”机制可将一个索引内部的数据分布地存储于多个节点,它通过将一个ES索引切分为多个底层物理的Lucene索引 + 倒排索引的数据结构,完成索引数据的分割存储功能,这每一个物理的Lucene索引称为一个分片(shard)。这样的好处是可以把一个大的索引拆分成多个,分布到不同的节点上。降低单服务器的压力,构成分布式搜索,提高整体检索的效率(分片数的最优值与硬件参数和数据量大小有关)。分片的数量只能在索引创建前指定,并且索引创建后不能更改。副本是一个分片的精确复制,每个分片可以有零个或多个副本。副本的作用一是提高系统的容错性,当某个节点某个分片损坏或丢失时可以从副本中恢复。二是提高es的查询效率,es会自动对搜索请求进行负载均衡。
新建 ik 目录
将这个插件的压缩包解压到 ES 的 plugins 目录下的 ik 目录下
之后,重启 / 启动 ES,在打印的日志中,会看到加载 ik 插件的信息
补充:如何查看已安装的插件:
利用这个可执行文件:
重启 / 启动 Kibana
打开开发工具
在这里写语句即可
1、ik_smart:最大粒度切分
输入:
输出:
2、ik_max_word:最细粒度切分
输入:
输出:
3、输入字典中不存在的词,例如自己名字
输入:
输出:
可见,字典中不存在的词,被拆分了
4、自定义的词,需要自己添加到分词器的字典中
新建自己的自定义词库文件
把自定义的词,加入进去
在 ik 配置中指定此配置文件
重启 ES,再次测试,即可看到已将自定义的词单独拆出
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。