0
点赞
收藏
分享

微信扫一扫

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用

文章目录

  • ​​1 ES 核心概念​​
  • ​​2 什么是 IK 分词器​​
  • ​​3 安装 IK 分词器​​
  • ​​4 使用 IK 分词器​​

1 ES 核心概念

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_大数据


【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_elasticsearch_02


【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_自定义_03


【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_java_04


【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_分词器_05


【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_分词器_06


【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_java_07


【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_elasticsearch_08


分片(Shard):ES的“分片(shard)”机制可将一个索引内部的数据分布地存储于多个节点,它通过将一个ES索引切分为多个底层物理的Lucene索引 + 倒排索引的数据结构,完成索引数据的分割存储功能,这每一个物理的Lucene索引称为一个分片(shard)。这样的好处是可以把一个大的索引拆分成多个,分布到不同的节点上。降低单服务器的压力,构成分布式搜索,提高整体检索的效率(分片数的最优值与硬件参数和数据量大小有关)。分片的数量只能在索引创建前指定,并且索引创建后不能更改。副本是一个分片的精确复制,每个分片可以有零个或多个副本。副本的作用一是提高系统的容错性,当某个节点某个分片损坏或丢失时可以从副本中恢复。二是提高es的查询效率,es会自动对搜索请求进行负载均衡

2 什么是 IK 分词器

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_java_09

3 安装 IK 分词器

​​GitHub 上的下载地址​​

新建 ik 目录

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_分词器_10

将这个插件的压缩包解压到 ES 的 plugins 目录下的 ik 目录下

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_java_11

之后,重启 / 启动 ES,在打印的日志中,会看到加载 ik 插件的信息

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_分词器_12

补充:如何查看已安装的插件:

利用这个可执行文件:

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_java_13


【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_elasticsearch_14

重启 / 启动 Kibana

4 使用 IK 分词器

打开开发工具

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_自定义_15


在这里写语句即可

1、ik_smart:最大粒度切分

输入:

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_elasticsearch_16

输出:

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_自定义_17

2、ik_max_word:最细粒度切分

输入:

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_大数据_18


输出:

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_大数据_19

3、输入字典中不存在的词,例如自己名字

输入:

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_自定义_20

输出:

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_分词器_21

可见,字典中不存在的词,被拆分了

4、自定义的词,需要自己添加到分词器的字典中

新建自己的自定义词库文件

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_分词器_22


把自定义的词,加入进去

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_java_23


在 ik 配置中指定此配置文件

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_分词器_24


重启 ES,再次测试,即可看到已将自定义的词单独拆出

【ELK技术栈】ElasticSearch 核心概念,IK 分词器的概述、安装、使用_自定义_25


举报

相关推荐

0 条评论