Elasticsearch 7.3教程:如何自定义分词器(Analyzer)?

2026-05-22 14:150阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计951个文字,预计阅读时间需要4分钟。

Elasticsearch 7.3教程:如何自定义分词器(Analyzer)?

1. 默认分词器及分词器介绍 前面的博客已介绍了分词器,链接:ElasticSearch7.3 学习之倒排索引及初步认识分词器(Analyzer)。 这里主要介绍默认分词器:standard analyzer 和修改分词器设置。

2. 默认分词器:standard analyzer standard analyzer 是 Elasticsearch 的默认分词器,它使用标准分词规则,将文本分割成单词、数字和符号。

3. 修改分词器设置 可以通过修改分词器的配置来改变分词行为。以下是一个示例:

json PUT /index_name { settings: { analysis: { analyzer: { custom_analyzer: { type: custom, tokenizer: standard, filter: [lowercase, stop] } } } } }

在这个例子中,我们创建了一个名为 `custom_analyzer` 的自定义分词器,它使用 `standard` 分词器作为基础,并添加了 `lowercase` 和 `stop` 过滤器。`lowercase` 过滤器将所有单词转换为小写,而 `stop` 过滤器将移除一些常见的停用词(如 the、and 等)。

1、默认的分词器

关于分词器,前面的博客已经有介绍了,链接:ElasticSearch7.3 学习之倒排索引揭秘及初识分词器(Analyzer)。

阅读全文

本文共计951个文字,预计阅读时间需要4分钟。

Elasticsearch 7.3教程:如何自定义分词器(Analyzer)?

1. 默认分词器及分词器介绍 前面的博客已介绍了分词器,链接:ElasticSearch7.3 学习之倒排索引及初步认识分词器(Analyzer)。 这里主要介绍默认分词器:standard analyzer 和修改分词器设置。

2. 默认分词器:standard analyzer standard analyzer 是 Elasticsearch 的默认分词器,它使用标准分词规则,将文本分割成单词、数字和符号。

3. 修改分词器设置 可以通过修改分词器的配置来改变分词行为。以下是一个示例:

json PUT /index_name { settings: { analysis: { analyzer: { custom_analyzer: { type: custom, tokenizer: standard, filter: [lowercase, stop] } } } } }

在这个例子中,我们创建了一个名为 `custom_analyzer` 的自定义分词器,它使用 `standard` 分词器作为基础,并添加了 `lowercase` 和 `stop` 过滤器。`lowercase` 过滤器将所有单词转换为小写,而 `stop` 过滤器将移除一些常见的停用词(如 the、and 等)。

1、默认的分词器

关于分词器,前面的博客已经有介绍了,链接:ElasticSearch7.3 学习之倒排索引揭秘及初识分词器(Analyzer)。

阅读全文