Elasticsearch 7.3教程:如何自定义分词器(Analyzer)?
- 内容介绍
- 文章标签
- 相关推荐
本文共计951个文字,预计阅读时间需要4分钟。
1. 默认分词器及分词器介绍 前面的博客已介绍了分词器,链接:ElasticSearch7.3 学习之倒排索引及初步认识分词器(Analyzer)。 这里主要介绍默认分词器:standard analyzer 和修改分词器设置。
2. 默认分词器:standard analyzer standard analyzer 是 Elasticsearch 的默认分词器,它使用标准分词规则,将文本分割成单词、数字和符号。
3. 修改分词器设置 可以通过修改分词器的配置来改变分词行为。以下是一个示例:
json PUT /index_name { settings: { analysis: { analyzer: { custom_analyzer: { type: custom, tokenizer: standard, filter: [lowercase, stop] } } } } }
在这个例子中,我们创建了一个名为 `custom_analyzer` 的自定义分词器,它使用 `standard` 分词器作为基础,并添加了 `lowercase` 和 `stop` 过滤器。`lowercase` 过滤器将所有单词转换为小写,而 `stop` 过滤器将移除一些常见的停用词(如 the、and 等)。
1、默认的分词器关于分词器,前面的博客已经有介绍了,链接:ElasticSearch7.3 学习之倒排索引揭秘及初识分词器(Analyzer)。
本文共计951个文字,预计阅读时间需要4分钟。
1. 默认分词器及分词器介绍 前面的博客已介绍了分词器,链接:ElasticSearch7.3 学习之倒排索引及初步认识分词器(Analyzer)。 这里主要介绍默认分词器:standard analyzer 和修改分词器设置。
2. 默认分词器:standard analyzer standard analyzer 是 Elasticsearch 的默认分词器,它使用标准分词规则,将文本分割成单词、数字和符号。
3. 修改分词器设置 可以通过修改分词器的配置来改变分词行为。以下是一个示例:
json PUT /index_name { settings: { analysis: { analyzer: { custom_analyzer: { type: custom, tokenizer: standard, filter: [lowercase, stop] } } } } }
在这个例子中,我们创建了一个名为 `custom_analyzer` 的自定义分词器,它使用 `standard` 分词器作为基础,并添加了 `lowercase` 和 `stop` 过滤器。`lowercase` 过滤器将所有单词转换为小写,而 `stop` 过滤器将移除一些常见的停用词(如 the、and 等)。
1、默认的分词器关于分词器,前面的博客已经有介绍了,链接:ElasticSearch7.3 学习之倒排索引揭秘及初识分词器(Analyzer)。

