Elasticsearch 7.3教程:如何使用IK Analyzer中文分词器与定制词库?
- 内容介绍
- 文章标签
- 相关推荐
本文共计2270个文字,预计阅读时间需要10分钟。
1. 中文分词器 1.1 默认分词器首先看看ElasticSearch中默认的standard分词器,它对英文比较友好,但对于中文来说,它只是按字符分割,并不友好。中文通常需要按照词语来分割,而不是字符。
GET /_analyze{ analyzer: standard, text: 这是一个测试文本}
1、 中文分词器 1.1 默认分词器先来看看ElasticSearch中默认的standard 分词器,对英文比较友好,但是对于中文来说就是按照字符拆分,不是那么友好。
GET /_analyze
{
"analyzer": "standard",
"text": "中华人民共和国"
}
我们想要的效果是什么:“中华人民共和国”作为一整个词语。
本文共计2270个文字,预计阅读时间需要10分钟。
1. 中文分词器 1.1 默认分词器首先看看ElasticSearch中默认的standard分词器,它对英文比较友好,但对于中文来说,它只是按字符分割,并不友好。中文通常需要按照词语来分割,而不是字符。
GET /_analyze{ analyzer: standard, text: 这是一个测试文本}
1、 中文分词器 1.1 默认分词器先来看看ElasticSearch中默认的standard 分词器,对英文比较友好,但是对于中文来说就是按照字符拆分,不是那么友好。
GET /_analyze
{
"analyzer": "standard",
"text": "中华人民共和国"
}
我们想要的效果是什么:“中华人民共和国”作为一整个词语。

