ElasticSearch中如何使用analyze-ik分词器进行文本分析？

2026-05-20 23:211阅读0评论SEO资讯

内容介绍
文章标签
相关推荐

本文共计515个文字，预计阅读时间需要3分钟。

下载安装到/mydata/elasticsearch/config后，直接解压ik包。之后重启es，测试post /_analyze?{text:中华人民共和国, analyzer:ik_smart}{tokens: [{token:中华, start_offset: 0, end_offset: 2, type: CN_WORD, position: 0}]}

下载安装

到/mydata/elasticsearch/config 下面直接解压ik 之后重启es

测试

post _analyze? { "text":"中华人民共和国", "analyzer":"ik_smart" } { "tokens": [ { "token": "中华", "start_offset": 0, "end_offset": 2, "type": "CN_WORD", "position": 0 }, { "token": "人民", "start_offset": 2, "end_offset": 4, "type": "CN_WORD", "position": 1 }, { "token": "共和国", "start_offset": 4, "end_offset": 7, "type": "CN_WORD", "position": 2 } ] }

ElasticSearch-分词-自定义扩展词库

先下载nginx

cd /mydata mkdir nginx 启动nginx （没有会去下载） docker run -p 80:80 --name nginx -d nginx:1.10 复制 nginx docker container cp nginx:/etc/nginx . 从命名nginx mv nginx conf 停止docker stop nginx 删除docker rm nginx 创建 docker run -p 80:80 --name nginx \ -v /mydata/nginx/html:/usr/share/nginx/html \ -v /mydata/nginx/logs:/var/log/nginx \ -v /mydata/nginx/conf:/etc/nginx \ -d nginx:1.10 wqg Mall 能显示就可创建 ex/fenci.txt 访问192.168.56.10/es/fenci.txt

配置自定义分词器

修改 /mydata/elasticsearch/plugins/analysis-ik/config 下面的IKAnalyzer.cfg.xml <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE properties SYSTEM "java.sun.com/dtd/properties.dtd"> <properties> <comment>IK Analyzer 扩展配置</comment>  <entry key="ext_dict"></entry>  <entry key="ext_stopwords"></entry>  <entry key="remote_ext_dict">192.168.56.10/es/fenci.txt</entry>   </properties> 重启es 每次自定义分词需要加入fenci.txt中并重启es即可

标签：Elasticsearch 分词器 analyzeik

本文共计515个文字，预计阅读时间需要3分钟。

下载安装

到/mydata/elasticsearch/config 下面直接解压ik 之后重启es

测试

ElasticSearch-分词-自定义扩展词库

先下载nginx

配置自定义分词器

标签：Elasticsearch 分词器 analyzeik

下载安装

测试

ElasticSearch-分词-自定义扩展词库

配置自定义分词器

相关推荐

下载安装

测试

ElasticSearch-分词-自定义扩展词库

配置自定义分词器

相关推荐