ElasticSearch中如何使用analyze-ik分词器进行文本分析?
- 内容介绍
- 文章标签
- 相关推荐
本文共计515个文字,预计阅读时间需要3分钟。
下载安装到/mydata/elasticsearch/config后,直接解压ik包。之后重启es,测试post /_analyze?{text:中华人民共和国, analyzer:ik_smart}{tokens: [{token:中华, start_offset: 0, end_offset: 2, type: CN_WORD, position: 0}]}
下载安装
到/mydata/elasticsearch/config 下面直接解压ik 之后重启es
测试
post _analyze? { "text":"中华人民共和国", "analyzer":"ik_smart" } { "tokens": [ { "token": "中华", "start_offset": 0, "end_offset": 2, "type": "CN_WORD", "position": 0 }, { "token": "人民", "start_offset": 2, "end_offset": 4, "type": "CN_WORD", "position": 1 }, { "token": "共和国", "start_offset": 4, "end_offset": 7, "type": "CN_WORD", "position": 2 } ] }ElasticSearch-分词-自定义扩展词库
先下载nginx
配置自定义分词器
修改 /mydata/elasticsearch/plugins/analysis-ik/config 下面的IKAnalyzer.cfg.xml <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE properties SYSTEM "java.sun.com/dtd/properties.dtd"> <properties> <comment>IK Analyzer 扩展配置</comment> <!--用户可以在这里配置自己的扩展字典 --> <entry key="ext_dict"></entry> <!--用户可以在这里配置自己的扩展停止词字典--> <entry key="ext_stopwords"></entry> <!--用户可以在这里配置远程扩展字典 --> <entry key="remote_ext_dict">192.168.56.10/es/fenci.txt</entry> <!--用户可以在这里配置远程扩展停止词字典--> <!-- <entry key="remote_ext_stopwords">words_location</entry> --> </properties> 重启es 每次自定义分词 需要加入fenci.txt中 并重启es即可本文共计515个文字,预计阅读时间需要3分钟。
下载安装到/mydata/elasticsearch/config后,直接解压ik包。之后重启es,测试post /_analyze?{text:中华人民共和国, analyzer:ik_smart}{tokens: [{token:中华, start_offset: 0, end_offset: 2, type: CN_WORD, position: 0}]}
下载安装
到/mydata/elasticsearch/config 下面直接解压ik 之后重启es
测试
post _analyze? { "text":"中华人民共和国", "analyzer":"ik_smart" } { "tokens": [ { "token": "中华", "start_offset": 0, "end_offset": 2, "type": "CN_WORD", "position": 0 }, { "token": "人民", "start_offset": 2, "end_offset": 4, "type": "CN_WORD", "position": 1 }, { "token": "共和国", "start_offset": 4, "end_offset": 7, "type": "CN_WORD", "position": 2 } ] }ElasticSearch-分词-自定义扩展词库
先下载nginx

