如何仿照Baidu,利用Lucene.net轻松搭建全文检索系统?
- 内容介绍
- 文章标签
- 相关推荐
本文共计3774个文字,预计阅读时间需要16分钟。
Lucene.Net 是 Lucene 的 .NET 移植版本,是一个开源的全文检索引擎开发包。它不是一个完整的全文检索引擎,而是一个引擎的框架,可以理解为一个 Library。
Lucene.Netok,接下来就细细详解下士怎样一步一步实现这个效果的。 Lucene.Net 核心——分词算法(Analyzer)Lucene.net是Lucene的.net移植版本,是一个开源的全文检索引擎开发包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,是一个Library.你也可以把它理解为一个将索引,搜索功能封装的很好的一套简单易用的API(提供了完整的查询引擎和索引引擎)。利用这套API你可以做很多有关搜索的事情,而且很方便.。开发人员可以基于Lucene.net实现全文检索的功能。
注意:Lucene.Net只能对文本信息进行检索。如果不是文本信息,要转换为文本信息,比如要检索Excel文件,就要用NPOI把Excel读取成字符串,然后把字符串扔给Lucene.Net。Lucene.Net会把扔给它的文本切词保存,加快检索速度。
更多概念性的知识可以参考这篇博文:blog.csdn.net/xiucool/archive/2008/11/28/3397182.aspx
这个小Demo样例展示:
学习Lucune.Net,分词是核心。当然最理想状态下是能自己扩展分词,但这要很高的算法要求。Lucene.Net中不同的分词算法就是不同的类。
本文共计3774个文字,预计阅读时间需要16分钟。
Lucene.Net 是 Lucene 的 .NET 移植版本,是一个开源的全文检索引擎开发包。它不是一个完整的全文检索引擎,而是一个引擎的框架,可以理解为一个 Library。
Lucene.Netok,接下来就细细详解下士怎样一步一步实现这个效果的。 Lucene.Net 核心——分词算法(Analyzer)Lucene.net是Lucene的.net移植版本,是一个开源的全文检索引擎开发包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,是一个Library.你也可以把它理解为一个将索引,搜索功能封装的很好的一套简单易用的API(提供了完整的查询引擎和索引引擎)。利用这套API你可以做很多有关搜索的事情,而且很方便.。开发人员可以基于Lucene.net实现全文检索的功能。
注意:Lucene.Net只能对文本信息进行检索。如果不是文本信息,要转换为文本信息,比如要检索Excel文件,就要用NPOI把Excel读取成字符串,然后把字符串扔给Lucene.Net。Lucene.Net会把扔给它的文本切词保存,加快检索速度。
更多概念性的知识可以参考这篇博文:blog.csdn.net/xiucool/archive/2008/11/28/3397182.aspx
这个小Demo样例展示:
学习Lucune.Net,分词是核心。当然最理想状态下是能自己扩展分词,但这要很高的算法要求。Lucene.Net中不同的分词算法就是不同的类。

