必须掌握的全文检索Lucene,带你一周从入门到精通搜索引擎!
专辑:Lucene (全文检索工具)从入门到精通
简介:Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。本专辑将带你从快速掌握Lucene全文检索工具!
课程目标
本课程面向初学搜索引擎及lucene的学员,带领大家进入搜索引擎领域
课程大纲
一、lucene简介
1.什么是lucene
2.全文检索流程
3.lucene索引搜索示例
实践操作实例:
1.索引示例
2.搜索示例
预期收获:
了解lucene的基本概念及搜索流程
二、lucene索引
1.Docuemnt对象
2.Field对象
3.Direcotry对象
4.IndexWriter对象
5.IndexWriter对象
实践操作实例:
创建索引
预期收获:
利用索引对象创建索引
三、lucene索引过程分析
1.创建索引的过程分析
2.了解Segment的概念
实践操作实例:
索引过程分析演示
预期收获:
了解创建索引的内部实现机制
四、lucene索引优化
lucene索引优化参数
实践操作实例:
演示各参数的概念
预期收获:
了解优化索引的参数及设置
五、lucene搜索
1.IndexSearch
2.QueryParser
3.Query
实践操作实例:
利用IndexSearch实现搜索
预期收获:
了解搜索流程
六、lucene query使用
1.TermQuery使用
2.FuzzyQuery
3.PrefixQuery
实践操作实例:
各query的构造及使用
预期收获:
了解query的使用及query之间的区别
七、lucene布尔查询
BooleanQuery
实践操作实例:
BooleanQuery的使用
预期收获:
构建BooleanQuery
八、lucene过滤器
Filter抽象类
实践操作实例:
实现Filter,满足过滤查询需求
预期收获:
能利用Filter抽象类实现自定义过滤器功能