欢迎来到天天文库
浏览记录
ID:14592429
大小:41.91 MB
页数:432页
时间:2018-07-29
《lucene in action》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、[GeneralInformation]书名=LUCENEINACTION(中文版)作者=(美)OTISGOSPODNETICERIKHATCHER著谭鸿黎俊鸿周鹏高承山译页数=393SS号=11806823出版日期=2007年01月出版社=电子工业出版社主题词=互联网络(学科:程序设计)互联网络程序设计参考文献格式=(美)OtisGospodnetic,(美)ErikHatcher著;谭鸿等译.LuceneINACTION中文版Java搜索引擎指南.北京市:电子工业出版社,2007.内容提要=深入浅出地介绍了Lucene——一个开源的使用Java语言编
2、写的全文搜索引擎开发包。分Lucene的核心和Lucene的应用两部分。封面书名版权前言目录推荐序译者序前言1前言2致谢关于此书第1部分Lucene的核心第1章初识Lucene1.1信息组织和访问的发展历程1.2理解Lucene1.2.1Lucene是什么1.2.2Lucene能做些什么1.2.3Lucene的历史1.2.4使用Lucene的组织1.2.5Lucene移植:Perl、Python、C++、.NET及Ruby版本1.3索引和搜索1.3.1什么是索引,为什么如此重要?1.3.2什么是搜索1.4Lucene实践:一个应用实例1.4.1创建一个索
3、引1.4.2搜索一个索引1.5理解索引过程的核心类1.5.1IndexWriter1.5.2Directory1.5.3Analyzer1.5.4Document1.5.5Field1.6理解搜索过程的核心类1.6.1IndexSearcher1.6.2Term1.6.3Query1.6.4TermQuery1.6.5Hits1.7可选择的同类产品1.7.1信息检索工具库1.7.2索引与搜索应用程序1.7.3在线资源1.8小结第2章索引2.1理解索引过程2.1.1转换成文本2.1.2分析2.1.3将分析过后的数据写入索引2.2基本索引操作2.2.1向索引
4、添加文档2.2.2删除索引中的文档2.2.3恢复被删除的文档2.2.4更新索引中的文档2.3增强Document和Field对象2.4索引日期2.5索引数字2.6索引Field对象用于排序2.7控制索引过程2.7.1调整索引性能2.7.2内存中的索引:RAMDirectory2.7.3限制域的大小:maxFieldLength2.8优化索引2.9并发性、线程安全性以及锁机制2.9.1并发访问的规则2.9.2线程安全性2.9.3索引锁机制2.9.4禁用索引锁2.10调试索引过程2.11小结第3章为应用程序添加搜索功能3.1实现一个简单的搜索程序3.1.1对
5、特定项(specificterm)的搜索3.1.2解析用户输入的查询表达式:QueryParser3.2使用IndexSearcher3.2.1使用Hits3.2.2通过Hits分页显示搜索结果3.2.3将索引读入内存3.3理解Lucene的评分机制3.3.1关于Lucene,还有更多的解释3.4在程序代码中创建Query对象3.4.1通过项进行搜索:TermQuery3.4.2在指定范围内搜索:RangeQuery3.4.3通过字符串进行搜索:PrefixQuery3.4.4组合查询:BooleanQuery3.4.5通过短语搜索:PhraseQuer
6、y3.4.6使用通配符搜索:WildcardQuery3.4.7搜索类似项:FuzzyQuery3.5解析查询表达式:QueryParser3.5.1Query类的toString()方法3.5.2布尔操作符3.5.3查询组合3.5.4域的选择3.5.5在指定范围搜索3.5.6短语查询3.5.7通配符和前缀查询3.5.8模糊查询3.5.9对查询进行加权操作3.5.10需不需要使用QueryParse?3.6小结第4章分析4.1使用分析器4.1.1索引过程中的分析4.1.2QueryParser分析4.1.3解析vs分析:分析器何时不适用4.2剖析分析器4
7、.2.1语汇单元的组成4.2.2TokenStream揭密4.2.3观察分析器4.2.4过滤顺序的重要性4.3使用内置的分析器4.3.1StopAnalyzer4.3.2StandardAnalyzer4.4处理关键词域4.4.1更换关键字分析器4.5近音词查询4.6同义词、别名以及其他表示相同意义的词4.6.1显示语汇单元的位置4.7词干分析4.7.1保留空位4.7.2PositionalPorterStopAnalyzer4.7.3为保留停用词空位所带来的问题4.8语言分析4.8.1Unicode及字符编码4.8.2非英语语种分析4.8.3亚洲语种分
8、析4.8.4非英语语种分析引起的其他一些问题4.9Nutch分析4.10小结第5
此文档下载收益归作者所有