lucene4.7+ikanalyzer中文分词入门教程

lucene4.7+ikanalyzer中文分词入门教程

ID:28857837

大小:181.00 KB

页数:12页

时间:2018-12-14

lucene4.7+ikanalyzer中文分词入门教程_第1页
lucene4.7+ikanalyzer中文分词入门教程_第2页
lucene4.7+ikanalyzer中文分词入门教程_第3页
lucene4.7+ikanalyzer中文分词入门教程_第4页
lucene4.7+ikanalyzer中文分词入门教程_第5页
资源描述:

《lucene4.7+ikanalyzer中文分词入门教程》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实用标准文案Lucene4.7+IKAnalyzer中文分词入门教程作者:大明日期:2014-4-1环境:1.lucene版本:4.7下载地址:http://mirrors.hust.edu.cn/apache/lucene/java/4.7.0/下载页面中的lucene-4.7.0.tgz2.IKAnalyzer版本:IKAnalyer2012-FFHotfix1下载地址:http://code.google.com/p/ik-analyzer/downloads/list选择最上面的源码包。目前只有这个源码包才能支持lucene的4.7版本。3.参考文章:http://

2、www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html此篇文章作者用的是lucene3.5版本,我做了一定幅度的修改,使其在4.7中可用。下面进入正式部署阶段:1.在eclipse中新建一个java项目:lucenetest2.解压lucene-4.7.0.tgz3.进入到解压后的lucene-4.7.0目录,搜索*.jar4.搜索出来的结果是lucene4.7提供的所有的jar包,根据需要拷贝不同的jar包到自己的工程。本例子需要如下几个jar包:5.将以上几个jar包拷贝到lucenetest下的lib文件夹下,

3、如果没有lib,则新建。6.在eclipse中,打开lib,选中这几个jar包,点右键——buildparh——addtobuildpath7.解压下载的IKAnalyzer2012FF_hf1_source.rar8.进入到IKAnalyzer2012FF_hf1_sourcesrc将如下所有的文件拷贝到lucenetestsrc下9.精彩文档实用标准文案刷新eclipse工程。如果源码报错,可能是编码格式的问题。解决办法:在lucenetest上点右键,选择最后一项Properties。如下图所示选择utf-8,点确定1.至此,环境已经搭建完毕。如果嫌ik的源码烦,

4、可以自行打成jar包。目前eclipse项目的结构图如下:精彩文档实用标准文案1.加入测试的例子。在src新建ik包,新建下面3个java文件(1)DataFactorypackageik;importjava.util.ArrayList;importjava.util.List;publicclassDataFactory{privatestaticDataFactorydataFactory=newDataFactory();privateDataFactory(){}publicListgetData(){Listlist=n

5、ewArrayList();list.add(newMedicine(1,"银花感冒颗粒","功能主治:银花感冒颗粒,头痛,清热,解表,利咽。"));list.add(newMedicine(2,"感冒精彩文档实用标准文案止咳糖浆","功能主治:感冒止咳糖浆,解表清热,止咳化痰。"));list.add(newMedicine(3,"感冒灵颗粒","功能主治:解热镇痛。头痛,清热。"));list.add(newMedicine(4,"感冒灵胶囊","功能主治:银花感冒颗粒,头痛,清热,解表,利咽。"));list.add(newMedicine(5,"

6、仁和感冒颗粒","功能主治:疏风清热,宣肺止咳,解表清热,止咳化痰。"));returnlist;}publicstaticDataFactorygetInstance(){returndataFactory;}}(2)LuceneIKUtilpackageik;importjava.io.File;importjava.io.IOException;importjava.util.ArrayList;importjava.util.List;importorg.apache.lucene.analysis.Analyzer;importorg.apache.lucene.

7、document.Document;importorg.apache.lucene.document.Field;importorg.apache.lucene.document.FieldType;importorg.apache.lucene.document.TextField;importorg.apache.lucene.index.DirectoryReader;importorg.apache.lucene.index.IndexReader;importorg.apache.lucene.index

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。