欢迎来到天天文库
浏览记录
ID:28857837
大小:181.00 KB
页数:12页
时间:2018-12-14
《lucene4.7+ikanalyzer中文分词入门教程》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、实用标准文案Lucene4.7+IKAnalyzer中文分词入门教程作者:大明日期:2014-4-1环境:1.lucene版本:4.7下载地址:http://mirrors.hust.edu.cn/apache/lucene/java/4.7.0/下载页面中的lucene-4.7.0.tgz2.IKAnalyzer版本:IKAnalyer2012-FFHotfix1下载地址:http://code.google.com/p/ik-analyzer/downloads/list选择最上面的源码包。目前只有这个源码包才能支持lucene的4.7版本。3.参考文章:http://
2、www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html此篇文章作者用的是lucene3.5版本,我做了一定幅度的修改,使其在4.7中可用。下面进入正式部署阶段:1.在eclipse中新建一个java项目:lucenetest2.解压lucene-4.7.0.tgz3.进入到解压后的lucene-4.7.0目录,搜索*.jar4.搜索出来的结果是lucene4.7提供的所有的jar包,根据需要拷贝不同的jar包到自己的工程。本例子需要如下几个jar包:5.将以上几个jar包拷贝到lucenetest下的lib文件夹下,
3、如果没有lib,则新建。6.在eclipse中,打开lib,选中这几个jar包,点右键——buildparh——addtobuildpath7.解压下载的IKAnalyzer2012FF_hf1_source.rar8.进入到IKAnalyzer2012FF_hf1_sourcesrc将如下所有的文件拷贝到lucenetestsrc下9.精彩文档实用标准文案刷新eclipse工程。如果源码报错,可能是编码格式的问题。解决办法:在lucenetest上点右键,选择最后一项Properties。如下图所示选择utf-8,点确定1.至此,环境已经搭建完毕。如果嫌ik的源码烦,
4、可以自行打成jar包。目前eclipse项目的结构图如下:精彩文档实用标准文案1.加入测试的例子。在src新建ik包,新建下面3个java文件(1)DataFactorypackageik;importjava.util.ArrayList;importjava.util.List;publicclassDataFactory{privatestaticDataFactorydataFactory=newDataFactory();privateDataFactory(){}publicListgetData(){Listlist=n
5、ewArrayList();list.add(newMedicine(1,"银花感冒颗粒","功能主治:银花感冒颗粒,头痛,清热,解表,利咽。"));list.add(newMedicine(2,"感冒精彩文档实用标准文案止咳糖浆","功能主治:感冒止咳糖浆,解表清热,止咳化痰。"));list.add(newMedicine(3,"感冒灵颗粒","功能主治:解热镇痛。头痛,清热。"));list.add(newMedicine(4,"感冒灵胶囊","功能主治:银花感冒颗粒,头痛,清热,解表,利咽。"));list.add(newMedicine(5,"
6、仁和感冒颗粒","功能主治:疏风清热,宣肺止咳,解表清热,止咳化痰。"));returnlist;}publicstaticDataFactorygetInstance(){returndataFactory;}}(2)LuceneIKUtilpackageik;importjava.io.File;importjava.io.IOException;importjava.util.ArrayList;importjava.util.List;importorg.apache.lucene.analysis.Analyzer;importorg.apache.lucene.
7、document.Document;importorg.apache.lucene.document.Field;importorg.apache.lucene.document.FieldType;importorg.apache.lucene.document.TextField;importorg.apache.lucene.index.DirectoryReader;importorg.apache.lucene.index.IndexReader;importorg.apache.lucene.index
此文档下载收益归作者所有