欢迎来到天天文库
浏览记录
ID:37728698
大小:232.32 KB
页数:7页
时间:2019-05-29
《Lucene是一套全文检索的API》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、Lucene是一套全文检索的API,对其介绍的文章和应用的案例都多,可参考lucene及本文的参考文献。此次学习,以实用为主,一是简单应用,二是Web应用,三是汉化,四相关应用(Lucene主页上在SandBox中)。0、准备工作去Lucene的主页下载目前的稳定版本lucene-1.2.tar.gz,解压缩,将lucene-1.2目录下的两个jar文件lucene-1.2.jar和lucene-demo2-1.2.jar放到适当的目录下后,并将其加入到CLASSPATH环境变量中。tarzxvflucene-1.2.tar.gz<----解压缩cdlucene-1.2cp*.jar$DP<-
2、--存放jar文件的目录,根据具体工作要求用实际目录替换CLASSPATH=$CLASSPATH:$DP/lucene-1.2.jar:$DP/lucene-demos-1.2.jar;exportCLASSPATH如果不想在每次都登录后,可以编辑/etc/profile或自己目录下的.profile,将上面的最后一行加到文件的最后一行。Windows的设置,右击桌面的“我的电脑”,选“高级”->“环境变量”->选中CLASSPATH->“编辑”,在输入框中加入两个jar文件的全路径名,注意分隔符是分号(;)。参见右图。1、运行demo$javaorg.apache.lucene.demo.I
3、ndexFiles/usr/local/man/man1/<--对man文件建立索引adding/usr/local/man/man1/mysql.1...........adding/usr/local/man/man1/cvs.11614totalmilliseconds$javaorg.apache.lucene.demo.SearchFiles<--进行检索Query:passwordSearchingfor:password7totalmatchingdocuments0./usr/local/man/man1/mysql.1......6./usr/local/man/man1/m
4、ysqlshow.1Query:OK!Lucene自待的demo运行成功这个demo程序调用的主要API函数:/*关于索引的主要函数*/Filefile=newFile(argv[]);IndexWriterwriter=newIndexWriter("index",newStandardAnalyzer(),true);Documentdoc=newDocument();doc.add(Field.Text("path",file.getPath()));doc.add(Field.Keyword("modified",DateField.timeToString(file.lastModi
5、fied())));FileInputStreamis=newFileInputStream(f);Readerreader=newBufferedReader(newInputStreamReader(is));doc.add(Field.Text("contents",reader));writer.addDocument(doc);writer.optimize();writer.close();/*关于检索的主要函数*/Searchersearcher=newIndexSearcher("index");Analyzeranalyzer=newStandardAnalyzer();Qu
6、eryquery=QueryParser.parse(lineforsearch,"contents",analyzer);Hitshits=searcher.search(query);for(inti=start;i7、irlucenedbcdlucenedbjavaorg.apache.lucene.demo.IndexHTML-create-index$TOMCAT/webapps/lucenedb../examples<--用相对路径“..”,一来指明被索引的文件的位置,二来用来显示被索引文件的URL,因为检索的jsp程序在luceneweb子目录下.examples可用其它的真实应用的目录名来替换cd..
7、irlucenedbcdlucenedbjavaorg.apache.lucene.demo.IndexHTML-create-index$TOMCAT/webapps/lucenedb../examples<--用相对路径“..”,一来指明被索引的文件的位置,二来用来显示被索引文件的URL,因为检索的jsp程序在luceneweb子目录下.examples可用其它的真实应用的目录名来替换cd..
此文档下载收益归作者所有