欢迎来到天天文库
浏览记录
ID:23734763
大小:782.00 KB
页数:150页
时间:2018-11-10
《尚学堂科技张志宇lucene构建一个简单的web搜索程序》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、Lucene_构建一个简单的WEB搜索程序lucene2.3.2tomcat6.0.16je-analysis1.4.0lukeall0.7.1Mysqljdbcdriver3.1.13Tidy04aug2000r7MyEclipse6.0M1_E3.3l项目周期n3-4天l目标nLucene入门u全文检索的概念,倒排索引的概念u建立索引u搜索u中文分词的实现nNutch入门n串知识点Html,css,javascript,servlet,jsp,mysql,n介绍MVC的概念n演示借用一些javascript的成熟的框架实现页面的特殊效果。例如:ricon学
2、会使用myeclipsen熟悉mysql数据库的用法l什么时候用lucenen数据库大量数据,文本字段内容很多n非结构化文档1.安装myeclipsel建立工程àwebprojectn工程名称lucenel如何配置tomcat服务器n好处à自动部署nWindowàshowviewàserversl如何部署webappnDeploy按钮,添加tomcat项目lWebbrowser窗口n最好不用此browsernShowviewàwebbrowserl引入jar包àLucene工程文件夹下,建立lib目录,拷贝如下jar包到lib目录nlucene-core-2.
3、2.0.jarnTidy.jarnlucene-2.2.0lucene-2.2.0contribanalyzersàlucene-analyzers-2.2.0.jarnje-analysis-1.4.0.jarnmysql-connector-java-3.1.13-bin.jarl显示linenumberlAlt/自动完成快捷键效果出不来l.快捷键效果出不来1.为一个文件建立索引(英文)确认已经引入包lucene-core-2.2.0.jarField.Store.YES和Field.Store.NO区别ltermVector是Lucene1.4.3
4、新增的它提供一种向量机制来进行模糊查询,很少用。lDateTools.timeToStringIndexHTML.javaimportjava.io.File;importorg.apache.lucene.analysis.standard.StandardAnalyzer;importorg.apache.lucene.document.Document;importorg.apache.lucene.document.Field;importorg.apache.lucene.index.IndexWriter;publicclassIndexHTML{
5、staticStringindex="D:\share\05_Servlet_JSP\tomcat\apache-tomcat-5.5.17\index";staticStringroot="D:\share\lucene\soft\lucene-2.2.0\lucene-2.2.0\docs\api\index.html";publicstaticvoidmain(Stringargs[])throwsException{IndexWriterwriter=newIndexWriter(index,newStandardAnalyz
6、er(),true);Documentdoc=newDocument();Filef=newFile(root);doc.add(newField("path",f.getPath(),Field.Store.YES,Field.Index.UN_TOKENIZED));doc.add(newField("content","我们是共产主义接班人",Field.Store.NO,Field.Index.TOKENIZED));writer.addDocument(doc);writer.optimize();writer.close();}}1.如何确认索引已
7、经正确建立?java-jarlukeall-0.7.1.jar2.tomcat配置lWEB-INFliblucene-core-2.2.0.jarnje-analysis-1.4.0.jarl确保8080端口可用lreloadablenC:tomcatconfcontext.xmlà3.为一个文件建立索引(递归)importjava.io.File;importjava.io.FileNotFoundException;importjava.io.FileReader;importjava.io
8、.IOException;import
此文档下载收益归作者所有