欢迎来到天天文库
浏览记录
ID:34741252
大小:136.18 KB
页数:5页
时间:2019-03-10
《全文检索(discuzx2.5sphinx)》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、DiscuzX1.5+Sphinx帖子全文检索功能搭建Discuzx1.5带有Sphinx的接口,可是相关文档却几乎没有,功能基本上不能使用。下面就让我来说说如何安装Sphinx并将它集成到DiscuzX1.5中。注意:前提是您必须有一个独立的主机或者vps!以下操作均在ubuntuserver9.04中进行的,其它系统操作相差不大。下载安装文件1.wgethttp://www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.13.tar.gz2.tarzxvfcoreseek-3.2.13.tar.gz3.cdcoresee
2、k-3.2.13复制代码这里下载的是coreseek,它由国人基于Sphinx二次开发,更适合中文搜索。里面包含修改后的sphinx(csft)及中文分词程序mmseg安装mmseg安装coreseek开发的mmseg,它为sphinx提供中文分词功能1.cdmmseg-3.2.132../bootstrap3.#ubuntu环境下,需要使用ACLOCAL_FLAGS="-I/usr/share/aclocal"./bootstrap4../configure--prefix=/usr/local/mmseg5.make6.makeinstall复制代码安装完成
3、后,mmseg使用的词典和配置文件,将自动安装到/usr/local/mmseg/etc中其中uni.lib就是分词默认使用的词典如果觉得这个词库词量过小,可到搜狗上下载词库:http://pinyin.sogou.com/dict/list.php很多词库找不到TXT版的下载,可以直接通过地址:http://pinyin.sogou.com/dict/download_txt.php?id=词库id,来下载然后通过下面这种方式生成词典,替换掉默认词典就可以了1./usr/local/mmseg/bin/mmseg-uwords.txt#utf-8编码2.#生成
4、的文件名默认为原文件名加.uni后缀3.cpwords.txt.uni/usr/local/mmseg/etc/uni.lib复制代码安装sphinx1.cdcsft-3.2.132.#执行configure,进行编译配置:3../configure--prefix=/usr/local/sphinx4.--with-mysql=/usr/local/mysql/5.--with-mysql-includes=/usr/local/mysql/include/mysql/6.--with-mysql-libs=/usr/local/mysql/lib/my
5、sql/7.--with-mmseg=/usr/local/mmseg/8.--with-mmseg-includes=/usr/local/mmseg/include/mmseg/9.--with-mmseg-libs=/usr/local/mmseg/lib/10.make11.makeinstall复制代码注意:请修改/usr/local/mysql/为相应的mysql目录配置sphinx1、编写适合discuzx1.5的配置文件1.vim/usr/local/sphinx/etc/csft.cnf复制代码文件内容请从这里下载:http://blog
6、.2332.cn/files/sphinx/csft.conf把其中的数据库信息修改自己mysql服务器信息,同时不要忘了修改相应的表名前缀。2、建立sph_counter,在数据库中执行以下语词1.CREATETABLEIFNOTEXISTS`sph_counter`(2. `counter_id`int(10)NOTNULL,3. `max_doc_id`int(10)NOTNULL,4. PRIMARYKEY(`counter_id`)5.)ENGINE=MyISAMDEFAULTCHARSET=utf8;复制代码运行sphinx1、生成索引文件索引
7、文件是检索的根据,如果数据量大的话,第一次运行速度会比较慢执行以下命令:1./usr/local/sphinx/bin/indexer--config/usr/local/sphinx/etc/csft.conf--all复制代码2、运行sphinx程序1./usr/local/sphinx/bin/searchd--config/usr/local/sphinx/etc/csft.conf复制代码3、加入crontab计划任务这样的目的是每分钟自动更新索引,以保证检索引擎可以获得最新的数据1.vim/etc/crontab复制代码加上以下内容:1.#Incre
8、mentalIndexp
此文档下载收益归作者所有