全文检索(discuzx2.5sphinx)

全文检索(discuzx2.5sphinx)

ID:34741252

大小:136.18 KB

页数:5页

时间:2019-03-10

全文检索(discuzx2.5sphinx)_第1页
全文检索(discuzx2.5sphinx)_第2页
全文检索(discuzx2.5sphinx)_第3页
全文检索(discuzx2.5sphinx)_第4页
全文检索(discuzx2.5sphinx)_第5页
资源描述:

《全文检索(discuzx2.5sphinx)》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、DiscuzX1.5+Sphinx帖子全文检索功能搭建Discuzx1.5带有Sphinx的接口,可是相关文档却几乎没有,功能基本上不能使用。下面就让我来说说如何安装Sphinx并将它集成到DiscuzX1.5中。注意:前提是您必须有一个独立的主机或者vps!以下操作均在ubuntuserver9.04中进行的,其它系统操作相差不大。下载安装文件1.wgethttp://www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.13.tar.gz2.tarzxvfcoreseek-3.2.13.tar.gz3.cdcoresee

2、k-3.2.13复制代码这里下载的是coreseek,它由国人基于Sphinx二次开发,更适合中文搜索。里面包含修改后的sphinx(csft)及中文分词程序mmseg安装mmseg安装coreseek开发的mmseg,它为sphinx提供中文分词功能1.cdmmseg-3.2.132../bootstrap3.#ubuntu环境下,需要使用ACLOCAL_FLAGS="-I/usr/share/aclocal"./bootstrap4../configure--prefix=/usr/local/mmseg5.make6.makeinstall复制代码安装完成

3、后,mmseg使用的词典和配置文件,将自动安装到/usr/local/mmseg/etc中其中uni.lib就是分词默认使用的词典如果觉得这个词库词量过小,可到搜狗上下载词库:http://pinyin.sogou.com/dict/list.php很多词库找不到TXT版的下载,可以直接通过地址:http://pinyin.sogou.com/dict/download_txt.php?id=词库id,来下载然后通过下面这种方式生成词典,替换掉默认词典就可以了1./usr/local/mmseg/bin/mmseg-uwords.txt#utf-8编码2.#生成

4、的文件名默认为原文件名加.uni后缀3.cpwords.txt.uni/usr/local/mmseg/etc/uni.lib复制代码安装sphinx1.cdcsft-3.2.132.#执行configure,进行编译配置:3../configure--prefix=/usr/local/sphinx4.--with-mysql=/usr/local/mysql/5.--with-mysql-includes=/usr/local/mysql/include/mysql/6.--with-mysql-libs=/usr/local/mysql/lib/my

5、sql/7.--with-mmseg=/usr/local/mmseg/8.--with-mmseg-includes=/usr/local/mmseg/include/mmseg/9.--with-mmseg-libs=/usr/local/mmseg/lib/10.make11.makeinstall复制代码注意:请修改/usr/local/mysql/为相应的mysql目录配置sphinx1、编写适合discuzx1.5的配置文件1.vim/usr/local/sphinx/etc/csft.cnf复制代码文件内容请从这里下载:http://blog

6、.2332.cn/files/sphinx/csft.conf把其中的数据库信息修改自己mysql服务器信息,同时不要忘了修改相应的表名前缀。2、建立sph_counter,在数据库中执行以下语词1.CREATETABLEIFNOTEXISTS`sph_counter`(2.  `counter_id`int(10)NOTNULL,3.  `max_doc_id`int(10)NOTNULL,4.  PRIMARYKEY(`counter_id`)5.)ENGINE=MyISAMDEFAULTCHARSET=utf8;复制代码运行sphinx1、生成索引文件索引

7、文件是检索的根据,如果数据量大的话,第一次运行速度会比较慢执行以下命令:1./usr/local/sphinx/bin/indexer--config/usr/local/sphinx/etc/csft.conf--all复制代码2、运行sphinx程序1./usr/local/sphinx/bin/searchd--config/usr/local/sphinx/etc/csft.conf复制代码3、加入crontab计划任务这样的目的是每分钟自动更新索引,以保证检索引擎可以获得最新的数据1.vim/etc/crontab复制代码加上以下内容:1.#Incre

8、mentalIndexp

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。