资源描述:
《sphinx技术文档介绍--》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、Sphinx技术1,Sphinx介绍Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应川程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL也设计了一个存储引擎插件。Sphinx单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级)。Sphinx创建索引的速度为:创建100万条记录的索引只需3〜4分
2、钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增fi索引,重建一次只需儿十秒。Sphinx的主要特性包括:高速索引(在新款CPU上,近10MB/秒);高速搜索(2-4G的文本量屮平均查询速度不到0.1秒);高可用性(单CPU上最大可支持100GB的文本,100M文档);提供良好的相关性排名支持分布式搜索;提供文档摘要生成;提供从MySQL内部的插件式存储引笨上搜索支持布尔,短语,和近义词查询;支持每个文档多个全文检索域(默认最大32个);支持每个文档多属性;支持断词;支持单
3、字节编码与UTF-8编码2,sphinx基本安装以在windows上安装为例,使用sphinx版本为2.2.8Win32版本,niysqlserver5.1.1,下载sphinx并解££到C:sphinx下,并把C:sphinxbinliblibmysql.dl1拷W到mysql的bin目录下;2,在C:sphinxK新建一个data目录用來存放索引文件,一个log目录方日志文件,复制C:sphinxsphinx.conf,in到C:sphinxbinsphinx.conf(注意修
4、改文件名);3,修改C:sphinxbinsphinx.conf,这里列出需要修改的儿个:type=mysql#数据源,我这里是mysqlsql_host=localhost#数据库服务器sql.user=root#数据库用户名sql_pass=123456#数据库密码sql_db=test#数据库sql_port=3306#数据库端口sqlquery_pre=SETNAMESutf8indextest1
5、n放索引的目录path=C:/sphinx/data/林编码charset_type=utf-
6、8林指定utf-8的编码表charset_table=0..9,A..Z->a..z,,a..z,U+410..U+42F->U+430..U+44F,U+430..U+44F#简单分同,只支持0和1,如果要搜索中文,清指定为1ngram_len=1#需要分词的字符,如果要搜索中文,去掉前面的注释ngramchars=U+3000..U+2EA1F#indextest1stemmed:test1#{#path=@CONFD1R@/data/testlstenuned#}#如果没有分布式索引,注释掉下面的内
7、容#indexdistl#{#’distributed’indextypeMUSTbespecified#type=distributed#localindextobesearched#therecanbemanylocalindexesconfigured#local=test1#local=testlstemmed林remoteagent#multipleremoteagentsmaybespecified#syntaxis,hostname:port:indexl,[index2[,…]]#agen
8、t=localhost:3313:remotel#agent=localhost:3314:remote2,remote3#remoteagentconnectiontimeout,milliseconds#optional,defaultis1000ms,ie.1sec#agentconnecttimeout=1000林remoteagentquerytimeout,milliseconds#optional,defaultis3000ms,ie.3sec#agentquerytimeout=3000#
9、}#搜索服务需要修改的部分searchdI#日志log=C:/sphinx/1og/searchd.log#PIDfile,searchdprocessIDfilenamepidfile=C:/sphinx/log/searchd.pid#windows下启动searchd服务“定要注释掉这个#seamlessrotate=1}4,导入测试数据使川管理员权限打开命令行窗口,使川mysq]-uroot-pi23456test