msgbartop
better late than never
msgbarbottom

Sep 01 coreseek给词库添加新词

为coreseek应用的词库添加新词,步骤是先在词典文件添加新词条,然后用mmseg重新生成词库文件,替换原有词库文件,最后重建索引。

» 阅读全文

Aug 27 BuildExcerpts and UpdateAttributes

今天主要就做了这两件事儿。

原型: function BuildExcerpts ( $docs, $index, $words, $opts=array() )

BuildExcerpts用来产生文档片段,有时候真怀疑到底是我思维有问题,还是coreseek设计的有问题,= =。不过此问题也不必太深究,既然用了,就暂且照着来吧。

» 阅读全文

Aug 26 coreseek索引更新机制

= =,昨晚太晚睡觉,所以日记又没写。结果现在又不太记得昨天做了啥了。

还是先说今天吧。

今天的时间都花在coreseek的索引更新机制上了,原来是每隔一分钟更新增量索引,每天再重建一次索引。sph_counter 中存放区分主索引和增量索引的maxid。现在的方法,依旧是每分钟更新增量索引,但是重建索引改成合并,将增量索引合并到主索引中,并更改 sph_counter中的maxid值,清空增量索引。搜索则都是同时从两个索引中搜索。

» 阅读全文

Aug 24 mysql coreseek crontab….= =

记下昨天跟今天干的活儿~昨天没写日记,都有点儿忘了。想想昨天都干了些啥捏。还是想到哪儿写到哪儿吧。

先说说今天弄coreseek分词以及建立主索引跟增量索引的情况。

上次装coreseek好像没提到安装词库。

今天依旧用的mysql数据源,不过换了个数据库,用了那个日志表,省得自己造记录。

» 阅读全文

Aug 20 coreseek3.1安装

Coreseek 全文检索服务器2.0 是在Sphinx基础上开发的全文检索软件,按照GPLv2协议发行。

上面是手册上的话,说到底,coreseek就是支持中文分词的sphinx吧,= =个人理解。

» 阅读全文