为coreseek应用的词库添加新词,步骤是先在词典文件添加新词条,然后用mmseg重新生成词库文件,替换原有词库文件,最后重建索引。
» 阅读全文
今天主要就做了这两件事儿。
原型: function BuildExcerpts ( $docs, $index, $words, $opts=array() )
BuildExcerpts用来产生文档片段,有时候真怀疑到底是我思维有问题,还是coreseek设计的有问题,= =。不过此问题也不必太深究,既然用了,就暂且照着来吧。
» 阅读全文
= =,昨晚太晚睡觉,所以日记又没写。结果现在又不太记得昨天做了啥了。
还是先说今天吧。
今天的时间都花在coreseek的索引更新机制上了,原来是每隔一分钟更新增量索引,每天再重建一次索引。sph_counter 中存放区分主索引和增量索引的maxid。现在的方法,依旧是每分钟更新增量索引,但是重建索引改成合并,将增量索引合并到主索引中,并更改 sph_counter中的maxid值,清空增量索引。搜索则都是同时从两个索引中搜索。
» 阅读全文
记下昨天跟今天干的活儿~昨天没写日记,都有点儿忘了。想想昨天都干了些啥捏。还是想到哪儿写到哪儿吧。
先说说今天弄coreseek分词以及建立主索引跟增量索引的情况。
上次装coreseek好像没提到安装词库。
今天依旧用的mysql数据源,不过换了个数据库,用了那个日志表,省得自己造记录。
» 阅读全文
Coreseek 全文检索服务器2.0 是在Sphinx基础上开发的全文检索软件,按照GPLv2协议发行。
上面是手册上的话,说到底,coreseek就是支持中文分词的sphinx吧,= =个人理解。
» 阅读全文