« [Plagger]クローラー部一応完成 | トップ | mixiで月収93万円の不労所得を得た男 »

2006年12月10日

[Senna]はまりどころ  このエントリをはてなブックマークに登録 

Plaggerによるクローラーが集めてくるデーターがそろってきたので、検索部分を作ってみた。
で、はまったところ。

単語ひとつでの検索は問題がないのだが、複数語でのAND検索がどうもおかしい。
うまく検索が出来ていないようなので、検索のクエリーをいろいろ変えてみたりしたけれど解決せず。

Sennaのインストール用ドキュメントを改めて読んでみると以下のような記述が。

UTF-8やShift-JISでのインデックス作成を行う場合には、
> sudo mkdir /var/senna
> sudo vi /var/senna/senna.conf
DEFAULT_ENCODING utf8等、
文字コードを記述する(EUCの場合は不要。値はeuc, sjis, utf8のいずれか)

修正を行うと、AND検索もうまくできるようになった模様。

この部分の設定を行わなくても、普通に動作テストとかが通ってしまっていたゆえに、原因を見つけ出すのが少々困難で、はまってしまった。

投稿者 田中@グリニッジ : 2006年12月10日 21:59

トラックバック

このエントリーのトラックバックURL:
http://blog.tanaka-cs.com/mt/mt-tb.cgi/117

コメント

コメントしてください




保存しますか?


楽天トラベル 夏の旅行