2006年12月10日
[Senna]はまりどころ

Plaggerによるクローラーが集めてくるデーターがそろってきたので、検索部分を作ってみた。
で、はまったところ。
単語ひとつでの検索は問題がないのだが、複数語でのAND検索がどうもおかしい。
うまく検索が出来ていないようなので、検索のクエリーをいろいろ変えてみたりしたけれど解決せず。
Sennaのインストール用ドキュメントを改めて読んでみると以下のような記述が。
UTF-8やShift-JISでのインデックス作成を行う場合には、 > sudo mkdir /var/senna > sudo vi /var/senna/senna.conf DEFAULT_ENCODING utf8等、 文字コードを記述する(EUCの場合は不要。値はeuc, sjis, utf8のいずれか)
修正を行うと、AND検索もうまくできるようになった模様。
この部分の設定を行わなくても、普通に動作テストとかが通ってしまっていたゆえに、原因を見つけ出すのが少々困難で、はまってしまった。
投稿者 田中@グリニッジ : 2006年12月10日 21:59
トラックバック
このエントリーのトラックバックURL:
http://blog.tanaka-cs.com/mt/mt-tb.cgi/117
