2006年11月16日
SennaとHyper EstraierとPlaggerと、あとはいろいろマッシュアップで、ちょっと趣味プロジェクトのブログサーチを作るぞ計画。

Rule::Deduped の拡張 engineでMySQLを扱えるように
Plagger::Rule::Deduped::MySQL
Plagger::Rule::Deduped::DBI
みたいなのを作る
Rule::Dedupedは、compare_bodyオプションにてMD5 hashによるチェックを行う。
Rule::Fresh にて新着かどうかを判断
ブログの本文を取得するのにEFTやFilter::RetrieveEntry 以外の方法が無いのか検討中。
今のところ、EFTが一番なのかなぁ。
Filter::RetrieveEntry をベースに、ルールにマッチしない場合は置き換えないような形も検討。
ちょっと精度を上げる必要あり。というか、自分のBlogがうまく取得できないのを、テンプレートを変更することで逃げずに、何とかしたい。
feedに載ってこない過去のエントリや、過去のエントリが更新された場合にそれをどうキャッチアップできるは要検討。
Search関連のプラグインをチェック
そろそろベースの設計をまとめよう。
SennaバインディングのMySQLだから、MySQLクラスターは使えない。
複数ページにわたる検索結果の取得をする場合、ひとつのDBからデーターを取り出すならoffsetを簡単に処理できるが、複数の場合はそうはいかない。
DBごとのoffsetを検索クエリーに持たせれば大丈夫か。
とりあえず、初期開発版は、マスタを複数DBに分けることは考えずに開発することにしましょう。
でもクローラー用DBとストレージ用DBは分けておこう。
投稿者 田中@グリニッジ : 2006年11月16日 19:46
トラックバック
このエントリーのトラックバックURL:
http://blog.tanaka-cs.com/mt/mt-tb.cgi/113
