« ContOS4.3にPlaggerをインストール その3 | トップ | [Plagger] とりあえず、DBに保存するところは出来た »

2006年11月16日

SennaとHyper EstraierとPlaggerと、あとはいろいろマッシュアップで、ちょっと趣味プロジェクトのブログサーチを作るぞ計画。  このエントリをはてなブックマークに登録 

Rule::Deduped の拡張 engineでMySQLを扱えるように

Plagger::Rule::Deduped::MySQL
Plagger::Rule::Deduped::DBI

みたいなのを作る
Rule::Dedupedは、compare_bodyオプションにてMD5 hashによるチェックを行う。


Rule::Fresh にて新着かどうかを判断

ブログの本文を取得するのにEFTやFilter::RetrieveEntry 以外の方法が無いのか検討中。
今のところ、EFTが一番なのかなぁ。
Filter::RetrieveEntry をベースに、ルールにマッチしない場合は置き換えないような形も検討。
ちょっと精度を上げる必要あり。というか、自分のBlogがうまく取得できないのを、テンプレートを変更することで逃げずに、何とかしたい。

feedに載ってこない過去のエントリや、過去のエントリが更新された場合にそれをどうキャッチアップできるは要検討。

Search関連のプラグインをチェック


そろそろベースの設計をまとめよう。

SennaバインディングのMySQLだから、MySQLクラスターは使えない。

複数ページにわたる検索結果の取得をする場合、ひとつのDBからデーターを取り出すならoffsetを簡単に処理できるが、複数の場合はそうはいかない。
DBごとのoffsetを検索クエリーに持たせれば大丈夫か。

とりあえず、初期開発版は、マスタを複数DBに分けることは考えずに開発することにしましょう。

でもクローラー用DBとストレージ用DBは分けておこう。

投稿者 田中@グリニッジ : 2006年11月16日 19:46

トラックバック

このエントリーのトラックバックURL:
http://blog.tanaka-cs.com/mt/mt-tb.cgi/113

コメント

コメントしてください




保存しますか?


楽天トラベル 夏の旅行