« フォーム認証のデザインパターン | トップ | ブログサーチ顛末記2 サーバー構成 »

2007年04月04日

ブログサーチ顛末記 そもそものきっかけ  このエントリをはてなブックマークに登録 

昨年末より、ブログ検索のサイトを作ろうとしておりまして、技術的なことであれこれ格闘しておりました。行き詰っては調べて試行錯誤して、また調べて試行錯誤してを繰り返していたのですが、当初の想定していた性能を出せるくらいに作り上げることが出来ました。

あとはデザインを入れれば公開できるのですが、もともと技術面でのノウハウの習得がメインの目的だったこともあって、サービスを公開するという事自体はどうでも良くなっちゃった気もしていて、そんなことを考えているなか、知り合いから
「ブログ検索なんてたくさんあるじゃないですか」
なんて突っ込まれると、確かにいまさらブログ検索もなぁと思って、ちょっとモチベーションが低下中。

まぁ、いろいろなノウハウを習得できたこと、そして、それらを本業のほうにも生かせるであろう事から、良かったのではないかなと思うことにして。ちょうど本業のほうでの開発も調子が出てきたので、しばらくはそちらに注力することにして、このまま寝かせておいてまた考えます。

せっかくなので、ここ数ヶ月で学んだ事なんかを何回かに分けて書き残しておこうと思います。


そもそもは、blog検索エンジン「NAMAAN」の中身というブログエントリーをたまたま目にしたのがきっかけでした。

NAMAANでは、クローラーやインデックスサーバーなど、計12台のサーバーで構成されているとのこと。
もうちょっと少ないサーバー数で同等の性能を出そう、というのが目標です。
(論文が書かれた時点での話なので、現在のサーバー台数は知りません)

そんなわけで、とりあえず古いPCにCentOSをインストールし、基礎開発を行ってみたのが昨年末。その後、NAMAANの論文に書かれているサーバーと同等スペックのDELL SC430という格安サーバーを5台購入して本格的な試行錯誤がスタートしたわけでした。

サーバーが届いたのがちょうど今年の年明けぐらいだったと記憶しています。

ウノウラボにもこのDELLのサーバーを使っている写真が載っていたので、真似して、スチールラックにのっけてみたりなんかしちゃってます。

ちなみに現在、このDELLのサーバーは事務所に鎮座しております。非常に静かなサーバーで、騒音に悩まされることはありませんが、CPUがPentium Dプロセッサなので、結構発熱があり、また、UPSからもそこそこ発熱するので、結構ヒンシュクをかっています。

オフィスに置くには、Core2Duoサーバーがいいですね。

NAMAANとの性能比較は、同じキーワードを入れて検索をして、何件ヒットするか、最新エントリーの日時はどちらが新しいか、などを見比べて、この倍の性能を出さなきゃ、とかやっていたわけです。
NAMAANも「あなたのブログを最短1分で結果に反映」というのが売りのブログサーチですから、少ないサーバー数で対抗しようとするのは、なかなか手ごわかったです。

投稿者 田中@グリニッジ : 2007年04月04日 00:54

トラックバック

このエントリーのトラックバックURL:
http://blog.tanaka-cs.com/mt/mt-tb.cgi/124

コメント

コメントしてください




保存しますか?


楽天トラベル 夏の旅行