2004年04月01日

第11回 Google のフレッシュクロール対象サイトにするには、Googleツールバーが影響している?

前回のコラムの続きです。前回はフレッシュクロールサイトにするには頻繁に更新しましょうと言うことを書きました。しかし、頻繁に更新してもそれをクローラに伝える何かが必要だということで終了したと思います。そのクローラに頻繁に更新していると言う情報を与えるのは何かを今回のコラムで書いていきたいと思います。今回もちょっと難しいかもしれませんが、頑張りましょう。

結論から書くと、頻繁に更新しているという情報を伝えるものは「Google ツールバー」ではないかと私は考えています。Google ツールバーをインストールされた方であれば、インストールしたときに下記のようなメッセージを見ているはずです。

Google ツールバーの拡張機能を使用することにより、アクセスするサイトに関する情報を Google に送ることになります (Google ツールバーのいくつかの機能を利用するのに必要なため)。

サイトに関するより詳細な情報を表示するためには、ユーザーがどのサイトを訪問しているかという情報 (URL) が Google に送信される必要があります。

この際、ユーザーを識別する情報 (ユーザー名や電子メールアドレスなど) は送信されませんが、あるユーザーが特定のサイトに関する PageRank をリクエストしたという情報が送信されます。 Google では、第三者に対するユーザーの個人識別情報の販売または提供などは行いません。ツールバーのプライバシーポリシーに関する詳細については、下記のページにあるツールバーのプライバシーポリシーをごらんください。

http://toolbar.google.com/intl/ja/privacy.html

Google が「どのサイトを訪問しているかという情報 (URL) が Google に送信される」と明言しているわけです。では実際にSu-Jineのページを見たときにどのような情報がGoogleツールバー経由で送られているかを見てみます。10 回アクセスし、Google ツールバーが送っている情報をキャプチャしました。

回数アクションGoogleツールバーのリクエスト
1 回目なし/search?client=navclient-auto
&ch=63064708400
&freshness_check=4OuD5p4m5_Wc3q1ziiBAP
&ie=UTF-8
&oe=UTF-8
&features=Rank
&q=info:http%3A%2F%2Fwww%2Esu%2Djine%2Ecom%2F
2 回目なし/search?client=navclient-auto
&ch=63064708400
&freshness_check=4OuD5p4m5_Wc3q1ziiBAP
&ie=UTF-8
&oe=UTF-8
&features=Rank
&q=info:http%3A%2F%2Fwww%2Esu%2Djine%2Ecom%2F
3 回目キャッシュ削除/search?client=navclient-auto
&ch=63064708400
&ie=UTF-8
&oe=UTF-8
&features=Rank
&q=info:http%3A%2F%2Fwww%2Esu%2Djine%2Ecom%2F
4 回目なし/search?client=navclient-auto
&ch=63064708400
&freshness_check=4OuD5p4m5_Wc3q1ziiBAP
&ie=UTF-8
&oe=UTF-8
&features=Rank
&q=info:http%3A%2F%2Fwww%2Esu%2Djine%2Ecom%2F
5 回目Cookie削除/search?client=navclient-auto
&ch=63064708400
&freshness_check=4OuD5p4m5_Wc3q1ziiBAP
&ie=UTF-8&oe=UTF-8
&features=Rank
&q=info:http%3A%2F%2Fwww%2Esu%2Djine%2Ecom%2F
6 回目なし/search?client=navclient-auto
&ch=63064708400
&freshness_check=4OuD5p4m5_Wc3q1ziiBAP
&ie=UTF-8
&oe=UTF-8
&features=Rank
&q=info:http%3A%2F%2Fwww%2Esu%2Djine%2Ecom%2F
7 回目キャッシュ削除/search?client=navclient-auto
&ch=63064708400
&ie=UTF-8
&oe=UTF-8
&features=Rank
&q=info:http%3A%2F%2Fwww%2Esu%2Djine%2Ecom%2F
8 回目なし/search?client=navclient-auto
&ch=63064708400
&freshness_check=4OuD5p4m5_Wc3q1ziiBAP
&ie=UTF-8
&oe=UTF-8
&features=Rank
&q=info:http%3A%2F%2Fwww%2Esu%2Djine%2Ecom%2F
9 回目なし/search?client=navclient-auto
&ch=63064708400
&freshness_check=4OuD5p4m5_Wc3q1ziiBAP
&ie=UTF-8
&oe=UTF-8
&features=Rank
&q=info:http%3A%2F%2Fwww%2Esu%2Djine%2Ecom%2F
10 回目なし/search?client=navclient-auto
&ch=63064708400
&freshness_check=4OuD5p4m5_Wc3q1ziiBAP
&ie=UTF-8
&oe=UTF-8
&features=Rank
&q=info:http%3A%2F%2Fwww%2Esu%2Djine%2Ecom%2F

なんだかよくわからないですね。ちょっと整理すると、下記のような構成になっているのがわかります。

 /search?
 client=navclient-auto
 &ch=63064708400
 &freshness_check=4OuD5p4m5_Wc3q1ziiBAP
 &ie=UTF-8
 &oe=UTF-8
 &features=Rank
 &q=info:http%3A%2F%2Fwww%2Esu%2Djine%2Ecom%2F

このURLを見慣れていない方もいると思いますので、見方を説明します。「実行?キー1=値1&キー2=値2&…」と言う形式になっています。

喫茶店でコーヒーを注文するときを例にとってみましょう。

 オーダー?
 品名=コーヒー
 &砂糖=YES
 &ミルク=NO

この例では、「コーヒーを砂糖入り、ミルクなしで注文」ということになります。先ほどの URL では「client は navclient-auto で ch は 63064708400 …として検索」ということです。説明が下手ですみません。

上記の表の中で、client=navclient-auto, ch=63064708400, ie=UTF-8, oe=UTF-8, features=Rank, q=info:http%3A%2F%2Fwww%2Esu%2Djine%2Ecom%2Fは、10 回とも同じでしたので除外します。残った値と、作業を表にまとめると下記のようになります。

回数作業freshness_check
1 回目なし4OuD5p4m5_Wc3q1ziiBAP
2 回目 なし4OuD5p4m5_Wc3q1ziiBAP
3 回目 キャッシュ削除なし
4 回目なし4OuD5p4m5_Wc3q1ziiBAP
5 回目Cookie削除4OuD5p4m5_Wc3q1ziiBAP
6 回目 なし4OuD5p4m5_Wc3q1ziiBAP
7 回目 キャッシュ削除なし
8 回目 なし4OuD5p4m5_Wc3q1ziiBAP
9 回目 なし4OuD5p4m5_Wc3q1ziiBAP
10 回目なし4OuD5p4m5_Wc3q1ziiBAP

残った freshness_check と言うキー。名前からして怪しいですね。この「4OuD5p4m5_Wc3q1ziiBAP」という値は http://www.su-jine.com/ という URL を何らかの方法で変形させたものだと思います。従って、皆さんのサイトは上記と違うキーになるはずです。

興味深いのは「キャッシュを削除」したときに「freshness_check」が Google に送られないと言うことです。と言うことは「同一人物が 2 回以上見るページ = 面白そうなページ」と Google は見ていると言うことがわかります。

この「面白そうなページ」から「重要そうなページ」にするために、Google は freshness_check が何回送られてきているかをカウントしていると思います。そして、カウントがある閾値 (判断基準値) を超えると「重要度の可能性が高いページ」になり、クローラがアクセスしてきたときに 200 OK を返すと「重要であるページ = フレッシュクロール対象サイト」になると考えています。

フレッシュクロール対象ではないサイト (以下Aとする) がフレッシュクロール対象サイトになるまでの流れをまとめると、

レベル1 : 誰かが毎日 2回以上 Aを見る (freshness_checkが送られる)
→面白そうなページ
レベル2 : たくさんの人が毎日 2回 以上 Aを見る (freshness_checkカウント)
→重要そうなページ
レベル3 : カウントが Google が設定した閾値を超える
→重要度の可能性が高いページ (クローラに巡回命令)
レベル4 : クローラが巡回し、サーバが 200 OK を返す
→重要であるページ (フレッシュクロール対象サイト)

と言う感じだと思います。Su-Jine が考えるフレッシュクロールサイトの条件は、『頻繁に更新し、Google ツールバーの拡張機能を ON にしたブラウザで毎日たくさんのアクセスがあるサイト』と言うことです。フレッシュクロールサイトになると SEO 対策がとても楽になります。というのは、毎日更新結果が反映されるため、変更した結果をすぐに確認できるためです。

次回のコラムの予定です。最近「SEO対策ディレクトリ型検索エンジン○○」や「SEO 対策サーチエンジン○○」のように Su-Jine と全く同じ名前、よく似た名前の検索エンジンを見かけるようになりました。それだけ Su-Jine も認められてきたかなぁとうれしいような、悲しいような複雑な気持ちです。

これらの検索エンジンはたいてい Yomi-Search というスクリプトを利用していますが、Su-Jine の SEO 対策は、独自のスクリプトで成り立っています。私の考えでは、Yomi-Search では本当の意味で SEO 対策にはならないと思ったからです。しかし、このような検索エンジンが増えてきているのには、やはり訳があるのでは?と思ったので、次回は『Yomi-Search は本当に SEO 対策になるの?』を検証してみたいと思います。お楽しみに。

投稿者 Su-Jine : 2004年04月01日 08:06

第10回 Google のフレッシュクロール対象サイトにするには?
 Su-Jine の独り言
第12回 Yomi-Search は本当に SEO 対策になるの?

トラックバック

このエントリーのトラックバックURL:

このリストは、次のエントリーを参照しています: 第11回 Google のフレッシュクロール対象サイトにするには、Googleツールバーが影響している?:

» YST, msn, Google の URL 申請ページは機能しているのか (2) from Su-Jine の独り言
以前、YST への申請ページは機能しているのか (1) と言う記事を書いたのだが、すっかりその後の検証を忘れていた。そこで、今回は検証ページを用意した。検... [続きを読む]

トラックバック時刻: 2006年03月08日 00:45

コメント コメントしてください




保存しますか?