第15回 PageRank (ページランク) の通説と事実
前回のコラムの最後に PageRank の高い順に並べるクイズを出しました。まだ、クイズをやっていない方はクイズに挑戦してみて下さい。正解しても何も特典はありませんので、そのまま流してもらってもかまいません。
実際にクイズをやった方は難しかったですか?20 ページの並べ替えですので難しいですよね。今回の内容は上記のクイズページを表示しながら読んでください。
さて、クイズの解答です。行列の計算は大学以来やっていませんし、20 x 20 の行列を手で計算するのは到底無理ですね。今回は、「Google の秘密 - PageRank 徹底解説」のページでも使われている Octave というソフトを使って計算してみました。計算するのになんと 0.38 秒しかかかりません。優秀なソフトですね。
では、実際に計算した結果と順位を下記に示します。
| 順位 | ページ | PageRank |
|---|---|---|
| 1 位 | P1 | 0.195708 |
| 2 位 | P16 | 0.1060073 |
| 3 位 | P12 | 0.0995944 |
| 4 位 | P7 | 0.089602 …… (A) |
| 5 位 | P2 | 0.0849436 |
| 6 位 | P19 | 0.0798088 |
| 7 位 | P8 | 0.0517949 |
| 8 位 | P5 | 0.0408372 |
| 9 位 | P4 | 0.0369434 |
| 10 位 | P14 | 0.0365983 |
| 11 位 | P11 | 0.0362432 |
| 12 位 | P9 | 0.0348039 |
| 13 位 | P18 | 0.0261714 |
| 14 位 | P3 | 0.0222033 |
| 15 位 | P10 | 0.0211943 |
| 16 位 | P15 | 0.0207673 |
| 17 位 | P17 | 0.0069856 |
| 18 位 | P13 | 0.0051017 |
| 19 位 | P6 | 0.0029834 |
| 20 位 | P20 | 0.0017079 |
1位 〜 3位は想像できると思います。クイズページの"表形式"の方を見ていただけるとわかりますが、リンクをたくさんもらっているページが PageRank が高くなっていることがわかります。今回注目して欲しいのは 4位の P7 です。P7 は 3 つしかリンクされていません。しかし、たくさんリンクされている P19 より PageRank が高いですよね。これはなぜだと思いますか?P7 は PageRank の高い P1, P2 からのリンク、さらに P16 からのリンクは P1 と P7 の 2 つにしか向けられていませんので P16 からのリンクがとても影響を与えていることがわかります。実際に P7 はどれだけの PageRank を受けているかはそれぞれのページの PageRank をリンク数で割ればよいわけですから下記のようになります。
P7 の PageRank = (P1 の PageRank) / (P1 の発リンク数)
+ (P2 の PageRank) / (P2 の発リンク数)
+ (P16 の PageRank) / (P16 の発リンク数)
= 0.195708 / 8
+ 0.0849436 / 7
+ 0.1060073 / 2
= 0.0244635 …… (B)
+ 0.0121348
+ 0.05300365 …… (C)
= 0.08960195 …… (D)
(D) は 上記表の (A) と誤差の範囲内であっていることがわかります。内訳を見るとわかるとおり、P1 の PageRank が一番大きいのですが、分配するページが多いため P7 に与える PageRank は (B) となり、P16 が与える (C) よりも小さいことがわかります。このことから、前回書いたコラムのたくさんリンクを張っているところよりも、厳選してリンクを張っているページと相互リンクした方がよいと言うのは正しいことがわかりますね。
その他の順位も発リンク、被リンクをチェックしていくと納得できると思いますので、時間があるときにでもみて下さい。
ちょっと数字が苦手な方にはつらい内容ですよね。もう少しだけ頑張って下さいね。
続いては、掲示板などでよく見かける質問と、良くある間違えについて書いていきたいと思います。
| 通説 | : | PageRank を上げるには外部からのリンクの方がより効果的である。 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 事実 | : | PageRank は計算方法を見てもわかるとおり、"サイト"と言う概念は存在しません。従って、外部リンクでも内部リンクでも、 PageRank に与える影響は同じです。 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 通説 | : | PageRank を上げると検索結果の順位が上がりますか? | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 事実 | : | PageRank を上げれば確実に上位表示に結びつくわけではありません。検索結果が PageRank 順に並ぶなら、有名なサイトしか上位表示できません。例えば、「SEO」と言うキーワードで検索したときに、Su-Jine は Google の SEO 関連情報ページ よりも上位に表示することができません。しかし、PageRank の低い Su-Jine の方が、「SEO」で検索したときに上位に表示されています。PageRank は検索順位を決める 1 つの要因でしかありません。Su-Jine が掲示板などで書いているホームラン (PageRank 4, 5 のページとの相互リンク) を狙うよりも、ヒット (PageRank が 2, 3 のページとの相互リンク) をたくさん狙いましょうというのは、PageRank 目当ての相互リンクよりは、適切なリンクをもらうことの方が上位表示に結びつくためです。 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 通説 | : | 外部にリンクを張ると自分のページの PageRank が下がりますか? | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| 事実 | : | PageRank は Google にインデックスされている全てのページでの計算となります。どこかにリンクを張る、リンクを切る等の行為が全てのページの PageRank に影響を与えます。と言うことで、外部にリンクを張るという行為は必ず自分の PageRank にも影響を与えるはずです。本当かどうか試してみましょう。今回利用したモデルで、P2 から P19 へリンクを張って PageRank の計算をしてみます。そうすると下記のような計算結果が出てきます。P2 の PageRank はどうなっているか見てみましょう。前回は 0.0849436 だったものが P19 へリンクを張ったことで 0.0837019 となっています。リンクを張ったことで PageRank は下がりました。それだけでなく、全然いじっていないページの PageRank にすら影響を与えています。このように、リンクを張る、外す行為は必ず全てのページに影響を与えるわけです。今回はたまたま下がるパターンを紹介しましたが、リンクを張ったら確実に下がるわけではありませんので、リンクは自分の考えで張ったり、外したりしましょう。 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
PageRank について、疑問に思っていたことが解決しましたか?「PageRank を上げる」ことが必ずしも「上位表示」になるとは限らないと言うことがわかっていただけたのではないでしょうか。Su-Jine 内の掲示板で PageRank を気にしすぎないようにしましょうというのはこういうことです。
最後に、知っている方も多いと思いますが、知らない方向けに。「PageRank という名前は、ウェブページのランク付け機能に由来しているのではなく、Google の共同創設者ラリー ペイジ (Larry Page) の名前に由来します。」
次回は、2004 年 5 月 31 日に切り替わった YST (Yahoo Search Technology) についての情報を書いてみたいと思います。
投稿者 Su-Jine : 2004年06月02日 10:04
↑第14回 トップページ相互リンクの落とし穴
Su-Jine の独り言
↓第16回 YST (Yahoo Search Technology) のキャッシュが古いのは思い込み等の検証結果
このエントリーのトラックバックURL: