2004年06月02日

第15回 PageRank (ページランク) の通説と事実

前回のコラムの最後に PageRank の高い順に並べるクイズを出しました。まだ、クイズをやっていない方はクイズに挑戦してみて下さい。正解しても何も特典はありませんので、そのまま流してもらってもかまいません。

実際にクイズをやった方は難しかったですか?20 ページの並べ替えですので難しいですよね。今回の内容は上記のクイズページを表示しながら読んでください。

さて、クイズの解答です。行列の計算は大学以来やっていませんし、20 x 20 の行列を手で計算するのは到底無理ですね。今回は、「Google の秘密 - PageRank 徹底解説」のページでも使われている Octave というソフトを使って計算してみました。計算するのになんと 0.38 秒しかかかりません。優秀なソフトですね。

では、実際に計算した結果と順位を下記に示します。

順位ページPageRank
1 位P10.195708
2 位P160.1060073
3 位P120.0995944
4 位P70.089602 …… (A)
5 位P20.0849436
6 位P190.0798088
7 位P80.0517949
8 位P50.0408372
9 位P40.0369434
10 位P140.0365983
11 位P110.0362432
12 位P90.0348039
13 位P180.0261714
14 位P30.0222033
15 位P100.0211943
16 位P150.0207673
17 位P170.0069856
18 位P130.0051017
19 位P60.0029834
20 位P200.0017079

1位 〜 3位は想像できると思います。クイズページの"表形式"の方を見ていただけるとわかりますが、リンクをたくさんもらっているページが PageRank が高くなっていることがわかります。今回注目して欲しいのは 4位の P7 です。P7 は 3 つしかリンクされていません。しかし、たくさんリンクされている P19 より PageRank が高いですよね。これはなぜだと思いますか?P7 は PageRank の高い P1, P2 からのリンク、さらに P16 からのリンクは P1 と P7 の 2 つにしか向けられていませんので P16 からのリンクがとても影響を与えていることがわかります。実際に P7 はどれだけの PageRank を受けているかはそれぞれのページの PageRank をリンク数で割ればよいわけですから下記のようになります。

 P7 の PageRank = (P1 の PageRank) / (P1 の発リンク数)
             + (P2 の PageRank) / (P2 の発リンク数)
             + (P16 の PageRank) / (P16 の発リンク数)

             = 0.195708 / 8
             + 0.0849436 / 7
             + 0.1060073 / 2

             = 0.0244635 …… (B)
             + 0.0121348
             + 0.05300365 …… (C)

             = 0.08960195 …… (D)

(D) は 上記表の (A) と誤差の範囲内であっていることがわかります。内訳を見るとわかるとおり、P1 の PageRank が一番大きいのですが、分配するページが多いため P7 に与える PageRank は (B) となり、P16 が与える (C) よりも小さいことがわかります。このことから、前回書いたコラムのたくさんリンクを張っているところよりも、厳選してリンクを張っているページと相互リンクした方がよいと言うのは正しいことがわかりますね。

その他の順位も発リンク、被リンクをチェックしていくと納得できると思いますので、時間があるときにでもみて下さい。

ちょっと数字が苦手な方にはつらい内容ですよね。もう少しだけ頑張って下さいね。

続いては、掲示板などでよく見かける質問と、良くある間違えについて書いていきたいと思います。

通説PageRank を上げるには外部からのリンクの方がより効果的である。
事実PageRank は計算方法を見てもわかるとおり、"サイト"と言う概念は存在しません。従って、外部リンクでも内部リンクでも、 PageRank に与える影響は同じです。

通説PageRank を上げると検索結果の順位が上がりますか?
事実PageRank を上げれば確実に上位表示に結びつくわけではありません。検索結果が PageRank 順に並ぶなら、有名なサイトしか上位表示できません。例えば、「SEO」と言うキーワードで検索したときに、Su-Jine は Google の SEO 関連情報ページ よりも上位に表示することができません。しかし、PageRank の低い Su-Jine の方が、「SEO」で検索したときに上位に表示されています。PageRank は検索順位を決める 1 つの要因でしかありません。Su-Jine が掲示板などで書いているホームラン (PageRank 4, 5 のページとの相互リンク) を狙うよりも、ヒット (PageRank が 2, 3 のページとの相互リンク) をたくさん狙いましょうというのは、PageRank 目当ての相互リンクよりは、適切なリンクをもらうことの方が上位表示に結びつくためです。

通説外部にリンクを張ると自分のページの PageRank が下がりますか?
事実PageRank は Google にインデックスされている全てのページでの計算となります。どこかにリンクを張る、リンクを切る等の行為が全てのページの PageRank に影響を与えます。と言うことで、外部にリンクを張るという行為は必ず自分の PageRank にも影響を与えるはずです。本当かどうか試してみましょう。今回利用したモデルで、P2 から P19 へリンクを張って PageRank の計算をしてみます。そうすると下記のような計算結果が出てきます。P2 の PageRank はどうなっているか見てみましょう。前回は 0.0849436 だったものが P19 へリンクを張ったことで 0.0837019 となっています。リンクを張ったことで PageRank は下がりました。それだけでなく、全然いじっていないページの PageRank にすら影響を与えています。このように、リンクを張る、外す行為は必ず全てのページに影響を与えるわけです。今回はたまたま下がるパターンを紹介しましたが、リンクを張ったら確実に下がるわけではありませんので、リンクは自分の考えで張ったり、外したりしましょう。

ページPageRank前回の PageRank順位前回の順位
P10.19548850.1957081 位1 位
P160.10790020.10600732 位2 位
P120.09845380.09959443 位3 位
P70.08884890.0896024 位4 位
P190.08825520.07980885 位6 位
P20.08370190.08494366 位5 位
P80.05178040.05179497 位7 位
P40.0396410.03694348 位9 位
P50.03907290.04083729 位8 位
P140.03489880.036598310 位10 位
P90.03465860.034803911 位12 位
P110.03426750.036243212 位11 位
P180.02602860.026171413 位13 位
P100.02087030.021194314 位15 位
P30.02070250.022203315 位14 位
P150.01909280.021194316 位16 位
P170.00725550.006985617 位17 位
P130.00471820.005101718 位18 位
P60.0027720.002983419 位19 位
P200.00159250.001707920 位20 位

PageRank について、疑問に思っていたことが解決しましたか?「PageRank を上げる」ことが必ずしも「上位表示」になるとは限らないと言うことがわかっていただけたのではないでしょうか。Su-Jine 内の掲示板で PageRank を気にしすぎないようにしましょうというのはこういうことです。

最後に、知っている方も多いと思いますが、知らない方向けに。「PageRank という名前は、ウェブページのランク付け機能に由来しているのではなく、Google の共同創設者ラリー ペイジ (Larry Page) の名前に由来します。」

次回は、2004 年 5 月 31 日に切り替わった YST (Yahoo Search Technology) についての情報を書いてみたいと思います。

投稿者 Su-Jine : 2004年06月02日 10:04

第14回 トップページ相互リンクの落とし穴
 Su-Jine の独り言
第16回 YST (Yahoo Search Technology) のキャッシュが古いのは思い込み等の検証結果

トラックバック

このエントリーのトラックバックURL:

コメント コメントしてください




保存しますか?