TrustRank って?
概要は WebスパムとTrustRank を見るとわかりやすい。で、気になった箇所があったので原文を読もうと思ったわけだが、量が多すぎてちょっと挫折気味 (まだ 2 ページ目の少し)。少しずつ読んでいこう。
ということで全く知りたいところまでたどり着いていないので、見当違いのことを書くかもしれないし、間違っているかもしれない。ここから下は想像によるものなので、参照して記事を書いたりしないで欲しい。
下記のような場合について考える。
A → C → E
↓
F
↑
B → D → G
A は良い Web ページ、B はスパムページと人間が判断したとする。初期ポイントとして A には +100、B には -100 を与えた。良い Web ページから受けるリンクは、そのページのポイントから 20 ポイント引いた値を加える。そうすると C は +80。逆にスパムページは 20 ポイントを加えた値とする。D は -80。順にやっていくと、E は 60、F は 0 (+60 - 60)、G は -60 となる。ポイント順に並べると
・A (+100) → C (+80) → E (+60) → F (0) → G (-60) → D (-80) → B (-100)
この場合はスパムサイトをわざと作成すれば、相手を陥れることが容易となる。例えば B から C にリンクを貼ると順位は下記のような感じだ。
・A (+100) → C (0) → E (-20) → G (-60) → D (-80) → B (-100) or F (-100)
当然順位が変わってくる。このようにスパムサイトからのリンクを減点する方式だと相手のサイトもコントロールできることになるわけで、このようなモデルではなさそうだ (このようなモデルであるべきではない)。
では、加点方式のみとしているのだろうか?要するに B に与える初期値は 0 ポイントで、そこから派生するリンクも全て 0 ポイントをマイナスするというもの。そうすると順位は下記のようになる。
・A (+100) → C (+80) → E (+60) or F (+60) → B (0) or D (0) or G (0)
このモデルの場合は B から C にリンクを貼ったところで減点は無しだ。順位はそのままとなる。これで納得できるかなと思ったが、この場合は PageRank と同じような考えとなる。
『Google は単に票数、つまりリンク数を見るだけではなく、票を投じたページについても分析します。「重要度」の高いページによって投じられた票はより高く評価されて、それを受け取ったページを「重要なもの」にしていくのです。 』
「人間が手動で与えたポイントから派生しているページのみを減点対象とする (上記の例だと B から派生しているリンクのみ減点)」ということも考えてみたが、この場合はスケールしない。Web ページはどんどん変わっていくためだ。
こんな感じで、TrustRank のすばらしさがあまり理解できない。まぁ、実際の論文を全て読んだときにわかるのかもしれないが…。わかりやすく解説してくれるコメントをもらえるとうれしいなぁ。
投稿者 Su-Jine : 2005年06月01日 23:06
↑ゴッゴルミニ イメージ検索
Su-Jine の独り言
↓来週以降の Google
このエントリーのトラックバックURL: