Googleページランクチェックツールの更新
今まで、Googleページランクチェックツールを提供していたが、こちらは ch 値を知らなければチェックできなかった。そこで ch 値を自動で取得してチェックできるバージョンを用意。下記の URL から利用できる.
「Googleページランクチェックツール(自動でch値を取得)」
こちらは URL だけを入力すればサーバ毎に PageRank をチェックできる.2, 3 日前から更新が始まり、かなりのサーバで更新済みのようだ。
投稿者 Su-Jine : 16:51 | コメント (0) | トラックバック | SEO
2006年12月07日googleoff/googleon タグは Google には無効
フォーラムで Adobe や asahi.com のページに、<!--googleoff: index--> <!--googleon: index-->と言うタグがあり、これは SEO に有効なのかという書き込みがあった。
googleoff や googleon で調べると、それらしきページを見つけることが出来る。ただし、Google 内にはこのタグについて説明はない。
上記ページを見ると、メニューやフッタ等の共通部分を Google のインデックスから排除するような内容になっている。たぶんこの記述を見ていろいろなブログで「<!--googleoff: index-->ここは検索されない<!--googleon: index-->と使います」のような書き込みがある。しかし、実際の Google では「ここは検索されない」も検索されてしまう。
これは「Google Search Appliance」用のタグであり、通常の Google 用のタグではないだろう。なので、これを SEO に使ったり、一般公開している Web サイトに使うのは意味がない。Adobe や asahi.com は社内で
Google Search Appliance を使っているため、このタグがあるのだろう。
現在ポイ探でデータベースの全文検索を導入しようと思っているが、お金があるなら Google Search Appliance と言う選択しもあるのかと思った。ただ、そんなにお金はかけられないため、MySQL の全文検索を使おうと思う。通常 LIKE で検索すると何十万レコードもあった場合はレスポンスが悪くなるが、MySQL の FULLTEXT インデックスを使うと解決できそう。
ただし、ちょっと面倒な処理を入れる必要があるようだ。実際に導入するときの手順などはまた機会を見て書こうと思う。
投稿者 Su-Jine : 20:58 | コメント (0) | トラックバック | SEO
2006年10月14日MSRBOT (http://research.microsoft.com/research/sv/msrbot/) とは?
最近 MSRBOT (http://research.microsoft.com/research/sv/msrbot/) と言うクローラによるアクセスがある。特に何の目的でクロールしているのかが書かれていない。
ログを調べてみたところ、9 月 28 日頃からアクセスがあるようだ。そのころは MSRBOT となっていたが、10 月 12 日頃から MSRBOT (http://research.microsoft.com/research/sv/msrbot/) と URL が付いている。Microsoft が Vista 発売を前に何か動いているのだろうか?
投稿者 Su-Jine : 12:11 | コメント (0) | トラックバック | SEO
2006年09月25日最近のクローラは…
先日、Baiduspider に関する記事を書いたが、最近他にもよくわからないクローラが回ってくる。
User Agent が「Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.0.3705; .NET CLR 1.1.4322)」という一見クローラには見えないアクセスもある。このクローラの IP アドレスは 208.66.195.X と 208.66.194.X のアドレスだ。ブラウザのふりをしているが明らかにクローラの動きをしている。
また、User Agent にタグを書いているクローラもあらわれた。アクセス解析のページに認証を設けていないサイトが多く、このようなアクセス解析ページから大量にリンクをもらうと言った手法だろうか。
BecomeBot もそうだが、REFERRER を残していくので、クローラなのか人間のアクセスなのかなかなか判断がしにくい。
robots.txt でクローラをはじく方法もあるが、どうも robots.txt は限界に来ているような気がする。hosts ファイルのイメージだろうか。hosts ファイルでドメインの管理は限界に来て DNS に移行された。robots.txt もいちいち全サイトに導入するのは大変なので、robots.txt を一元管理できる仕組みが欲しいところだ。
投稿者 Su-Jine : 15:26 | コメント (0) | トラックバック | SEO
2006年08月01日goo ブログ除外検索
goo がブログを除外して検索できるオプションを付けた。どこでブログと判断しているのかわからないが、RSS を配信している「ポイ探」はブログとして扱われているようだ。Su-Jine 本体は RSS を配信していないが、こちらもブログとして扱われている。RSS だけ見ているのであれば CNET 等も排除されそうな気がするが、こちらは排除されていない。
ブログフィルタの説明文には、完全にブログを検索結果から消すことはできないと書いてあるが、ブログではないサイトがフィルタに引っかかると言うことについては書かれていない。goo に連絡してみようか。
<ブログを含まない(ブログフィルター)>
検索するキーワードによっては、ウェブ検索結果に多数のブログが含まれる場合があります。そのような場合で、検索結果をブログ以外のサイトのみに絞りたい際にこの機能を利用してください。『ブログフィルター』の左のチェックボックスをチェックした状態で、『以上の条件で検索』をクリックすると、ブログサイトが省かれたウェブ検索結果が表示されます。なお、検索結果右側に表示される「ブログ検索」については、そのまま表示されます。 ※本機能はブログを完全に省くものではなく、主なブログサイトをフィルタリング(減らす)するための機能です。
日々機能改良を行っておりますが、検索キーワードによってはブログが省かれない場合もございますので、あらかじめご了承ください。
投稿者 Su-Jine : 11:11 | コメント (0) | トラックバック | SEO
2006年07月28日Google の類義語処理
Google の類義語処理が追加された時期というのはいつからでしょうか (意外と昔から追加されていたものかも)?
Google で 2 つ以上のキーワードを入れた場合に限り、類義語でも検索をするようになっている事に最近になってから気がついた (フォーラムでも類義語については書かれている)。
例えば、「転職」で検索すると「転職」を含む検索結果が表示される。しかし、「アルバイト 転職」と検索すると、類義語も検索対象となっているようだ。「アルバイト 転職」の場合は、「求人」「バイト」なども検索結果が太字となっている事からもそれがわかる。
「転職」で上位表示すれば「求人」でも上位表示されると言うことになる。SEO は楽になるような気がするが、類義語が検索対象になるとライバルが増えることにもなる。
地域名を検索対象に含めて上位表示を狙っている人の場合は、今までよりも楽になりそうだ。「東京都」と「東京」は別のキーワードだが、2 語以上で検索する場合は同じように扱われているようなので、2 つのキーワードをちりばめる必要もなくなる。
投稿者 Su-Jine : 15:20 | コメント (0) | トラックバック | SEO
2006年07月23日Google のヘルプから「補足結果」の解説が消えた
最近は全然 SEO のことを気にしていなかった。ポイ探のアクセスも伸び悩んでいるので、SEO のことも考えようと思っていたところ、昨日あたりから Google の検索結果が微妙に変わっているような気がして少し調べていた。分かち書きが何か変わったのか、今まで 1 件しか表示されていなかったキーワードが、40 万件とかいう結果を返している。なぜ一気に 40 万件も増えたのかとみていると、1 件目以外はすべて「補足結果」と表示され、そのキャッシュをみると、ほとんどが「これらのキーワードは、このページにむけて張られているリンクに含まれています」となっている。
チェックしたキーワードの形は「○△△□」といったキーワード。○+△△+□という分かち書きになっている。で、補足結果になっていない 1 件は「○△△□です。」のような文章で、補足結果になっているページは「△△□は○だ。」のような文章だ。
ここで、補足結果の解説が Google のヘルプに掲載されていたはずなので、検索したところ補足結果の解説がヘルプから消えている。
補足結果の解説ページのキャッシュ画像 ヘルプでの「補足結果」の検索結果画像
キャッシュは 7/16 なので、それまでは補足結果の解説があった。昨日あたりから検索結果が微妙に変わったのと何か関係があるのかもしれない。
投稿者 Su-Jine : 01:03 | コメント (2) | トラックバック | SEO
2006年06月14日日本独自の検索エンジン
毎日新聞の「<検索エンジン>日本の30社・機関が独自開発へ」と言う記事について。日本独自の検索エンジンを作るというのは良い傾向だと思う。現在の主要検索エンジンは、すべてが米国製。日本にも優秀な技術者がいるだろうし、優秀な人も数多くいる。米国の検索エンジンに負けないくらいのもの出来るはず。
個人的に検索エンジンを作りたいなぁと思っていた時期もあった。さすがに個人レベルで作成できるものではないが、ちょっとしたアイディアもある。このプロジェクトで意見を採り上げてくれるなら意見を送ってみようと思う。
投稿者 Su-Jine : 14:51 | コメント (4) | トラックバック | SEO
2006年06月03日「地底人の秘密」の宣伝方法
最近は「検索エンジンで検索して」というようなテレビ CM や広告が多い。現在は FMV の CM で「地底人の秘密で検索」(←これであってる?) というのが放送されている。
雑誌の広告や中吊りでも「○○を検索」とあるが、 URL を表示したりするよりもアクセスが簡単だからこういう CM が多くなってきているんだろう。しかし、検索エンジンに依存しているため、確実に 1 番上に表示することができるわけでもない。また、アクセスを増やすためだけにそのキーワードで最適化するサイトも出てくるだろう。Overture では全く関係の無いサイトが広告を出している。
「○○で検索してね」というのは結構危険な宣伝方法ではないだろうか。
投稿者 Su-Jine : 20:02 | コメント (4) | トラックバック | SEO
2006年05月10日MSN を Yahoo! に売却?
ちょっと古いニュースだが、「MicrosoftがYahoo!に出資交渉――米紙報道」というニュースについて。
この中に気になる一文が
『MicrosoftとYahoo!は過去1年で、可能な選択肢について交渉を行ってきたと同紙。MicrosoftがオンラインネットワークのMSNをYahoo!に売却し、Yahoo!の少数株を取得することも考えられると伝えている。』
MSN を Yahoo! に売却ってかなり衝撃的だ。この「オンラインネットワークの MSN」というのはどこのことを言っているのだろうか?単純にポータルということなのか、ポータル + 検索エンジンという事なのか。後者であれば、Windows Live (beta) や start.com 等はどうなるのだろうか。これらの検索エンジンは MSN と同じ結果を返している。以前のニュースで Google しのぐ検索エンジン? というのは、現状の MSN とは全く異なるものなのだろうか?
投稿者 Su-Jine : 23:28 | コメント (0) | トラックバック | SEO
2006年04月03日どこからもリンクされていないページがクロールされる
「ポイ探」というドメインは、去年の 12 月に取得したわけだが、このドメインはどこからもリンクされていなかった。にもかかわらず、YST, Google はリリース前にクロールしていったわけだ。特に YST で「ポイ探」を検索 すると既に 76 件ヒットしている。Google のクローラも何度か訪れたが、Google の方はトップページのみインデックスされていた。クロール自体は下位のページもクロールしていたが、トップページ以外はインデックスされていなかった。
Google の場合はツールバー経由で新規ページを見つけると言うことも可能だが、YST, msn, Google の URL 申請ページは機能しているのか (2) を見る限りでは、ツールバー経由のみではロボットはアクセスしてこないようだ。YST はツールバーをインストールしていないので、YST がこのドメインを知るはずがない。ということは、新しく取得されたドメインをチェックしているということだろうか。もしドメインの whois 情報までチェックしているのであれば、whois 情報 (取得日とか取得者等) も検索結果に反映されている可能性もあるわけだ。
投稿者 Su-Jine : 00:20 | コメント (2) | トラックバック | SEO
2006年03月31日Mozilla 無し Googlebot 終了
私が管理しているサイトだけかもしれないが、3/29 日以降、Mozilla 無しの Googlebot によるアクセスが無い。今アクセスのあるのは Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) という Mozilla 付きの Googlebot のみだ。今後、インデックス収集は、すべてこのロボットになっていくと思われる。なぜ、以前の Googlebot が集めたデータではなく、新しく集め直したのかは不明。
投稿者 Su-Jine : 09:21 | コメント (1) | トラックバック | SEO
2006年03月27日Google 新データセンタに移行完了?
http://66.249.93.104/ の検索結果と通常の検索結果が先週金曜日あたりから一緒になっているような気がする。サーバ毎に検索結果の数が全然違っていた (2 倍以上の差があった) のもほぼ統一された感じだ。23 日から 1 〜 2 週間で新データセンタに反映とあったが、既に反映しているのだろうか?それともまだ変わることがあるのだろうか?
===
ここ 1 週間新しいサイトの構築をしていた。4 月にリリースできるかどうかわからなかったものも、一応 4/1 にリリースできそう。今週で一気に終わらせる予定。このサイトはどこからもリンクされていないし、登録の申請もしていないのに、Google、YST でインデックスされている。新規ドメインの場合は何か監視しているのだろうか?
投稿者 Su-Jine : 08:25 | コメント (0) | トラックバック | SEO
2006年03月19日Mozilla Googlebot が主流に?
まだオープンしていないサイトがある。去年の 12 月頃に取得したドメインだ。まだオープンしていないし、どこからもリンクが貼られていない。にもかかわらず、YST, Google にインデックスされている。何も申請していないはずなのに。
で、Google のキャッシュとログを比較したところ、Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) がクロールしたときにインデックスされたようだ。この Mozilla 付きの Googlebot は 新データセンタで確認していた が、通常の検索でも Mozilla 付きのクローラによるインデックスが確認できた。Google に何らかの動きがあったような で書いたのは Mozilla 付きのクローラが主流になったために起こったことだろうか?
投稿者 Su-Jine : 12:33 | コメント (0) | トラックバック | SEO
2006年03月15日Yahoo! サジェスト
Yahoo!検索に「キーワード入力補助機能」--キーワード候補を自動で表示 という記事が CNET Japan に掲載されていた。この キーワード入力補助 という機能は Google サジェスト と同じ機能だ。これらの表示されるキーワードを見比べてみるのもおもしろいと思う。
たとえば、「や」と入力すると Yahoo! の方は「矢田亜希子 妊娠」「ヤマハ バイク」「山下智久 画像」「クロサギ 山下智久」「山手線 路線図」といった感じだ。Google の方は「ヤフー」「ヤフオク」「ヤフーオークション」「ヤマダ電機」「ヤマト運輸」となる。「か」と入力すると「確定申告」というキーワードがどちらも上位に表示されているので、最近検索されたキーワードから順位を決定しているように思われる。
---
最近新しい Web サイトを作っているが、デザインが決まらないのでしばらくリリースができなさそう。3 月中旬〜下旬にはリリースしたかったのだが、このままいくと 4 月下旬くらいになるかも。開発は一人でやるのが一番良い。他の人が決定するまで何もできない状態というのは非常に非効率だ。
投稿者 Su-Jine : 23:28 | コメント (0) | トラックバック | SEO
2006年03月14日Google に何らかの動きがあったような
アクセスログを見ていると、Google に何らかの動きがあったように思われる。具体的な動きはまだわからない。日曜日の夜中から動いているような感じで、本日 Mozilla 無しの Googlebot も 17:00 でぴたっと止まった。Mozilla 無しのクローラは良くぴたっと止まることがあるが、何か動いているようなときに止まるとちょっと気になる。
本日 Google APIs を使って自分専用の検索サイトを作ろうと思ったが、なぜか検索しても結果が 0 件になってしまう場合が多く、どうも不安定なので作成をやめた。以前いじったときには検索結果が 0 件になる (結果が帰ってこない?) 事はなかったと思うが。作り方が悪いのかなぁ。今作っている新しいサイトをリリースしてからもう一度チャレンジしてみようと思う。
投稿者 Su-Jine : 21:46 | コメント (0) | トラックバック | SEO
2006年03月13日YST, msn, Google の URL 申請ページは機能しているのか (3)
YST, msn, Google の URL 申請ページは機能しているのか (2) を少しまとめてみる。2006/3/13 20:47 現在の状況を書くと、msn の申請ページ はクロールからインデックスまでしてくれる。リンクが無くても OK だ。米 YST の申請ページ のページ申請はクロールまでは OK だが、インデックスの確認はできていない。フィード申請の方は RSS 自体はクロールされたが、RSS にあるリンクはまだクロールされていない。Google に関しては Google Sitemaps はすぐクロールされ、そのサイトマップにあるリンクも 2 つクロールされた。インデックスされるかどうかを今後見ていく必要がある。日本の YST の申請ページ、Google の申請ページ はまだ確認できていない。
投稿者 Su-Jine : 20:47 | コメント (2) | トラックバック | SEO
2006年03月08日YST, msn, Google の URL 申請ページは機能しているのか (2)
以前、YST への申請ページは機能しているのか (1) と言う記事を書いたのだが、すっかりその後の検証を忘れていた。そこで、今回は検証ページを用意した。検証内容は、YST, msn, Google の URL 申請ページを利用、Google ツールバーでのアクセス、サイトマップなどの登録等。作成したページはどこからもリンクされていない。それぞれのページ申請方法とページ番号を下記に示す。
| ページ番号 | ページ申請方法 |
|---|---|
| A, B, C | Yahoo! JAPAN の URL 申請ページ からの "ページ" 登録 |
| D, E, F | 米 Yahoo! の URL 申請ページ からの "ページ" 登録 |
| G | 米 Yahoo! のフィード申請ページ からの "RSSフィード" 登録 |
| H, I, J | 上記 G の RSS に含まれているページ (G が巡回されれば H, I, J も巡回される可能性がある) |
| K, L, M | Yahoo! Web Rank でのアクセス (第19回 Yahoo! Web Rank について 参照) |
| N, O, P | Google の URL 申請ページ からの "ページ" 登録 |
| Q | Google Sitemaps のサイトマップ申請ページ からの "サイトマップ" 登録 |
| R, S, T | 上記 Q のサイトマップに含まれているページ (Q が巡回されれば R, S, T も巡回される可能性がある) |
| U, V, W | Google ツールバーを表示した状態でのアクセス (第11回 Google のフレッシュクロール対象サイトにするには、Googleツールバーが影響している? 参照) |
| X, Y, Z | msn の URL 申請ページ からの "ページ" 登録 |
ページ名、URL は公開すると検証にならないため公開しない。リンクされたりすると検証できなくなるためだ。ページの形式は http://blog.su-jine.com/○○/△△.html または http://blog.su-jine.com/○○/△△.xml と言う形式となっている。ページには YST, msn, Google のクローラのみのアクセスログをとれるようにした。下記のフレーム内にクローラのアクセスがあれば上記ページ名に何のクローラがアクセスあったかわかるようになっている。
検証ページを作成し、1 日経過したところ msn のページ申請は動いているようだ。また、Google Sitemaps も xml ファイルをクロールしている。
投稿者 Su-Jine : 00:23 | コメント (6) | トラックバック | SEO
2006年03月07日YST の 301, 302 リダイレクトの処理
リダイレクトを設定している場合、どちらのURLがデータベースに登録されますか? と言うページを発見。いつ作成されたページなのかわからないが、YST が 301, 302 をどうやって扱っているかを解説しているページだ。meta refresh 等も解説されている。引数有り無しの解説はためになるが、「引数有り→引数無し」のリダイレクトや「引数有り→引数有り」のリダイレクトも解説して欲しい。
投稿者 Su-Jine : 12:39 | コメント (0) | トラックバック | SEO
2006年02月23日Google ローカルのデータ元
マイミクさんが Google ローカルのデータ元は何かという記事を書いていた。住所などのデータ元は Yahoo! 電話帳 だろう。ただ、Yahoo! 電話帳にはビル名までは載っていないようなので、その他にもデータ元はあるのかも。詳細タブの情報に関しては CNET の記事 で確認できる。情報などが間違っている場合や追加する場合は、Google ローカル ビジネス センター で対応可能だ。
投稿者 Su-Jine : 09:22 | コメント (11) | トラックバック | SEO
2006年02月22日Google 「ローカル」を格上げ
Google のトップページから「ディレクトリ」が消え、「ローカル」が格上げとなった。以前の Google はディレクトリを検索結果にも表示していたが、それが消えて、今回はトップページからのリンクも消えてしまった。ディレクトリを表示するには more をクリックする必要がある。
現状の Google ツールバー 3 にも「サイト検索」「イメージ検索」「グループ検索」「ニュース検索」はあるが、「ディレクトリ検索」は無いようだ。ディレクトリ検索は消えていく運命だったのだろう。

投稿者 Su-Jine : 20:11 | コメント (0) | トラックバック | SEO
2006年01月28日Mozilla 無し Googlebot は?
いつもなら大量にアクセスのある Googlebot/2.1 (+http://www.google.com/bot.html) だが、本日 14:00 あたりからぴたっとアクセスが無くなった。私が管理しているサイトのほぼすべてで Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) のクローラによるアクセスのみ。この状態が続くとなると、新データセンタのリリースが近いと言うことだろうか。
それとも Googlebot/2.1 (+http://www.google.com/bot.html) のサーバが何かのトラブルでアクセスがないだけなのか。PageRank が更新される前触れか。
===
【追記】18:00
Mozilla 無し Googlebot によるアクセスが再開。単にスケジュールが遅れただけなのか。
投稿者 Su-Jine : 16:31 | コメント (0) | トラックバック | SEO
2006年01月25日Googlebot の謎
昨年からずっと気になっていたことがあった。Googlebot は下記の 2 種類存在する。
A. Googlebot/2.1 (+http://www.google.com/bot.html)
B. Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
A がクロールした後は確実にインデックスされていたにもかかわらず、B がクロールしてもインデックスがされていなかった。
今年に入って Google は http://66.249.93.104/ と http://64.233.179.104/ を検証用データセンタとしたらしい。この 2 つは検索しても検索結果はさほど変わらない。しかし、インデックス数が他のデータセンタと全く異なる。現在のインデックス数の 2 〜 3 倍程度だ。
インデックス数は増えているが、サイト毎に見ると大幅に減っているサイトもあれば、大幅に増えているサイトもある。この検証用のデータがすぐに本番用としてリリースされるかはわからないが、意外と打撃を受けるサイトも多いだろう。
そこで、検索順位もさほど変わらないので何が違うかというのを調べていた。気になったことはキャッシュの日付が違うこと。キャッシュの日付が違うので、クローラの情報を調べてみた。そうすると、新データセンタのキャッシュは、確認したものは B によるキャッシュであり、A のキャッシュではない。
しかし、なぜ新しいクローラでクロールする必要があったのか。このあたりに疑問が残る。
投稿者 Su-Jine : 10:04 | コメント (2) | トラックバック | SEO
2006年01月06日YST への申請ページは機能しているのか (1)
YST へのページ申請 というページは機能しているのだろうか?あまり気にしたことがなかったが、YST のインデックスが非常に遅いような気がするので、ちょっとしたプログラムを作成してみた。YST への申請には Yahoo! JAPAN のアカウントが必要だ。アカウントを作成し、送信時のパケットを取得。URL と Cookie を POST しているようなので、それらの変数を POST するように作成。作成したソフトは↓のような感じ。

1 ヶ月前くらいに完成したので早速申請。1 ヶ月ほど経ったがそれほどインデックスページは増えていない。単純にリンクをたどったという感じの方が強い。どこからもリンクされていない実験ページを 100 件程度申請してチェックしてみよう。
投稿者 Su-Jine : 09:05 | コメント (8) | トラックバック | SEO
2005年12月20日Google と AOL の提携
先週 Google が AOL の株を 5% 購入する というニュースが発表された。SEO 的には何も影響はないだろうが、Google としては単に広告収入を増やすためだけに提携したのだろうか?
本日 タイムワーナー大株主、AOLとグーグルの提携に異議 と言う記事が載っていたのだが、AOL としては Microsoft や Yahoo!、その他と提携しにくくなるため反対するのもうなずける。TBS が楽天を拒否したのと同じ理由だろう。
Google からしてみると Microsoft と AOL が独占契約を結ぶとかなりの脅威となる。一時は AOL と Microsoft との提携が有力という記事も掲載されていた。単にこれを阻止するために提携したのだろうか。
Google にとってポータル系との提携というのは今まで無かったような気がする。単純な検索エンジンの提供だけだったはずだ。どうも AOL との提携は今までの Google の方向性と違うような感じだ。微々たるものだが、Google の株を購入したのでこういう話題は非常に気になる。
===
最近は寝付きが悪く、眠りが浅い。どうにかならないものだろうか。
投稿者 Su-Jine : 11:02 | コメント (4) | トラックバック | SEO
2005年11月24日Googlebot のアクセス頻度が減少
昨日、ロボットのアクセスが少し減っていると書いたが、今日もちょっと少なめのような気がする。サイトによってはここ 2 週間くらいの平均の約半分程度。あまり変更がないサイトでも 3/4 程度まで減少している。何かの前触れか、特定のサイトだけの現象か、それともクローラも Thanksgiving Day でお休みなのか…。
フォーラム は 掲示板 にも書き込んだので、少しずつユーザは増えている。が、ちょっと書き込みが少ないなぁ。やはりユーザ登録の障壁が高いのだろうか。
これから RSS で新着情報を配信する予定。
投稿者 Su-Jine : 17:43 | コメント (0) | トラックバック | SEO
2005年11月23日ウェブマスターフォーラムをオープン
ウェブマスターフォーラム をオープン。とりあえずブログのみで告知。SEO フォーラムではないのは、SEO 以外の話題も扱えるようにウェブマスターフォーラムとした。ネーミングは安直。
このフォーラムはユーザの登録が必要。ユーザ登録といってもメールアドレスとハンドルネーム、パスワードの登録のみ。書き込まない限りユーザ登録は不要だが、登録ユーザにしか見られないトピックも作ることが可能だ。
このフォーラムには書き込んだ人を評価する機能がついている。Yahoo! Auction の評価のような感じだ。評価が高い人の書き込みが必ずしも正しいとは限らないが、何らかの目安になるだろうと思って付けた機能。評価は 100 ポイントがマックスで、登録時は 10 ポイント。
mixi のような招待機能も付けてみた。招待されたユーザは招待したユーザの半分のポイントが与えられる。20 ポイント以上のユーザが招待権利を持っている。20 ポイントのユーザから招待されても 10 ポイントなので普通に登録するのと変わらない。30 ポイントのユーザから招待されると 15 ポイントから開始することができる。
しばらくの間はフォーラムと掲示板は平行して運用しようと思う。定着してきたらフォーラムの方に移行できればと思っている。診断掲示板もフォーラムにトピックを作って対応可能だろう。
海外の方ではフォーラムは活発だが、日本でも活発に利用されることを望んでいる。
===
今日はロボットの巡回がいつもよりも少ない。いつもの半分程度。
投稿者 Su-Jine : 22:40 | コメント (1) | トラックバック | SEO
2005年11月22日msnbot/0.9
最近の msnbot は 1.0 だったような気がするが、11/20 日頃から msnbot/0.9 というログが残っている。もっと前からアクセスあるのかもしれないが。1.0 から 0.9 になっているのでバージョンはダウン。この 1.0 と 0.9 の違いは何だろうか。
投稿者 Su-Jine : 09:23 | コメント (0) | トラックバック | SEO
2005年11月15日Google Analytics
Google がアクセス解析 Google Analytics を発表した。先日、アカウントを作成したが、あまりにも重い。12 時間以内にレポートが作成されるとあったが、12 時間以上経ってもレポートは作成されていないようだ。かなり負荷がかかっているのだろう。
アクセス解析を Google が提供するというのは非常に怖いところもある。ユニークアクセス数などの情報をすべて Google が把握してしまうわけだ。それらのデータを利用して検索のアルゴリズムを変更する可能性もある。取得したサイトのデータは広告などにも使える。アクセスが多いサイトは単価を高めに、アクセスが少ないサイトは単価を低めにということだって可能だ。
良いところとしては、新しいページをクローラが発見しやすくなると言うところだろうか。新しいページにアクセスすれば、データベースに無いページと判断されればクロールするようにすれば、どんどん新しいページを発見することができる。
しかし、サイトのデータをすべて検索エンジンに把握されるというのは何となく怖い気がする。
投稿者 Su-Jine : 12:48 | コメント (0) | トラックバック | SEO
2005年11月01日Google の検索結果変動
http://66.102.9.104/ のサーバで昨日から順位が変動している。今更新中なのか、これが最終形なのだろうか?他にも微妙に動いているサーバがあるが、http://66.102.9.104/ が一番大きな変動を見せている。
投稿者 Su-Jine : 17:25 | コメント (0) | トラックバック | SEO
2005年10月21日Google イメージ検索が微妙に変わった?
先日、Google の イメージ検索 をしていて、なんか違うような気がした。以前のイメージ検索のフォーマットと微妙に違うような気がする。
1. イメージの表示方法
以前は、1 行目、3 行目と奇数行目は背景に色が付いていたような気がする。
2. 大きさの指定
以前は、「検索結果 約 ○○ 件中」の右下に「大 中 小」というリンクがついていたような気がする。現在は、プルダウンで指定。
3. ファイル名
以前はファイル名がフルで表示されていたと思うが、現在はドメインのみ。
投稿者 Su-Jine : 15:44 | コメント (1) | トラックバック | SEO
2005年10月20日YST カテゴリ情報修正中
YST と騒いでいると Google も更新を始める、と言うような事がよく起こる。偶然なのか偶然ではないのか…。
YST でカテゴリ情報がついているサイトとついていないサイトがあるという騒ぎが起きているが、まだ何らかの不具合があるようだ。カテゴリに登録されているのにカテゴリマークがなくても、時間が解決してくれるだろう。
しつこいようだが、JAL で検索してみると、2 番目に表示される「JAPAN AIRLINES」がある。この説明文は「持株会社。企業情報、プレスリリース等。」となっていて、カテゴリは「航空会社 > 日本航空 (JAL) > 関連企業」となっている。ドメインは「www.jal.com」だ。
実際に 関連企業カテゴリ をクリックすると、カテゴリ内に www.jal.com は存在しない。しかし、全く同じ説明文がある。それは、「日本航空」というページ。しかし、ドメインは「www.jal.jp」。
一つ前の 日本航空 (JAL) カテゴリ を表示すると、「JAPAN AIRLINES」とある。このサイトのドメインは「www.jal.com/ja/」。説明文は「JALグループの企業情報、投資家情報、採用情報、環境活動等。」。
www.jal.com の情報を表示しなければならないのに、www.jal.jp の説明文を表示していると言うことだ。www.jal.jp と www.jal.com の区別がついていない。
投稿者 Su-Jine : 10:38 | コメント (0) | トラックバック | SEO
2005年10月19日jal.com
先日 YST のカテゴリ アイコンはどこに消えた? の記事という記事を書いた。本日、jal をもう一度調べると、カテゴリアイコンが表示され、タイトルが「JAL-航空券 予約・空席照会・運賃案内-」、説明が「国内線、国際線の予約、マイレージ、ツアー、ホテル情報等。国内線のチケットレスサービスも。」となっており、カテゴリの情報が表示されるようになったようだ。まぁ、カテゴリのマークが戻ることは予想通りだったのだが、「あれ?」と思うことが。
記憶が確かであれば、jal.com というドメインに対して、JAL が以前裁判を起こしたことがあったような気がする。その裁判で負けて、jal.com のドメイン停止ができなかったような気がしていた。しかし、上記のように YST で jal を検索すると、2 番目に「JAPAN AIRLINES」と表示される。URL は www.jal.com。タイトルからして、JAL そのものじゃないかと思い表示してみたが、やはり JAL そのものだった。
気になって調べてみると、2000 年にやはり JAL が裁判で負けている。いくつかの掲示板の情報だが、2001 年 1 月から JAL の所有になっているようだ。jal.com を買い取ったなんて言うことは全く知らなかった。
投稿者 Su-Jine : 23:30 | コメント (0) | トラックバック | SEO
2005年10月18日YST のカテゴリ アイコンはどこに消えた?
今まで YST で検索すると、Yahoo! JAPAN のカテゴリに登録されているサイトは、黄色いカテゴリアイコンが付いていた。最近このアイコンがつかなくなった。Yahoo! ヘルプ -Yahoo! 検索 には「Yahoo!カテゴリのアイコンがつきます」とある。Yahoo! が意図的にこのカテゴリのアイコンを消したのであれば、この説明文も変更するはずであり、アイコンが消えているのは一時的なものだろう。
掲示板 でも書いたが、カテゴリ DB とページの DB との連携で何らかの不具合があるように感じられる。
■JAL を検索| YST の検索結果 | タイトル | ホーム |
| 説明文 | 国内線、国際線の予約、e割、マイレージ、ツアー、ホテル情報等。国内線のチケットレスサービスも。 | |
| Yahoo! に登録されているカテゴリ情報 | タイトル | 日本航空 (JAL)ホームページ |
| 説明文 | 国内線、国際線の予約、マイレージ、ツアー、ホテル情報等。国内線のチケットレスサービスも。 | |
| 実際のタグ情報 | タイトル | JAL−航空券 予約・空席照会・運賃案内− |
| 説明文 (Description) | JALホームページ。国内線、国際線航空券の予約、購入をはじめ、スケジュール照会、空席照会、運賃案内などをサポート。JALマイレージバンクのご案内や国内、海外の現地情報、ホテル、レンタカーの予約などもご用意しております。 |
YST での検索結果はタイトルが「ホーム」となっているが、実際の JAL のページのタイトルにはホームというキーワードはない。この「ホーム」がどこから出てきたかというと、Yahoo! のカテゴリ情報のタイトルに、「日本航空 (JAL)ホームページ」とあり、この「ホーム」が表示されているのだろう。「ホーム」以外のキーワードは何らかの原因で消えてしまったように思われる。検索結果の説明文はカテゴリの説明文が使われているように思われる。しかし、Yahoo! カテゴリにはない「e割」と言うキーワードが入っているのが気になるところ。
■レクサス を検索| YST の検索結果 | タイトル | ホーム |
| 説明文 | LEXUS.jp ... | |
| Yahoo! に登録されているカテゴリ情報 | タイトル | レクサスホームページ |
| 説明文 | モデル、販売店、サービス紹介等。 | |
| 実際のタグ情報 | タイトル | LEXUS.jp |
| 説明文 (Description) | なし |
レクサスの検索結果のタイトルも「ホーム」となっている。これもカテゴリ情報から抽出しているようだが、やはり「ホーム」以外のキーワードが消えている。説明文はカテゴリから抽出されたものではなく、meta タグの Description がないからなのか、<title> タグが使われているようだ。
YST の検索結果はカテゴリに登録されているものはカテゴリの情報が表示されるはずだが、タイトルはページ情報から表示しているのに、説明文だけをカテゴリ情報から表示してみたり、逆であったり、カテゴリ情報をすべて表示していたりと非常に不安定だ。どうもこの辺がカテゴリのアイコンが消える原因だろう。
例えば、DHC や ルイ・ヴィトン 等は今でもカテゴリのリンクが表示されている。すべてのカテゴリアイコンが消えたわけではない。やはり何らかの不具合と考えた方が良さそうだ。
今回の件で Yahoo! の順位が上がったとか下がったとかあるようだが、これが単純にカテゴリ情報との連携ミスによる順位の変動であると考えると、Yahoo! のカテゴリは YST にとって、それだけ影響力があると言うことになる。
投稿者 Su-Jine : 10:07 | コメント (0) | トラックバック | SEO
2005年10月17日Yahoo! Search の IP アドレス指定
Google の場合は、各サーバの IP アドレスを直に指定すると、その IP アドレスのサーバで検索ができる。例えば、http://66.102.7.104/ にアクセスすると Google のページが表示される。search.yahoo.co.jp の IP アドレスを nslookup で調べてみると、次の 3 つが表示される。
203.216.231.214
210.80.240.218
203.216.227.246
複数表示されるのは DNS ラウンドロビン による負荷分散のため。上記 IP アドレスで直にアクセスすると Yahoo! 検索のトップ に強制リダイレクトされる。そのため、Google のように IP アドレスを指定して検索することができない。
ちょっと手間はかかるが hosts ファイルを使うと解決することができる。Windows XP (NT 系) の場合、次の箇所に hosts ファイルが存在する。
drive:\windows\system32\drivers\etc\hosts (NT や 2000 の場合は windows の箇所が winnt だと思う)
このファイルを開くと IP アドレスとホスト名の対が表示されているので、次の 1 行を加えて保存。
203.216.231.214 search.yahoo.co.jp
こうすると、DNS にアクセスする前に hosts ファイルで名前を解決するため、203.216.231.214 のサーバで検索することが可能。ブラウザで search.yahoo.co.jp にアクセスすれば 203.216.231.214 のサーバに接続される。210.80.240.218 のサーバで検索したいのであれば、上記 IP アドレスを 210.80.240.218 に変更して保存すれば良い。
hosts ファイルに記載されているホストの場合は、DNS で名前解決はしないため、自分の意図した IP アドレスを指定できる。フィッシング詐欺等でも hosts ファイルは使われることがあるので、この機会に hosts ファイルに変な IP アドレス、ホストの対が書かれていないかをチェックしてみてはいかがだろうか?(デフォルトで記述されているのは 127.0.0.1 localhost のみ。その上に # がついているのはコメントアウトなので無視)
投稿者 Su-Jine : 09:00 | コメント (0) | トラックバック | SEO
2005年10月08日【ブックレビュー】最強の SEO 対策!
SoftBank Publishing から出ている 最強のSEO対策! という本を、SoftBank Publishing の担当者から送って頂いたので感想を書こうと思う。この本の著者は SEO コンテストで審査員を務めてくれたスマートシステム 田村さん。
まず、タイトルとしては SEO とあるが、全体的に SEM に関する内容の方が多いと感じられる。SEO としては、初心者向けであり、ホームページビルダーの GUI を使いながら、どのプロパティをどのように変更するとタグが書き換わるのかという内容だ。ホームページビルダーを使っている方はタグを読んだり書いたりはあまり得意ではないと思うので、このような方には非常に参考になると思う。逆にタグを読んだり書いたりできる方にとっては少し物足りないような気がする。
SEM 的な内容としては、効率の良いキーワードの決定方法や、Overture・AdWords のリスティング広告の使い方など。キーワードの決定方法 (キーワードアドバイスツールの使用など) は個人サイトでも使えそうだ。また、クリックされやすくなるような文章の書き方などのテクニックが紹介されている。このクリックされやすくなるような文章の書き方は Overture、AdWords の説明の部分に載っているのだが、これはスニペットに応用もできるだろう。しかし、リスティング広告については商用サイトがターゲットになるので、個人的にはなるほどなという程度だ。これからショッピングサイトを立ち上げる方とか、サイトを立ち上げたばかりで困っている方なんかには参考になると思う。
最後にアフィリエイトについて書かれている。アフィリエイトの本はほとんど読んだことがないので比較はできないが、この本では実際の体験談が書かれていて、どうやって商材を見つけるのか、それでどの程度収入を得たかが書かれている。以前読んだアフィリエイトの本は、成功事例が載っているのだが、具体的な内容は一切書かれていなかった。ゴッゴル本 を書いてわかったのだが、印税というのはそれほど入らない。著者に入る印税よりもアフィリエイトで稼いでいる方が収入になるために、「アフィリエイトで儲けよう!!」的な本ですべてのノウハウを公開することはほとんどないだろう。そのような本よりも、この本の最後に少し書かれているノウハウの方が収入アップになるような気がする。
投稿者 Su-Jine : 01:12 | コメント (2) | トラックバック | SEO
2005年10月04日Yahoo! のクローラ (cdev1002.inktomisearch.com)
先日切り替わった Yahoo! JAPAN の検索は、かなりの衝撃を与えたのだろう。Yahoo! の検索が極端に重くなると言うのは、それだけ注目度が高いと言うことだ。一般のユーザにはこの切り替えはそれほど大きなものではないが、これだけアクセスが集中すると言うことは、SEO というか、検索エンジンの順位を気にしているユーザがかなり多いと言うことがわかる。
Yahoo! も切り替わったので、最近あまり見ていないログのチェックをしてみた。Yahoo! のクローラで cdev1002.inktomisearch.com (66.196.81.175) というアクセスがある。Yahoo! のクローラは fj 系と lj 系の 2 種類だったはず。cdev 系という新しい (以前からアクセスがあるがあるようだが) アクセスが気になった。cdev は c + dev のような気がするので新しいクローラの開発段階ということだろうか。IP アドレス的には fj 系に近い。
投稿者 Su-Jine : 00:30 | コメント (0) | トラックバック | SEO
2005年10月03日Yahoo! JAPAN が Yahoo! SEARCH に移行
とうとう Yahoo! JAPAN の検索が Yahoo! SEARCH に移行された。予想では明日の日中かなぁと思っていたが、意外と早く更新されたようだ。明日のアクセス数がどうなるのか。

Yahoo! SEARCH のトップページも変更されたようだ。β版の時のデザインは、ほぼ Google だったのが、少しは変えてきたようだ。
投稿者 Su-Jine : 00:36 | コメント (0) | トラックバック | SEO
2005年10月02日Google イメージ検索更新
10 月になりました。Yahoo! がいつ切り替わるのか。CNET の記事 でも「10月より新方式に切り替える。」とは書いてあるが、10 月 1 日からとは書いていない。早ければ明日 (10/3) かなぁなんて予想してみる。
Yahoo! に話題を持って行かれるのが気にくわないのか、Google イメージ検索のインデックス更新があった。ゴッゴルミニ イメージ検索 で書いたのだが、ようやく「ゴッゴルミニ」でイメージ検索がヒットするようになった。検証用の画像は下記の画像。
![]()
この画像を「ゴッゴルミニ」でイメージ検索したときに上位を狙おうと思っていたが、インデックスすらされていない…。Google イメージ検索に関する FAQ で書かれている、「重複を排除し、最高品質の画像が最初に表示されます」 で同一画像と見なされて排除されているだけなのか。
投稿者 Su-Jine : 13:51 | コメント (0) | トラックバック | SEO
2005年09月30日■Yahoo! SEARCH による SEO
10 月から Yahoo! JAPAN の検索が切り替わる。Yahoo! JAPAN のトップページがどうなるのかはわからないが、検索結果は現在の Yahoo! SEARCH (beta) のような形になるだろう。
今回は、「Yahoo! SEARCH による SEO」という題名だが、Yahoo! SEARCH で上位表示する対策を書くわけではないのであまり期待しないように。
Yahoo! SEARCH のトップページは UserAgent で何らかの制御を行っているようだ。Yahoo! SEARCH のキャッシュを見ると面白い事がわかる (Google によるキャッシュ、msn によるキャッシュ)。Google のキャッシュでテキストで表示するともっと面白い (Google のテキストキャッシュ)。「Yahoo!」に関する文言以外はほぼ消えている。キーワード出現率が非常に高い。ソースを見ると <h1><img src="〜" alt="〜"></h1> というタグを自サイトでも使っているわけだから、Yahoo! SEARCH では <h1> で囲まれた img の ALT 属性は有効そうだ。
![]() | ![]() |
| 図 1. Google によるキャッシュ | 図 2. msn によるキャッシュ |
![]() | ![]() |
| 図 3. Google によるテキストキャッシュ | 図 4. Yahoo! SEARCH オリジナル |
投稿者 Su-Jine : 00:21 | コメント (0) | トラックバック | SEO
2005年09月29日Google のインデックス数が消えた
Google のトップページを見ることはあまりない。本日たまたま Google のトップページを見たが、©2005 Google の右に今までは「8,168,684,336ウェブページから検索」という文言があったのだが、それが消えている。グーグルCEO:「インデックスの数は他社の3倍以上に」 という記事に、インデックス数を消した理由が書いてあった。その記事の中で、
Googleは以前、80億ページをインデックス化していると述べたことがあったが、「人によってインデックス数の数え方がまちまち」であることから、今後は登録されたページの数を明らかにしないことにしたとSchmidt は語った。
〜
Googleは先月、Yahooが200億ページを上まわるページをインデックス化しており、その大きさでGoogleを上まわったと主張した際、異議を唱えていた。
という文章があるが、インデックス数を消したと言うことは負けを認めたとしかとらえられないような気がする。具体的な数字を出さずに「他の検索エンジンの 3 倍をインデックスしている」なんて言うのは全く説得力がない。
投稿者 Su-Jine : 00:01 | コメント (0) | トラックバック | SEO
2005年09月23日■Yahoo! SEARCH は日本語ドメインを表示可能に
もう少しで Yahoo! JAPAN の検索結果の表示方法が変わる (Yahoo! のダイジェスト表示は 9 月まで? 参照)。ダイジェスト表示が無くなるため、カテゴリに登録されていなくても上位を狙えるチャンスではある。
以前メールマガジンで書いたことのある、日本語ドメインが対応されるのかをちょっと調べてみた (第21回 日本語ドメインについて - YST, msn (beta) 編 参照)。面白いことに、10 月以降に切り替わるであろう Yahoo! SEARCH (beta) で「お正月.com」を検索したところ、Punycode が日本語ドメインに変換されている。
下記の画像を見るとわかるとおり、左側の画像 (現状の YST) は検索結果の URL が「http://xn--t8j316ntzc.com/」となっているが、右側の画像 (Yahoo! SEARCH beta) は検索結果の URL が「お正月.com」となっていることがわかる (リンク先は、「http://xn--t8j316ntzc.com/」へのリンクとなっている)。この結果から Punycode の逆変換 (Punycode から日本語ドメインへの変換) 機能は持っていることになる。
検索結果を見ると、「お正月.com」「お正月.com/link.php」の 2 ページしかヒットしていない。第21回 日本語ドメインについて - YST, msn (beta) 編 で検証用に用意した「http://お正月.com/others.php」へのクロール形跡は無いため、「<a href="http://お正月.com/">http://お正月.com/</a>」というリンクがあってもクロールできないと言うことになる。そのため、Punycode への変換機能は持っていないと言うことがわかる。リンクするときには、やはり「<a href="http://xn--t8j316ntzc.com/">http://お正月.com/</a>」とする必要があるようだ。
まだまだ日本語ドメイン対応している検索エンジンは少ないが、今後 IE が日本語ドメインを対応するようになれば、一気に普及する可能性は高い。ちなみに IE7 で日本語ドメインは対応される予定だ (Internet Explorer次期バージョンにてIDN対応 参照)。
■日本語ドメインを取得するには
早い者勝ち! com/co.jp/jp ドメイン取るならお名前.com
![]()
投稿者 Su-Jine : 12:05 | コメント (0) | トラックバック | SEO
2005年09月22日Google のインデックスは 110 億?
Google オフィシャルとしては 8,168,684,336 ページインデックスしているようだ。約 80 億ページ。一番ヒットするキーワード「the」で検索すると次のような結果が帰ってくる (A)。(調べたサーバは http://64.233.167.104/)
the の検索結果 約 8,690,000,000 件中 1 - 10 件目 (0.07 秒)
で、「the」を含まない検索をすれば、全体のインデックス数がわかるはずである。「-the」を検索すると次のような結果が帰ってくる (B)。
-the の検索結果 約 2,420,000,000 件中 1 - 10 件目 (0.04 秒)
A は「the」を含むページを検索したもので、B は「the」が入っていないページを検索したものであるから、A と B を合計すると全インデックス数がわかるはずである。
実際に A + B を計算すると 11,110,000,000 ページ存在することになり、約 110 億ページということになる。同様に「blog」や「ブログ」「ゴッゴル」「SEO」などでも検索してみた。
blog の検索結果 約 437,000,000 件中 1 - 10 件目 (0.16 秒)
-blog の検索結果 約 10,750,000,000 件中 1 - 10 件目 (0.33 秒)
合計:11,187,000,000 件
ブログ の検索結果 約 18,500,000 件中 1 - 10 件目 (0.15 秒)
-ブログ の検索結果 約 11,190,000,000 件中 1 - 10 件目 (0.34 秒)
合計:11,208,500,000 件
ゴッゴル の検索結果 約 381,000 件中 1 - 10 件目 (0.28 秒)
-ゴッゴル の検索結果 約 11,210,000,000 件中 1 - 10 件目 (0.26 秒)
合計:11,210,381,000 件
seo の検索結果 約 30,800,000 件中 1 - 10 件目 (0.12 秒)
-seo の検索結果 約 11,180,000,000 件中 1 - 10 件目 (0.38 秒)
合計:11,210,800,000 件
どの検索結果も合計は約 111 〜 112 億となるので、現在の Google のインデックス数は約 110 億くらいだと思われる。ただし、この中には URL のみのインデックスもあるわけで、公式に発表するときには、このようなページをインデックスしているとは見なさない可能性もあるため、次回 Google のトップページのインデックス数が更新される時にはもっと少ない数値になる可能性もある。
投稿者 Su-Jine : 23:05 | コメント (1) | トラックバック | SEO
2005年09月17日ウェブマ}スターのための Google 情報
何気なく検索をしていたところ、「ウェブマ}スターのための Google 情報」という文字を発見。

たまに Google のヘルプページっておかしな文字が単語の間に挟まっていることがある。今回は "}" という記号が挟まっていた。タイトルだけではなく、左側にも同じように "}" がある。当然、分かち書きがおかしくなるため、どのように分かち書きされるのかを調べてみた。
「ウェブ|ウエブ|ウェヴ|ウェッブ」「マ」「スター」「の」「ため」「の」「google」「情報」
「ウェブ マ スター」とか検索すると 1 番上に Google の SEO ページが表示される。
投稿者 Su-Jine : 01:20 | コメント (0) | トラックバック | SEO
2005年09月05日サーバとサーバー、SEO には関係がある?
「サーバ」と「サーバー」。皆さんはどちらを使いますか?一般的には「サーバー」、理系の場合は「サーバ」と語尾を伸ばさない場合が多いだろう。
Google で「サーバ」「サーバー」をそれぞれ検索すると、検索件数は違うものの、同じ検索結果が帰ってくる。そのため今まで「サーバ」と「サーバー」の違いを気にしたことはない。
Powered by Google 系を使っている goo, excite, biglobe で「サーバ」と「サーバー」を検索してみた。
| 検索エンジン | 「サーバ」での 1 位のサイト | 「サーバー」での 1 位のサイト |
|---|---|---|
| レンタルサーバの決定版 ファーストサーバ : HOME | レンタルサーバの決定版 ファーストサーバ : HOME | |
| goo | レンタルサーバの決定版 ファーストサーバ : HOME | 自宅サーバーWebRing(ウェブリング) |
| excite | レンタルサーバの決定版 ファーストサーバ : HOME | 自宅サーバーWebRing(ウェブリング) |
| BIGLOBE | レンタルサーバの決定版 ファーストサーバ : HOME | 自宅サーバーWebRing(ウェブリング) |
私が知らなかっただけなのかもしれないが、「サーバ」と「サーバー」は Google 内では基本的に別の単語である事がわかった。同じ単語でインデックスされている場合は、Powered by Google 系の検索エンジンでも同じ結果が帰ってくるはずである。
A. クエリ → B. クエリの処理 → C. 検索リクエスト → D. 検索結果表示
上記の流れのうち、Powered by Google 系の検索エンジンは、C 以降が提供されているわけで、B のクエリの処理に関しては、各検索エンジン会社にまかされていることだ。Google だけが、「サーバ」と「サーバー」は同じであると関連付けられていて、「サーバ」と検索されたときに「サーバ OR サーバー」というクエリに変更し、検索していると言うことがわかった。
Google では「サーバ」「サーバー」は同じだが、Powered by Google 系の検索エンジン対策はそれぞれの単語で上位表示しなければならない。「サーバ」「サーバー」の検索結果には明らかにこのことを知っていて対策をしているなぁというサイトもあるようなので、この違いは有名な事だったのかも。
投稿者 Su-Jine : 10:35 | コメント (0) | トラックバック | SEO
2005年09月03日動的な CSS 作成
先日、CSS がインデックスされる という記事を書いたが、面白い内容ではない。
今回は CSS を動的に作成するということを考えてみる。参考にページを作ってみた。ランダム CSS というページ。何度かリロードしてみると、【リロードするたびにこの文字色が変わる】 という文字の色が変わる。これは、CSS 自体を PHP で動かしているためにこういう事ができる。試しに、CSS ファイル を見て欲しい。この CSS ファイルを何度かリロードすると、color が動的に変わっていく。
こんな感じで、CSS を動的に作ることも可能だ。使えるサーバも限られてくると思うが ランダム CSS にソースコードも載せているので、実際に動かしてみると面白いことに使えるような気がする。例えば、JavaScript で IE 用、Firefox 用など別の CSS を作って JavaScript で判定しているのをサーバサイドで行うとか、cookie に保存して、ユーザごとに色を変えられるようにするとか。何に使えるかはアイディア次第。
投稿者 Su-Jine : 15:47 | コメント (0) | トラックバック | SEO
2005年09月02日CSS がインデックスされる
CSS がインデックスされると言うことが 掲示板 でも話題になっているので、そのことについてちょっと書こうと思う。
display: none はスパムと見なされるようになるかもしれないという噂もあるが、display: none 自体はちゃんと定義されているもの である。定義されていると言うことは使い道があるから定義したわけで、この仕様を守った Web サイトを作っているのにスパムと見なされるとしたら、ちょっと問題があるような気がする。私が検索エンジンの開発者であれば display: none はコメントアウト (<!-- -->) と同様に扱うかな。
まぁ、150km/h 出せる車があって、150km/h 出すとスピード違反で捕まるというようなものだろうか。そもそも 150km/h まで出せない仕様にすれば良いのになぁといつも思う。
次回は「動的な CSS」について書こうと思う。
これを書いていて新しいアイディアを思いついたが、これを実現するのは 1 人では無理だろうな。新しく検索エンジンを作るようなものだから。
投稿者 Su-Jine : 10:38 | コメント (0) | トラックバック | SEO
2005年08月25日Yahoo! のダイジェスト表示は 9 月まで?
久しぶりに SEO ネタ。
ヤフー日本法人、完全自動検索に移行・閲覧数伸ばすグーグル型 という記事が IT-PLUS で書かれている。
検索サイトのヤフー日本法人は人手を利用して登録したサイトを優先的に表示する方式をやめ、10月にも検索を完全自動化した「グーグル型」に切り替える。人手を利用する方式は創業以来、採用してきた。自動検索の精度が上がるにつれグーグルが閲覧数を伸ばしており、ヤフーもライバルの方式に改める。
ということは 10 月あたりから Yahoo! JAPAN での検索結果は こんな感じ になっていくのだろう。ビジネスエクスプレスの申請は少しは減るのではないだろうか?それでも変更すると言うことは、ビジネスエクスプレスよりもリスティング広告の方が稼げると言うことだろうか。SEO がさらに注目されるようになるかも。
投稿者 Su-Jine : 11:13 | コメント (0) | トラックバック | SEO
2005年08月17日クローラ
世の中にはたくさんのクローラがある。Google や YST, msn 等のロボット型検索エンジン用クローラ。Yahoo! JAPAN や Su-Jine 等の登録サイトのダウンチェック用クローラ。メールアドレスを収集するクローラ等。
最近、クローラが多すぎると思う。管理しているサイトで、毎日 7 割 〜 8 割程度がクローラによるアクセスというサイトもある。場合によってはクローラのアクセスが多すぎて httpd がダウンする。サーバは専用サーバで、スペック的には問題ないはずだが、毎秒 10 程度のアクセスが数時間続くためダウンしてしまう。検索エンジンのクローラを排除するわけにもいかないため、頻繁にサーバがアップしているかを確認する必要がある。検索エンジン会社が別々に収集するというのも非常に効率が悪いし、ネットワークにもサーバにも負荷をかけている。
先日オープンした HTML PING WORLD というサイトはクローラを使う必要がない。なぜなら、ユーザが自分で情報を送ってくれるからだ。今後、クローラ以外の情報収集方法を考えていく必要もあるのではないだろうか?例えば、ブラウザはクローラと同じ動きをするわけだから、ブラウザが取得したデータをどこかのサーバに PUT する事でクローラを使わなくてもソースコードを収集できる。取得したソースコードは、検索エンジン会社で共有するのが良いのではないか。
投稿者 Su-Jine : 09:01 | コメント (0) | トラックバック | SEO
2005年07月24日SEO 対策意見交換掲示板 全文検索
Su-Jine の主要コンテンツになっている SEO 対策意見交換掲示板 に 全文検索 を付けた。今までも 検索 はできたが、この検索は 過去ログ を検索することができなかった。はっきり言って使えないという意見が多かったので、ようやく重い腰を上げて 全文検索 を付けた。
ブログを .net に移行したので容量が空いたというのが検索をつけられるようになった大きな要因。しかし、実際にインデックスを作成してみると、インデックスのサイズはそれほど大きくなかった。もっと前からつけられたかも…。
Namazu を使った検索は初めてつけたので、使いにくい点とか、こうした方が良いというアドバイスがあれば連絡ください。
投稿者 Su-Jine : 14:37 | コメント (3) | トラックバック | SEO
2005年07月23日Web 制作業者
先週 Web 制作業者の営業が来た。全部社内でやっているから必要ないと言ったのだが、どうしてもというので話だけでも聞いてみようと思って聞いてみた。
その業者は Yahoo! JAPAN のカテゴリにたくさん登録しますという営業をしてきた。それをやる前に現状を知りたいとのことで、どんなキーワードを狙っているかを話した。
で、その営業が提案してきた内容は「それぞれ狙っているページで新しいサイトを立ち上げる」という内容。まぁ、Su-Jine 内で書くとすれば、SEO の掲示板サイト、ディレクトリサイトなどを別ドメインで立ち上げて Yahoo! JAPAN に申請するというだけ。で、それぞれのサイトを「Su-Jine が運営」という申請をする。そうすると、Yahoo! JAPAN に「Su-Jine」というカテゴリが作成され、そこにたくさんのサイトが登録されるというわけだ。じゃあ、その価格はいくらなのかを聞いてみたが答えない。
その代わりに、リスティング広告などでいくら使っているかを聞いてきたので、まぁ、1 万円くらいじゃないかと答えると、「今回は縁がなかったということで」という事になった。最後にその業者は「毎月 30 万くらいはかかります」と言った。Yahoo! JAPAN のカテゴリに載せる Web サイトを作るのに毎月 30 万ってあり得ない。SEO ならまだしも、Yahoo! JAPAN のカテゴリは毎月変動するわけでもなく、一回載せれば終了。自分で Web サイトを作って 5 万円払えばすむ話 (ビジネスの場合)。ランニングコストはサーバ代だけ。それを毎月 30 万って…。
正直、これが商売になるんだなぁとかなり驚いた。以前、Su-Jine 内で、SEO 業者の報告をお願いした時期もあったが、全く情報が集まらなかったので、その企画は終了した。なんか、価格ドットコムみたいな、ユーザ同士でこういう業者の比較ができるサイトでもあれば面白いかなぁなんて思ったりしている。
投稿者 Su-Jine : 15:00 | コメント (2) | トラックバック | SEO
2005年07月02日3 文字 4 文字ドメインをとる
ドメインは短い方が良いと思う。なんか昔からあるようなサイトのようで。ドメインが長いと覚えてもらえないし、i-mode 端末などで入力するのも大変。
3文字4文字ドメイン名検索 - !JP 日本レジストリサービス というサイトがある。ここは 3 文字ドメインや 4 文字ドメインの空きを検索することができる。試しに、3 文字ドメインのテキストエリアに a と入力し、「検索」ボタンを押す。そうすると検索結果が次のように表示される。
【検索結果】
3 文字で A を含むドメイン名
51.40%(1980/3852)空いてます
3 文字ドメインなんてもうとれないだろうと思っている方も多いだろうが、.jp ドメインの場合は意外に空きが多い。なぜ .jp ドメインはこんなに空きが多いのだろうか?汎用JPドメイン名に登録資格があるからだろう。汎用JPドメイン名の登録に関する追加規約 の第 3 条に下記のような記述がある (汎用 JP ドメイン名登録等に関する規則 の第 8 条よりわかりやすい)。
『第3条(汎用JPドメイン名の登録資格)
汎用JPドメイン名の登録者となることのできる資格を有する者は以下の各号に掲げる者とします。なお、JPRSが定める汎用JPドメイン名登録等に関する規則(以下「登録規則」といいます)の改定等により登録規則と本条の定めに齟齬がある場合、登録規則の定めが優先して適用されるものとします。
(1) 日本国内に住所を有する個人
(2) 日本国内に本店・主たる事務所、支店・支所、営業所その他これに準じる常設の場所を有する法人その他の組織 』
ということで、日本にいる人じゃないと .jp ドメインを取得できないために 3 文字ドメインの空きも多いのだろう。
最近 2 つほど 3 文字ドメインをとってみた。1 つは何かのサービス用。もう一つは何かに使えそうなので。
投稿者 Su-Jine : 14:28 | コメント (3) | トラックバック | SEO
2005年06月21日Ask.jp のクローラ
あるサイトで、ここ 1 週間くらい Ask.jp のクローラが大量にアクセスしてくる。1 秒間に 3 〜 5 アクセスくらいある時もあり、ちょっと邪魔だなぁと思った。これだけアクセスがあってもインデックスされるのが非常に遅いので、Ask.jp のクローラをはじこうかなと思い、Ask.jp のロボット関連ページを見た。
読んでいくと、なぜか全部のロボットをはじく場合しか書かれていない。「サイトを検索結果に表示したくない場合」には User-agent: * と書かれており、そんなことをすると全部のロボットがはじかれてしまう。たいていは User-agent: Googlebot とそれぞれの検索エンジンをはじく方法が書かれているのだが、Ask.jp の説明ページにはそれがない。
そこで、クローラがアクセスしてきたログの URL を見てみた。
ここを見ていくと、「User-agent: Teoma」としてはじくことができるようだ。日本語のページにも書いてもらいたい内容だ。
User-agent: Teoma
Disallow: /
まぁ、拒否するのもちょっとなぁと思っていたところ「Crawl-Delay」を使うと制御ができるとの記述があったので、下記のようにすることにした。
User-agent: Teoma
Crawl-Delay: 3
これで、Ask.jp のクローラは 3 秒以上間隔を開けてアクセスがあるはず。しかし、日米 Ask Jeeves のページには User-agent とのセットで書かれていないので、ちょっと他のロボットに影響が出ないかが心配。Yahoo! のクローラの説明 には User-agent とのセットで書かれているので、Yahoo! のクローラには影響はないだろうが、Google や msn のクローラに影響が出るのは困る。
追記:クロールの頻度が 3 秒以下にならないようなので、やはり Ask.jp は拒否しよう。どうもちゃんと robots.txt の動き通りになってくれないような気がする。
話は変わって、先日特許について話を聞きたくて弁理士に会ってきた。会う前は、「ここをこうすればもっと良いのではないか」、とか、「この方法だともう既にありそうだからこういう切り口で」、とか、「ここじゃなくてここの方が特許になりうるのでは」のようなアドバイスをもらえるものと思っていた。実際にサービスの説明をしたが、「特許となりうる発明とは」というような論点で、特に持って行ったサービスについてのアドバイスはないので、よけい特許性があるのかわからなくなってしまった。弁理士とは、具体的なアドバイスはしてくれないものなのだろうか?
投稿者 Su-Jine : 08:30 | コメント (0) | トラックバック | SEO
2005年06月02日来週以降の Google
来週以降に Google のアルゴリズム変更があるようです。先ほど書いた TrustRank に切り替わるのでしょうか?念のため、本日から「ゴッゴルミニ」の検索結果を毎日保存しておくことにしよう。
投稿者 Su-Jine : 00:00 | コメント (0) | トラックバック | SEO
2005年06月01日TrustRank って?
概要は WebスパムとTrustRank を見るとわかりやすい。で、気になった箇所があったので原文を読もうと思ったわけだが、量が多すぎてちょっと挫折気味 (まだ 2 ページ目の少し)。少しずつ読んでいこう。
ということで全く知りたいところまでたどり着いていないので、見当違いのことを書くかもしれないし、間違っているかもしれない。ここから下は想像によるものなので、参照して記事を書いたりしないで欲しい。
下記のような場合について考える。
A → C → E
↓
F
↑
B → D → G
A は良い Web ページ、B はスパムページと人間が判断したとする。初期ポイントとして A には +100、B には -100 を与えた。良い Web ページから受けるリンクは、そのページのポイントから 20 ポイント引いた値を加える。そうすると C は +80。逆にスパムページは 20 ポイントを加えた値とする。D は -80。順にやっていくと、E は 60、F は 0 (+60 - 60)、G は -60 となる。ポイント順に並べると
・A (+100) → C (+80) → E (+60) → F (0) → G (-60) → D (-80) → B (-100)
この場合はスパムサイトをわざと作成すれば、相手を陥れることが容易となる。例えば B から C にリンクを貼ると順位は下記のような感じだ。
・A (+100) → C (0) → E (-20) → G (-60) → D (-80) → B (-100) or F (-100)
当然順位が変わってくる。このようにスパムサイトからのリンクを減点する方式だと相手のサイトもコントロールできることになるわけで、このようなモデルではなさそうだ (このようなモデルであるべきではない)。
では、加点方式のみとしているのだろうか?要するに B に与える初期値は 0 ポイントで、そこから派生するリンクも全て 0 ポイントをマイナスするというもの。そうすると順位は下記のようになる。
・A (+100) → C (+80) → E (+60) or F (+60) → B (0) or D (0) or G (0)
このモデルの場合は B から C にリンクを貼ったところで減点は無しだ。順位はそのままとなる。これで納得できるかなと思ったが、この場合は PageRank と同じような考えとなる。
『Google は単に票数、つまりリンク数を見るだけではなく、票を投じたページについても分析します。「重要度」の高いページによって投じられた票はより高く評価されて、それを受け取ったページを「重要なもの」にしていくのです。 』
「人間が手動で与えたポイントから派生しているページのみを減点対象とする (上記の例だと B から派生しているリンクのみ減点)」ということも考えてみたが、この場合はスケールしない。Web ページはどんどん変わっていくためだ。
こんな感じで、TrustRank のすばらしさがあまり理解できない。まぁ、実際の論文を全て読んだときにわかるのかもしれないが…。わかりやすく解説してくれるコメントをもらえるとうれしいなぁ。
投稿者 Su-Jine : 23:06 | コメント (0) | トラックバック | SEO
2005年05月31日ゴッゴルミニ イメージ検索
ゴッゴルミニ
- イメージ検索 SEO のテスト (Google イメージ検索で 1 位を狙ってみる)
- <h3> の直下に画像を置くと良さそう?
- 念のため ALT 属性にキーワードを入れてみる
Google のイメージ検索で SEO を検索すると…。ちょっとねぇ…。(18 歳未満、女性は見ない方が良いかも)
投稿者 Su-Jine : 20:30 | コメント (1) | トラックバック | SEO
2005年05月30日PageRank は本当に消えたのか?
いろいろなところで「PageRank が消えた」と騒がれている。
PageRank を表示する URL は下記の通り。
PageRank を表示したい URL と、その URL を何らかの関数で変換した ch 値を引数として渡すと表示されるという物だ。で、今回騒がれているのは上記 URL にアクセスすると「Forbidden」と出るということだ。
通常の検索結果の URL はどうなっているだろうか?例えば、「seo」と検索してみる。
B. http://www.google.co.jp/search?hl=ja&q=seo&lr=
A と B は共に http://www.google.co.jp/search? にアクセスしている。ということは、PageRank を表示させる命令が正常に動いていないのだろう。PageRank を表示する部分で必要なのは、上記で書いたとおり、URL と ch 値。URL に対する ch 値が正しくなければ今回のように「Forbidden」と表示されていた。ということは、ch 値の算出方法が変わっただけではないだろうか?新 ch 値でアクセスできる新ツールバーが提供されれば、今まで通り PageRank が表示される可能性もあるだろう。必ずしも「PageRank が表示されなくなる → 検索アルゴリズムが変更される」というつながりにはならないだろう。
投稿者 Su-Jine : 09:56 | コメント (0) | トラックバック | SEO
2005年05月22日index.html は重要視されている?
index.html が重要視されているという情報をどこかで見たことがある。先日 SEO 対策意見交換掲示板 でも
質問があった。
A. http://www.su-jine.com/seo.html
B. http://www.su-jine.com/seo/
上記の内容であれば、B の方が重要視されるらしいというもの。実際に検証してみたが、index.html だからと言って特別視されているような気はしない。mod_rewrite 等を利用して、B の形式にしたとしても、インデックスはどんどん消えていく場合もある。ファイル名はどちらでもそれほど変わらないのではないだろうか。
投稿者 Su-Jine : 01:09 | コメント (0) | トラックバック | SEO
2005年05月20日AdWords の配置が微妙にかわった?
Google AdWords の表示位置が微妙に変わった。今だけかもしれないが…。
やっぱり一時的なものだったようだ。上下の違いってわかりますか?
投稿者 Su-Jine : 13:54 | コメント (0) | トラックバック | SEO
2005年04月13日Google のインデックス方針変更?
最近 Google のインデックスの方針が変わったように感じられる。クロールの頻度を上げ、クロールしなかったページはどんどんインデックスから削除しているようだ。2005/4/12 に検索すると 2005/3/31 までのキャッシュがほとんどだ (それ以前のキャッシュもたまに見かけるが相当新しい)。
確認の方法は daterange を使った。今までは 2005/1/1 〜 2005/1/31 までにインデックスされたページ を探すことができたが、これが検索できなくなっている。2 月も同様にチェック してみる。やはり検索されない。この現象がいつから始まっているのかを調べてみたが 2004/11/10 ごろからのようだ。それ以前の日付で検索すると検索結果が帰ってくる。例えば 2004/1/1 〜 2004/1/31 等だ。
daterange での検索が正常に処理できていないだけの可能性もあるが…。2004/1/1 〜 2004/1/31 と検索しているのにもかかわらず、2005/3/22 等というキャッシュも見られるためだ。
投稿者 Su-Jine : 00:20 | コメント (0) | トラックバック | SEO
2005年04月05日Google イメージ検索インデックス更新
Google イメージ検索のインデックスが更新されたようだ。今まで「ゴッゴル」でのイメージ検索は 0 件だったが、本日検索したところ 2,340 件ヒットするようになっている。
このイメージ検索での SEO は非常に難しい。今回も実験画像がヒットしなかった。
そういえば、SEO コンテストの専用サーバの提供者が現れた。ホームページ登録ドットコム さん。まだセットアップされていないようだが楽しみだ。以前の記事でも書いたとおり無コムさんのスペースも用意しよう。
投稿者 Su-Jine : 12:22 | コメント (0) | トラックバック | SEO
2005年03月26日Google サイト登録時のサブミッションコード
Google の サイトの登録 / 削除 のページにサブミッションコードがついた。サブミッションコードには「オプション」との記述があり、次のように書かれている。
オプション:手動で送信された URL と自動で送信された URL を区別しやすいように、下のボックスに表示されているとおりに語を入力してください。
このサブミッションコードは SEO 対策意見交換掲示板 でも使っているが、ランダムに画像を表示させ、画像に書いている文字を入力し、正しければ処理を行い、正しくなければ処理を中止するというものである。
現在のところ Google のサイト登録ページにあるサブミッションコードは、入力しなくてもサイトの登録は可能である。
登録処理がどうなっているかを確認してみた。
1. URL, 備考, サブミッションコードを入れて「URL の追加」ボタンをクリック。
2. 下記の URL に GET。
http://www.google.co.jp/addurl/Captcha?q=http%3A%2F%2Fwww.yahoo.co.jp&dq=yahoo&continue=http%3A%2F%2Fwww.google.com%2Faddurl&id=ユニークID&s=&captcha=サブミッションコード&submit=URL+%82%CC%92%C7%89%C1
3. 2 の continue にリダイレクト
http://www.google.com/addurl?q=http://www.yahoo.co.jp&dq=yahoo
ユニーク ID とサブミッションコードは何らかの関数でチェックすることができ、これらが同じでなければ不正な申請の可能性 (ロボットによるもの) があり、同じであれば正しい申請であるということだろう。
ロボットによる申請をスパムと判定するのかは明記されていないが、単に大量の申請がされないようにするためのものではないかと思われる。もしスパムと判定するのであれば、ライバルサイトを蹴落とすことも可能だからだ。
投稿者 Su-Jine : 01:45 | コメント (0) | トラックバック | SEO
2005年03月20日キーワードの関連付け
先ほど、Google イメージ検索 の記事で書いた、「Japan」で検索したのは理由がある。Google で yahoo と検索する と「ZDNet Japan」が 2 位に表示される場合がある。「ZDNet Japan」には当然 Yahoo 等という文字は記述されていない。なぜ「yahoo」で検索したときに上位に表示されるのか。これは第 1 回 SEO コンテストで書いたことがあるが、「Japan」と「Yahoo」が関連付けられているからではないかと思って Japan を検索してみた。Japan で検索した場合、ZDNet Japan は 1 ページ目に表示される。ということは、やはり「Japan」と「Yahoo」のキーワードが関連付けられている可能性が高い。
ブログって意外と容量を食う。サーバの容量もいっぱいになってきているのでサーバをグレードアップするかな。
投稿者 Su-Jine : 15:16 | コメント (0) | トラックバック | SEO
Google イメージ検索
Google イメージ検索と Web 検索を連携 で書いたイメージ検索と Web 検索の連携だが、いつの間にか日本の IP アドレスでも表示されるようになったらしい。
Google で JAPAN と検索する と検索結果の上に 3 つ画像が並んだ。前回の記事で書いたとおり、この画像を確認するには US のプロキシをかませる必要があったが、現在では日本の IP でも問題なく動くようだ。日本語は未だ対応していないらしい。
ただし、これを確認できるのはいくつかのデータセンタのみ。Google の系統が複数あるのと関係があるようだ。
追記
日本語も対応しているようだ。風景を検索する と画像が表示される。まだ日本語で表示されるのは一部の言葉らしい。海、山などでは表示されない。
投稿者 Su-Jine : 14:52 | コメント (1) | トラックバック | SEO
2005年03月04日Google Toolbar 3 beta
先日リリースされた Google Toolbar 3 beta では PageRank が表示されないページが多い。
SEO 診断掲示板 で書かれていた慶應義塾大学のページの ch 値を調べてみた。
◆以前の Toolbar での ch 値
63838549538
◆Google Toolbar 3 beta での ch 値
76399652514
Google Toolbar 3 beta の ch 値でアクセスした場合は 403 エラーとなる。ch 値の算出方法を変更するのだろうか?
そういえば以前募集していた 専用サーバ は集まらないようなので、コンテストページで 広告を募集 することにした。広告がつけば専用サーバも借りられるだろうし、面白いこともできそう。無コムさんがサーバで困っている ようなので、専用サーバを借りたらシェアしても良いかな。Gmail アカウントを招待してくれたのは無コムさんなので。技術者も集まらないようなので自分で作業をするか。
投稿者 Su-Jine : 22:31 | コメント (1) | トラックバック | SEO
2005年02月19日Google の 2 つの検索結果を解明!?
今年に入ってから Google の検索結果が 2 系統存在していた。インデックス数の多い A 系、インデックスの少ない B 系。これらの違いは何なのか?いろいろ調べたところ、次のような事傾向があるようだ。
A 系
・タイトルが短い
・検索説明文は本文から作成されるのが多い
・100KB 制限がある
B 系
・タイトルが長い
・検索説明文は DMOZ の説明文が使われることがある
・100KB 制限がはずれている
ここで重要なのが 100KB 制限である。100KB 制限とは、100KB より大きなページがあった場合、100KB 以降はインデックスされないというものである。それを確認するには次の検索をして欲しい。
検索結果の 1 番上を見ると、URL の右隣に A 系は「101k」、B 系は「473k」となっている。そのため A 系のインデックスでは 100KB を超えた部分に書かれたキーワードでは検索されない。B 系の場合は 100KB 以降に書かれたキーワードでも検索される。A 系ではカウントされなかった 100KB 以降のデータが B 系では計算されるため、検索結果が A 系と B 系で異なるのは当然である。
しかし、インデックス数は A 系の方が多い。これは元々検索結果数を表示するプログラムにバグがあったのではないだろうか。
「the」を検索すると、次のような結果になる。
A 系の検索結果
http://64.233.161.104/search?hl=ja&q=the&lr=
B 系の検索結果
http://66.102.7.104/search?hl=ja&q=the&lr=
A 系では「8,000,000,000 件」、B 系では「3,130,000,000 件」となっている。Google のトップページには「8,058,044,651ウェブページから検索」とあり、「the」だけで 80 億インデックスもあるのはおかしいのではないだろうか?40 億インデックスから 80 億インデックスに変更したときに、検索結果数も単純に倍にしたのだろうか?インデックス数が 40 億の時に「the」を検索したことがあり、そのときには 60 億ヒットした。単純に倍にすると 120 億である。A 系で 80 億ちょうどになるのはそれを超える検索件数がでたときに、80 億と表示するようにつじつまを合わせただけのような気がする。
ということは、B 系が安定したら、B 系の方に検索結果が統一されるのではないだろうか。
投稿者 Su-Jine : 14:53 | コメント (0) | トラックバック | SEO
2005年02月08日Google イメージ検索と Web 検索を連携
INTERNET Watch を見ていると次のような記事を発見。
SEO 対策意見交換掲示板 で Google のイメージ検索のインデックスが更新したと書き込んだが、その時に 11 億イメージがインデックスされたらしい。上記記事に Web 検索とイメージ検索を連携したとあったので、早速試してみた。
上記は、INTERNET Watch で書かれていた「mountains」と検索した結果。画像を表示した方が良いと判断した場合は一番上にサムネイル画像が表示される。普通に「mountains」と検索しても表示されないので、US のプロキシを使うと上記の結果を得ることができる。
掲示板でも書いたとおり、Google のイメージ検索 SEO を何とか解明したい。
投稿者 Su-Jine : 12:44 | コメント (1) | トラックバック | SEO
2005年02月04日Y!Q
米 Yahoo! が発表した新機能 Y!Q。詳しくは Y!Q テスト ページに書いたので、興味があれば見てください。CNET Japan 等でも書かれているが、よくわからないので、サンプルを作ってみました。
投稿者 Su-Jine : 18:47 | コメント (0) | トラックバック | SEO
2005年02月01日NAVER 検索サービス終了? msn.com 正式版?
NAVER の検索サービスが 1 月 31 日をもって終了するという事だったが、先ほどアクセスしても特に変更はない。[ウェブ] 検索がいずれ無くなるのだろう。
→検索サービス終了のお知らせ
msn.com のベータ版が正式版になったようだ。検索結果の右上に、beta の文字列が無くなった。msn の日本語版が提供されたら、Google, YST, msn の争いが激しくなりそう。
→MSN、β公開中の新検索エンジンを正式稼働か?
→米Microsoft、検索エンジン「MSN Search」の正式版〜日本語対応は年内
投稿者 Su-Jine : 16:03 | コメント (0) | トラックバック | SEO
2005年01月26日Google Video のドメイン gvideo.com
CNET Japan を見ていると「グーグル、テレビ番組検索サービス「Google Video」のベータ版を発表」とあった。
下記のようにかかれている。
Google Videoは、テレビ番組のテキストを検索できるエンジンだ。同サービスでは、PBS、Fox News、 C-SPAN、ABC、NBAなどの番組を素早く検索することができる。また放送された内容をその日のうちに検索することが可能だ。
便利なのか便利じゃないのかはよくわからないが、gbrowser.com をとっているのであれば、gvideo.com もとっているんじゃないかと思い、whois で調べてみた。
予想通り、gvideo.com も Google 社が押さえている。しかし、ドメイン取得日が 2002/9/13 とかなり過去のものだ。Google 社が買い取ったのか、前から押さえていたものかはよくわからない。Record last updated on が 2005/Jan/23 22:17:34 となっている。
Registrant:
Google Inc. (DOM-1313680)
1600 Amphitheatre Parkway Mountain View CA 94043 US
Domain Name: gvideo.com
Registrar Name: Markmonitor.com
Registrar Whois: whois.markmonitor.com
Registrar Homepage: http://www.markmonitor.com
Administrative Contact:
DNS Admin (NIC-1467103) Google Inc.
1600 Amphitheatre Parkway Mountain View CA 94043 US
dns-admin@google.com +1.6503300100 Fax- +1.6506188571
Technical Contact, Zone Contact:
DNS Admin (NIC-1467103) Google Inc.
1600 Amphitheatre Parkway Mountain View CA 94043 US
dns-admin@google.com +1.6503300100 Fax- +1.6506188571
Created on..............: 2002-Sep-13.
Expires on..............: 2014-Sep-13.
Record last updated on..: 2005-Jan-23 22:17:34.
Domain servers in listed order:
NS2.GOOGLE.COM 216.239.34.10
NS1.GOOGLE.COM 216.239.32.10
NS3.GOOGLE.COM 216.239.36.10
NS4.GOOGLE.COM 216.239.38.10
投稿者 Su-Jine : 12:09 | コメント (0) | トラックバック | SEO
2005年01月25日Google ブラウザ開発の噂と msn 本格始動
Google がブラウザの開発に乗り出しそうという話は以前からあったようだが、今回 CNET JAPAN の「Firefoxの開発責任者を採用」という記事が出た。
gbrowser.com というドメインは 2004/4/26 に取得したようだが、今回この記事を読んで、Google のブラウザ開発は現実的なものになってきたと考えられる。しかし、ブラウザに関しては、Netscape が完全につぶされた経緯もあるため、Google といえども安全とはいえない。意見交換掲示板 で米 msn がベータ版検索エンジンを投入してきたという記述がある。米 msn で検索してみると、ベータ版と同じ検索結果が表示され、右上に Seach (beta) の文字を見ることができる。
msn が本格的に検索エンジン市場にのりだしてきたわけで、Google つぶしが始まってきたような気がする。Google がブラウザの開発を発表すれば、Longhorn の投入が早くなるのではないだろうか。
OS を握っている Microsoft はやはり強いだろう。Google が OS でも作ればかなり面白くなってくると思われる。
投稿者 Su-Jine : 21:54 | コメント (0) | トラックバック | SEO
2005年01月24日ブログの rel="nofollow"
ちょっと古いネタではあるが、ブログのコメントスパムに対する Google の対策が発表された。
Preventing comment spam
これは単に <a href="http://www.su-jine.com/" rel="nofollow">Su-Jine</a> と rel="nofollow" を付けるとそのリンクは無効になるという内容である。
今のところ今回の SEO コンテストではブログが上位を占めているが、ブログサービスを提供している企業が rel="nofollow" を提供し始めると、今回の SEO コンテストは一気に HTML 優勢になる可能性もある。
しかし、この rel="nofollow" は Google の負けのような気もする。完璧なアルゴリズムでこの問題の対応をして欲しかった。
投稿者 Su-Jine : 12:38 | コメント (0) | トラックバック | SEO
2005年01月21日第 2 回 SEO コンテストは alltheweb の圧勝
先日、第 2 回 SEO コンテストの開催を発表したが、今回は alltheweb のインデックスが一番早かった。
いつから検索されるようになったのかわからないが、13 時間あまりでクロールからインデックスまでされているので、かなりのスピードといえる。さらに alltheweb では 32 件のヒット。YST は 1 件。Google, altavista, msn (beta), msn, YST (.com), Ask.jp, Overture ではまだヒットしない。
2005/1/21 17:00
YST (.co.jp, .com), alltheweb, Altavista, Overture がそれぞれ検索結果が表示されるようになった。YST 系がでだしは好調。
投稿者 Su-Jine : 13:45 | コメント (0) | トラックバック | SEO
2005年01月08日NAVER 検索サービス終了
NAVER が検索サービスを 2005/1/31 で終了するようだ。
→ 検索サービス終了のお知らせ
NAVER は数少ない独自のエンジンでがんばっていたが、とうとう無くなってしまうようだ。上記ページの注意書きにもあるとおり、「ライブ窓、検索窓は貴サイトより削除、ツールバーはアンインストールをしていただきますようお願いいたします。 」とのこと。
上記ページに「NAVER「検索サービス」に代わる、新コミュニティサービスの準備を早急に進めております。 」とあるが、どのようなサービスが提供されるのだろうか?
投稿者 Su-Jine : 01:22 | コメント (0) | トラックバック | SEO
2004年12月26日メールマガジン 2,000 人突破記念
徹底解説SEO!〜誰も教えてくれないSEOの真実〜 が 2,000 人を突破した。1,000 人、1,500 人の時と同じように 1 サイト限定で宣伝を掲載したい。掲載料は無料。
掲載イメージは↓の「爆進!アルバイターズ」のような感じ。今のところ購読者数は 2,121 人。
http://backno.mag2.com/reader/Back?id=0000128713
このメールマガジンは会社で見る方が多いと思うため、応募はアダルトサイト以外のサイトに限ります。応募は su.jine@gmail.com まで。早い者勝ちです。
--- 受付終了 ---
投稿者 Su-Jine : 11:18 | コメント (0) | トラックバック | SEO
2004年12月14日YST のインデックス更新
先日YST 対策というエントリーで、YST で SEO と検索しても Su-Jine が表示されないと書いたが、本日検索してみると 1 ページ目 (13 位) に表示される。いつの間にかインデックスが変わっていたようだ。キャッシュの日付は 12 月 11 日で、特に変更したために上位表示されているわけではない。
スペースを入れたページが検索にヒットするようになって上位に表示されるかみてみたい。
投稿者 Su-Jine : 00:53 | コメント (0) | トラックバック | SEO
2004年12月13日Yahoo! JAPAN 等の掲載に関する診断掲示板
先日、SEO 診断掲示板 を設置したが、Yahoo! JAPAN 等の大手ディレクトリ型検索エンジンへの掲載に関して診断する掲示板を設置したほしいという依頼があったので設置した。
ディレクトリ型検索エンジン掲載診断掲示板
上記掲示板は Yahoo! JAPAN や DMOZ, Looksmart, Jリスティング等の大手ディレクトリ型検索エンジンに掲載依頼する前に、カテゴリ掲載ユーザに診断してもらい、直した方が良い点、アピールポイントの洗い出し等に活用してほしい。あまり利用がないようなら削除する可能性あり。
ちなみに Su-Jine が登録しない条件は下記の通り。
- 同じ URL を登録しようとする場合
例) 下記のように同じサイトを何度も別の URL で登録しようとする場合
http://www.su-jine.com/
http://www.su-jine.com
http://www.su-jine.com/index.html
- アフィリエイトタグそのもの
- リダイレクト用 URL の申請 (申請された URL をクリックすると別サイトに飛ぶ場合)、ドアページの申請 (コンテンツがなく、本サイトへのリンクがあるだけの場合)
- サイトではなくページを申請する行為は OK だが、何度も登録しているにもかかわらず、何度も階層の浅いカテゴリに申請する場合
Su-Jine には今まで 1 万ページ以上の申請があり、すべてのサイトを見ているが、商用サイト (アフィリエイトタグのみで構成しているものではない) で住所、連絡先がないというサイトが多く存在する。アクセスしている人にとっては結構重要な要素であるため、記述した方が良いのではないだろうか?
投稿者 Su-Jine : 00:03 | コメント (0) | トラックバック | SEO
2004年12月12日YST 対策
Google では「SEO」で上位表示されているものの YST では上位表示されていない。Su-Jine のトップページでは「SEO」というキーワードをよく使っている。しかし、YST では上位表示されない。
Su-Jine のトップページで用いているのは「SEO対策」や「SEOツール」等の複合キーワード。Google では「SEO」+「対策」、「SEO」+「ツール」として検索されるため「SEO」でも上位表示されている。しかし、YST 正常に分かち書きができていないようだ。たとえば、「SEO掲示板」と検索すると「ページとの一致 (22件中1〜20件目)」と表示される。Su-Jine 内で用意している「SEO対策意見交換掲示板」がヒットしない。「SEO 掲示板」とスペースを空けて検索すると「ページとの一致 (224123件中1〜10件目)」としてヒットする。この検索結果は仕様なのかバグなのか。
そこで、Su-Jine のトップページを「SEO対策」「SEOツール」などをすべて「SEO 対策」「SEO ツール」としてアップしてみた。これで「SEO」で上位表示できるかどうかチェックしてみたい。
そろそろメールマガジンを書かなければなぁと思って購読者数をみると 2,000 人を突破していた。書きたいネタがあまりないのでどうしようか悩み中。
投稿者 Su-Jine : 17:18 | コメント (0) | トラックバック | SEO
2004年11月23日BIGLOBE で検索結果をチェック
結構有名な話だが BIGLOBE で検索結果をチェックすると、上位サイトとの"距離"を把握することができる。検索結果の左側に |||||||||| のようなオレンジ色のバーを見ることができる。これは 10 段階で表示される。1 位のサイトはオレンジ色の | が 10 個。2 位のサイトは 1 位のサイトと相対評価でオレンジ色の | が表示される。その差が"距離"である。これがあまりにもかけ離れていると追いつくのは難しい。しかし、それほど離れていない場合は、努力次第で追いつくことができる。
これをふまえて BIGLOBE でゴッゴルを検索すると、2 〜 4 位のサイトは | が 8 つ。5 位のサイトは | が 7 つと、いつ順位が入れ替わってもおかしくないことがわかる。1 位のサイトともそれほど大差はなさそうなので、上位争いはかなりの混戦状態といえる (2004/11/23現在)。
前がどれだけ離れているかわからないで対策するのと、前の距離をつかんで対策するのでは気分的にもかなり違う。
投稿者 Su-Jine : 10:50 | コメント (1) | トラックバック | SEO
2004年11月12日ads.msn.com (AdvertisingTechnicalOperations)
現在の msn の検索結果に表示される「スポンサー サイト」は Overture のものである。たとえば「blog」を検索すると、「スポンサー サイト」に現れる URL の形式は下記の通りである。g.msn.com は単にクリック率をとるためのものだろう。
http://g.msn.com/9SE/1?http://www60.overture.com/d/sr/?〜
同じように、msn のベータ版で「blog」を検索すると、「スポンサー サイト」に現れる URL の形式が 2 つ存在する。
1. http://www61.overture.com/d/sr/?〜
2. http://ads.msn.com/ads/adredir.asp?url=〜
1 つ目は今まで通り Overture である。2 つ目は ads.msn.com となっている。http://ads.msn.com/ にアクセスすると「Microsoft AdvertisingTechnicalOperations」と表示される。特に説明らしきものは見あたらない。ads.msn.com をキーワードとして検索すると、スパムメールに関するものが多い。特に新しいものでは無いようだが、msn が独自のリスティング広告を提供していたのは知らなかった。msn の次期バージョンは、リスティング広告もすべて自社開発のものに乗り換えるつもりだろうか?
投稿者 Su-Jine : 11:03 | コメント (0) | トラックバック | SEO
2004年11月11日Google のインデックス 80 億
Google のトップページにある、公式インデックス数が更新されていた。
「©2004 Google - 8,058,044,651ウェブページから検索」
これは明らかに msn のベータ版を意識した更新である。先日 Google で、あるキーワードを検索したところ「約 10,990,000,000 件中」と表示されていた。素朴な疑問だが 80 億ページで PageRank は計算できるのであろうか? 40 億の 2 倍だから、計算時間も 2 倍ということにはならないはずである。
投稿者 Su-Jine : 22:59 | コメント (0) | トラックバック | SEO
2004年10月27日goo 関連ワード
最近 SEO コンテストネタと、goo ネタが多いが、今回も goo ネタを一つ。
「ゴッゴル」というキーワードで SEO コンテストを開催しているが、goo で「ゴッゴル」を検索する と「関連」というアイコンに「SEOコンテスト」が表示される。
この「関連」アイコンをクリックする と goo の説明が表示される。説明は下記の通り。
■「関連ワード」の提示機能
検索キーワードと関連性が高いキーワードを提案します。欲しい情報を探す際のヒントとして使うことで、情報の幅がいっそう広がります。
2004/10/29 現在、Google で「ゴッゴル」を検索するとコンテスト開催ページが 1 番上に表示される。コンテストページは「ゴッゴル」というキーワードは <strong> タグによる 1 つのみ。たぶん、「ゴッゴル」という外部からのリンクもそれほど無いだろう。それなのに 1 番上に表示されるのはどうしてだろうか。
goo の関連キーワードがどこからどうやって取得しているのかわからないが、Google はこの関連キーワード (Google は独自に用意?) も順位に何らかの影響を与えている可能性がある。たとえば、「SEO コンテスト」と「ゴッゴル」というキーワードは類似キーワードと認識し、「SEOコンテスト」で上位に表示されているページは「ゴッゴル」でも上位に表示させ、同様に「ゴッゴル」で上位に表示されているページは「SEOコンテスト」でも上位に表示させているのでないか。また、それらのキーワードで上位表示されているページからのリンクを重要視し、無関係なリンクは軽視するように変更されたのではないかと考えられる。
参考:goo の関連キーワード
| 検索キーワード | goo 関連キーワード |
|---|---|
| ゴッゴル | SEOコンテスト |
| SEOコンテスト | google, ゴッゴル |
| ページランク, イメージ検索 | |
| イメージ検索 | --- |
| ページランク | --- |
![]()
投稿者 Su-Jine : 22:12 | コメント (0) | トラックバック | SEO
2004年10月20日goo のページランク消滅!?
先日 goo のページランク? という記事で、goo にページランクが表示されると記述した。本日、goo で検索したところページランクの項目が消滅していた。goo ヘルプには、まだページランクに関する記述があるため一時的なものだろうか。
投稿者 Su-Jine : 10:47 | コメント (0) | トラックバック | SEO
2004年10月18日第 1 回 SEO コンテスト補足
先日、第 1 回 SEO コンテストを開催する とこのブログ、登録者へのメールで参加を促した。
スポンサーの登録がいくつかあり、とうとう iPod mini が賞品に登場。提供者は「ホームページ登録ドットコム」さん。賞品の獲得方法を少し変更したい。1 位のサイトから順に、スポンサーから提供された賞品の中から好きなものを選べるようにしようと思う。
投稿者 Su-Jine : 14:42 | コメント (0) | トラックバック | SEO
2004年10月17日第 1 回 SEO コンテスト開催!!
ネットのイベントを行ってみたいと Su-Jine 1 周年 の最後の方で書いた。今回 SEOサーチ さんに協力を頂き (Web サーバ・ドメインの無料提供)、第 1 回 SEO コンテストを開催したい。コンテストの詳細は下記の URL をクリック。
コンテスト優勝者には、賞品を用意。もし、2 位以下の賞品を提供しても良いという方は スポンサー募集 から問い合わせ下さい。賞品を提供して頂いた方は、スポンサー用に紹介ページを 1 ページ用意します (スポンサーページの例)。
【追加】 2004/10/23
ブログでコンテストに参加している方から、トラックバックに関する質問が多かったので、ルールを見直しました。SEO コンテストルール の「参加資格とルール」をご覧下さい。基本的な考えは、参加していない方に迷惑がかけないコンテストにしたいということだけです。
前回ルールを少し変えた時、周知を徹底することができませんでしたので、このブログを見た方は、ルールが修正されたことを記事にして頂ければ幸いです。
![]()
投稿者 Su-Jine : 02:00 | コメント (3) | トラックバック | SEO
2004年10月15日Google Desktop Search
Google がデスクトップ検索ツールをリリースした。Google Desktop Search である。以前、Microsoft のローカル PC 内検索で SEO 対策が楽になる? で書いたが、Microsoft も同様の取り組みをしている。Google に先を越されたと行ったところか。
CNET Japan の記事や SEM リサーチ さんの記事に詳しい情報があるが、気になる情報が載っていなかったのでここで掲載したい。
Google Desktop Search はローカル検索であるため、インデックスもローカルに存在するはずである。そこで、どこにインデックスが格納されているかが気になった。調べたところ Windows XP では下記のディレクトリに Google Desktop Search のインデックスが存在する。
C:\Documents and Settings\ユーザ名\Local Settings\Application Data\Google\Google Desktop Search
このディレクトリの容量を見ると 176 MB。かなり大きい。私は C ドライブに OS、D ドライブにアプリケーション、データなどを入れるようにしているため、インデックスが大きくなると C ドライブが圧迫する可能性がある。タスクトレイに常駐するアイコンを右クリックし、Preferences を見てもインデックス作成場所は選択できないようだ。次のバージョンでインデックスの保存場所を選択できるようになっていることを望む。
投稿者 Su-Jine : 13:28 | コメント (0) | トラックバック | SEO
2004年10月13日goo のページランク?
goo で検索しているときに初めて気が付いたのだが、検索結果に「ページランク」という表記がある。
たとえば、Su-Jine を goo で検索する と、[キャッシュ] の左側に [ページランク○] と表記がある。この [ページランク] とは何だろうか?goo のヘルプ には次のようにかかれている。
『6) ページランク
ページランクとは、google社が開発したウェブページの重要度の指数のことです。「多くの良質なウェブページからリンクされているページは、良質なページである」という関係をもとに、あるページから別のページへのリンクを、リンクされたページへの支持投票とみなしてそのページの重要性を判断しています。1 から 10 段階までありますので、あなたが探したい情報が含まれていそうかどうかの 1 指標として参考にしてください。』
これは Google の説明文とほぼ変わらないが、Google では PageRank 5 の Su-Jine が goo で Su-Jine で検索したときは、ページランク10 となる。これは 1 位のサイトが 10 としたときの相対評価であり、1 位のサイトは必ず 10 となる (スパムと判断されていなければ)。同じような機能が BIGLOBE にも存在する。BIGLOBE で同様に Su-Jine を検索する と、左側にオレンジ色とグレーのバーが表示される。goo が表示するページランクと、BIGLOBE が表示するオレンジ色のバーは同じ値を示しているため、これは同じものであると思われる。個人的に goo の方が数値で表示されているのでわかりやすいが、表示される場所は BIGLOBE の方が見やすい。goo の検索結果を加工して BIGLOBE のように左側に表示されるようなツールでも作成しようかと思う。
投稿者 Su-Jine : 08:19 | コメント (2) | トラックバック | SEO
2004年09月21日アクセスの 7% はクローラによるもの!?
先日 Firefox がどれだけ使われているのかを Su-Jine のログを分析した記事を書いた。
そのときに、Firefox が Opera や Netscape よりも比率が高いのも驚いたが、その他のクローラ、巡回ソフト等がアクセスの 15.25% もある方が気になった。
クローラ、巡回ソフトによる 15.25% のアクセスの半数がクローラによるものだと仮定する。アクセスの 7.625% がクローラということになり、1000 アクセスあるページは 76 アクセスがクローラのものということになる。
では 1 ページ 15[KByte]、1000 アクセスある場合、クローラのアクセスによる転送量はどのくらいになるのだろうか?
| 15[KByte] x 76 = 1,140[KByte/日] = 1.14[MByte/日] |
トップページを含めてサイト内に 100 ページあるとすると、クローラだけで 114[MByte/日] の転送量ということだ。1 ヶ月 (30 日) で 3,420[MByte/月] = 3.4[GByte/月] となる。転送量が制限されているサーバではクローラのアクセスだけでアウトである。
Su-Jine のトップページはフレッシュクロールサイトになっているため、トップページ以外のページにも同じだけのクローラによるアクセスがあるとは限らないが、検索エンジンの競争が激化すればするほど (msnbot のリリース、その他の検索エンジンの台頭等)、クローラのアクセスは今以上に増えるだろう。
メールの 7 割がスパムメールであるのと同じように、アクセスの 7 割がクローラによるものになる日が来るかもしれない。
投稿者 Su-Jine : 00:10 | コメント (0) | トラックバック | SEO
2004年09月19日msnbot/0.3
msnbot のクローラがバージョンアップしたようだ。
今までは msnbot/0.11 (+http://search.msn.com/msnbot.htm) であったのが、msnbot/0.3 (+http://search.msn.com/msnbot.htm) となっている。msnbot/0.3 が確認できたのは、2004/09/18 09:43:45 から。2004/09/18 09:34:31 までは msnbot/0.11 であった。
クローラのバージョンアップはステータスの処理を変更したのではないかと考えられる。
ちなみに、YST のクローラは Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp) となっており、バージョンの確認ができないため、クローラのバージョンアップを確認することができない。
投稿者 Su-Jine : 01:06 | コメント (0) | トラックバック | SEO
2004年09月07日Yahoo! JAPAN と All About 業務提携
Yahoo! JAPAN と All About が業務提携を発表。
Yahoo! JAPAN に BIGLOBE 内の コラム記事から探す と同じような機能が付くのだろうか?今までは Yahoo! JAPAN への掲載はアクセスアップ、PageRank アップ、All About への掲載はアクセスアップはあまり期待できず、PageRank アップのためと考えられていた。しかし、Yahoo! JAPAN に BIGLOBE の コラム記事から探す と同等の機能が付くのであれば、All About への掲載も PageRank アップに加えて、アクセスアップが期待できる。
投稿者 Su-Jine : 12:36 | コメント (0) | トラックバック | SEO
2004年09月03日Google 不具合チェックツール
本日、Google 不具合チェックツール と言うツールをリリースした。最近、「Google で検索すると URL しか表示されない。」「自分の URL ではなく、他人の URL が表示される。」という質問が多い。そこで、自分の URL がどのようにインデックスされているかをチェックできるツールを用意した。Google に自分の URL が正常にインデックスされているか、Google ディレクトリ (DMOZ) に登録されているか、PageRank はいくつか等がわかる。
投稿者 Su-Jine : 21:27 | コメント (0) | トラックバック | SEO
2004年08月27日動的だけど静的なページの作成 (PATH_INFO)
前回、mod_rewrite を使用した「動的だけど静的なページ」を今回は php で PATH_INFO を用いて作成する。
実施したいこと
http://exam.su-jine.com/path_info.php?var1=path&var2=info を http://exam.su-jine.com/path_info/path/info.html という URI にしたい。
1. PATH_INFO を取得するには下記のように記述する。
| <?php $query = getenv ("PATH_INFO"); echo $query; ?> |
2. 引数を "/" と "." で分解するには下記のように記述する ("." で分解するのは .html をとるための処理)。
| <?php $var = split ("[/\.]", $query); print_r ($var); ?> |
3. path_info.php/path/info.html から path_info/path/info.html に変更には、.htaccess に次のように記述する (.php と言う拡張子をとる)。
| <FilesMatch "^path_info$"> ForceType application/x-httpd-php </FilesMatch> |
4. これで、http://exam.su-jine.com/path_info/path/info.html にアクセスがあると $var[0] に path、$var[1] にinfo と言う引数が格納される。後は、この引数をチェックし、表示または加工すれば良い。
投稿者 Su-Jine : 00:19 | コメント (0) | トラックバック | SEO
2004年08月26日動的だけど静的なページの作成 (mod_rewrite)
第7回 新着情報公開によるGoogleのPageRank向上支援 で書いた、「動的だけれど静的なページの作成」について。
Su-Jine 内では「動的だけど静的なページ」をいろいろな箇所で使っている。この「動的だけど静的」というのは、PHP や CGI で作成しているのだが、静的な HTML を出力しているように見せる技術である。例えば、http://exam.su-jine.com/mod_rewrite/mod_rewrite.php?var1=mod&var2=100 にアクセスをするのと http://exam.su-jine.com/mod_rewrite/mod/rewrite.html にアクセスをするので、同じ結果を表示させることである。この技術を使うと SEO に非常に有利となる。ここでは PHP で「動的だけど静的なページ」の作成方法を 2 つ紹介したい。今回は mod_rewrite を使用する方法である。
まず、使用しているサーバが .htaccess、mod_rewrite が使えると言う環境である必要がある。
実施したいこと
http://exam.su-jine.com/mod_rewrite/mod_rewrite.php?var1=mod&var2=100 を http://exam.su-jine.com/mod_rewrite/mod/rewrite.html という URI にしたい。
1. 制御したいディレクトリに下記の .htaccess を設置する (ここでは exam/mod_rewrite/ ディレクトリに設置)。
| DirectoryIndex mod_rewrite.php RewriteEngine on RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^([0-9A-Za-z]+)/([0-9A-Za-z)]+)\.html$ mod_rewrite.php?var1=$1&var2=$2 [L] |
2. mod_rewrite.php で引数をチェック、表示、加工等を行う。これで、「動的だけど静的なページ」を作成することが出来る。
投稿者 Su-Jine : 08:55 | コメント (1) | トラックバック | SEO
2004年08月25日Ask.jp
先日 Ask.jp のベータ版が公開された。
少し検索してみたがなかなか面白い。スマートファインダーという機能があり、絞り込みのヒントとなる語句を表示してくれる。seo と検索すると「エンジン 最適化」「エンジン 対策」「Seo 対策」「Seo サービス」「Seo ツール」のリンクが表示される。検索があまり得意でない方でも、自分で考えなくても類語を教えてくれるので、検索効率が上がるだろう。
検索結果で興味深いのは DMOZ に登録しているタイトル、説明文が検索結果に表示される場合があるということだ。Ask.jp で上位表示したい場合は DMOZ に 登録されていると有利となる。DMOZ の加点が他の検索エンジンよりも大きそうであるが、基本的な対策は Google、 YST とほぼ同じだろう。
投稿者 Su-Jine : 17:04 | コメント (0) | トラックバック | SEO
2004年08月22日検索エンジン別アクセス (2004/08/18)
Su-Jine へのアクセスを検索エンジン別にまとめてみた (8 月 18 日のアクセスログの結果)。これは単にデータとして残しておくだけのものである。7 月 30 日のデータはこちら。
| 54.57% | |
| Yahoo! | 19.67% |
| msn | 9.51% |
| goo | 3.91% |
| excite | 3.86% |
| BIGLOBE | 4.24% |
| Infoseek | 1.85% |
| SOHU.COM | 0.00% |
| nifty | 2.28% |
| AOL | 0.00% |
| fresheye | 0.11% |
Google からの訪問者が 5.5 割を占める。次に、検索エンジンの系統別に見た場合をチェックしてみる。Google 系が 7 割を占めている。
| Google 系 | 70.71% |
|---|---|
| Yahoo! | 19.67% |
| Inktomi 系 | 9.62% |
| SOHU.COM | 0.00% |
投稿者 Su-Jine : 22:50 | コメント (0) | トラックバック | SEO
2004年08月19日YST インデックス更新
YST のインデックスが 8 月 15 日あたりに更新された。
Su-Jine の YST 検証ページは 6 月 28 日のキャッシュから 8 月 7 日のキャッシュに切り替わった。
6 月 28 日のページを拾ったクローラのホストに lj1177.inktomisearch.com とある。同様に 8 月 7 日のページを拾ったクローラのホストに lj1177.inktomisearch.com とある。これは偶然だろうか?
YST のクローラは下記の 2 パターンのみ。
A. lj****.inktomisearch.com
B. fj****.inktomisearch.com
上記の月 1 回のインデックス更新用クローラのホストが同一であるというのが偶然ではない場合、lj
****.inktomisearch.com がディープクロール用、fj****.inktomisearch.com がフレッシュクロール用と言う可能性がある。
投稿者 Su-Jine : 00:09 | コメント (0) | トラックバック | SEO
2004年08月12日PageRank の更新はいつ?
8 月 10 日に Google のバックリンクが更新された (参考:PageRank 更新履歴)。
先月の更新で、バックリンクが大幅に増加したため、「バグ」ではないかという意見が多かった。しかし、今回の更新でも、6 月 23 日に更新された時と同じくらいに戻ることはなく、「バグ」ではなく「アルゴリズム変更」である可能性が高くなった。
では、なぜアルゴリズム変更をする必要があるのかを考えてみたい。
2 ヶ月ほど前だと思うが、Google ツールバーが送っている情報、ch 値を求めるアルゴリズムが公開された。この ch 値は URL を、ある関数で変換したものである。その関数を用いると、http://www.su-jine.com/ の ch 値は 63064708400 となる。Google のツールバーは下記のようなリクエストを送っている。
この、ch 値と info: 以降の URL が一致していないと PageRank は返ってこない (Forbidden が表示される)。ch 値のアルゴリズムが公開されると、Google ツールバーは不要となる。従って、Google はこの ch 値を求めるアルゴリズムを変更しているのではないかと仮説を立てた。
PageRank が格納されいているテーブルにもう一つ新しい PageRank 用のフィールドを追加する。そこに、今回のバックリンク更新時に求めた PageRank を格納したとする (ch 値は DB に格納しているか、リクエスト時に URL から算出しているのかわからない)。
| URL | 前回の ch 値 | 前回の PageRank | 新しい ch 値 | 新しい PageRank | http://www.su-jine.com/ | 63064708400 | 5 | … | 5? |
|---|
従って、現在の Google ツールバーのバージョンでは、前回の PageRank を表示するために、PageRank の更新が見えないだけではないだろうか。新しく Google ツールバーが配布され、ch 値を求めるアルゴリズムが変われば、上記のリクエストと異なる ch 値を送り、その ch 値が新しいアルゴリズムで求められたものであれば、新しい PageRank が表示されるのではないだろうか。Google ツールバーのバージョンアップが、実質的な PageRank 更新日となるのではないか。
投稿者 Su-Jine : 20:17 | コメント (0) | トラックバック | SEO
2004年08月10日PageRank をどうしても上げたい
humi さんから、NAVER サポーターは受付中止との情報を頂きました。詳しくはコメント欄をご覧下さい。
「PageRank を上げたいけど、PageRank が高いサイトからのリンクをもらうのは難しい。どうすればよいだろう?」という方への情報。
NAVER という検索エンジンがある。SEO を考えている方なら知っているだろう。ここが、NAVER サポーター を募集している。
NAVER のサポーター募集ページに、下記のような説明がある。
| 方法は簡単、(1)相互リンク、(2)検索窓の導入のどちらかの方法でNAVERへリンクをするだけ。その後は、NAVERのwebmaster宛てに、リンクの連絡とサポーターページへの掲載を連絡頂ければOKです。 |
個人サポーターになると PageRank 5 からリンク をもらえることになる (2004 年 8 月 10 日現在)。さらに、個人サポーターは 2004 年 8 月 10 日現在、48 サイトしかない。PageRank の分配に関する考え方は、第14回 トップページ相互リンクの落とし穴 で書いてあるので参考にして欲しい。
PageRank をどうしても上げたいと言う方は NAVER サポーターになってみてはいかがだろうか?
ちなみに Su-Jine サポーター も存在する。これは、Su-Jine が定期的に検索したり、アクセスログをチェックしているときに、Su-Jine をたくさん紹介してくれているサイトがあればサポーターとして紹介するためのものである。2004 年 8 月10 日現在、PageRank は 3。
投稿者 Su-Jine : 00:16 | コメント (1) | トラックバック | SEO
2004年08月07日画像にも PageRank はつくか?
先日 Google のイメージ検索を使ってみた。
このイメージ検索で検索される画像はどうやって検索にヒットするようにしているのだろうか。一番簡単なのは、画像のファイル名と ALT 属性をデータベース化すれば良い。しかし、検索されている画像にはファイル名に検索キーワードも入っていない、 ALT 属性がついていない画像も多い。これらは前後の文脈から判断してインデックスしているようだ。
では、どのような順序で並んでいるのだろうか?実は画像にも PageRank がつくのではないかと考え実験してみた。PageRank をチェックするには URL と URL をハッシュ化した値 (ch 値) が必要となる。画像にも URL があるため、当然 ch 値もあるはずである。
PageRank を調べる ch 値
早速 PageRank を知るために ch 値を調べたところ、http://www.su-jine.com/su-jine.gif の ch 値は 6244846521 のようだ。その ch 値を元に調べてみた。
http://www.google.co.jp/search?client=navclient-auto&ch=6244846521&q=info%3Ahttp%3A%2F%2Fwww.su-jine.com%2Fsu-jine.gif
PageRank がある場合は <RK> と言う値があるのだが、 <RK> はない。やはり PageRank はついてはいないようだ。実験した後に、よく考えてみると画像に PageRank がつくことはないと言うことがすぐにわかった。PageRank はリンクの関係を計算するものである (第15回 PageRank (ページランク) の通説と事実)。画像からは発リンクはない。そのため、画像に PageRank がつくことはない。
上記の Su-Jine の画像は前後を「PageRank」「ch」を多く記述した。あえて、ALT 属性は記述していない。これは前後の文脈から、画像をどのようにインデックスかを調べるためである。「PageRank ch」をイメージ検索 検索したときに上記の画像がヒットすれば、前後の重要なキーワードから画像を判断していると言うことがわかる。
投稿者 Su-Jine : 20:06 | コメント (0) | トラックバック | SEO
2004年08月06日Yomi-Search 登録に関する問題点
Yomi-Search に登録するのは SEO 的に意味があるかどうか、第13回 HTML 形式の Yomi-Search は SEO 対策になりそう で書いたことがある。
最近、SEO 対策意見掲示板 で YST で検索すると、Yomi-Search の URL が、自分のサイトよりも上に表示される場合があり困っている、という書き込みが多い。
なぜ、このようなことが起きるのだろうか?具体的に解説したい。
Yomi-Search は登録しているサイト (C) にジャンプするときに、何回ジャンプされたか等をカウントする機能がある。その機能があるため、一度 CGI ファイル (B) を経由してから目的のサイト (C) を表示する仕組みになっている。問題となっているのは C よりも B の方が YST で上位に表示されると言うことだ。
A. Yomi-Search の設置ページ
B. Yomi-Search のジャンプ回数カウントページ
C. 目的のページ
ここで、ロボットの動きを説明する。
I. まず、クローラが 2 番の URL にアクセスをする。
| ID | クロールページ | ソースコード |
|---|---|---|
| 1 | http://www.su-jine.com/ | <html>1 のソース</html> |
| 2 | http://www.su-jine.com/cgi/yomi.cgi?mode=kt&kt=01 |
II. アクセスしたときに HTTP ステータスコードが 200 OK であれば、ソースコードを取得する。
| ID | クロールページ | ソースコード |
|---|---|---|
| 1 | http://www.su-jine.com/ | <html>1 のソース</html> |
| 2 | http://www.su-jine.com/cgi/yomi.cgi?mode=kt&kt=01 | <html>2 のソース</html> |
III. ソースコードの中にあるリンクを抽出し、DB に格納する。
| ID | クロールページ | ソースコード |
|---|---|---|
| 1 | http://www.su-jine.com/ | <html>1 のソース</html> |
| 2 | http://www.su-jine.com/cgi/yomi.cgi?mode=kt&kt=01 | <html>2 のソース</html> |
| 3 | http://www.su-jine.com/cgi/rank.cgi?mode=link&id=1&url=http://www.su-jine.com/ |
ロボットは単純な動きをする。ただし、3 番目の URL にアクセスしたときに、II の 200 OK を返さないために Google と YST では動きが異なる。では 200 OK を返さないときの II を解説する。3番目 の URL にアクセスをすると、HTTP ステータスは 301 Moved Permanently か 302 Found となる。それぞれで動きが違うので、それぞれ説明したい。
◆ Google
II-301. アクセスしたときに HTTP ステータスコードが 301 Moved Permanently であれば、Location で指定された URL に DB を上書きする。
| ID | クロールページ | ソースコード |
|---|---|---|
| 1 | http://www.su-jine.com/ | <html>1 のソース</html> |
| 2 | http://www.su-jine.com/cgi/yomi.cgi?mode=kt&kt=01 | <html>2 のソース</html> |
| 3 | http://www.su-jine.com/ | 1 へ移動 |
II-302. アクセスしたときに HTTP ステータスコードが 302 Found であれば、Location で指定された URL にアクセスし直す。アクセスし直した先が 200 OK を返すとソースコードを取得する。
| ID | クロールページ | ソースコード |
|---|---|---|
| 1 | http://www.su-jine.com/ | <html>1 のソース</html> |
| 2 | http://www.su-jine.com/cgi/yomi.cgi?mode=kt&kt=01 | <html>2 のソース</html> |
| 3 | http://www.su-jine.com/cgi/rank.cgi?mode=link&id=1&url=http://www.su-jine.com/ | <html>1 のソース</html> |
結論:Google で検索した場合、301 でリダイレクトされている場合は、1 のソースコードは 1 しか持っていないため、検索にヒットするのは 1 のみである。302 でリダイレクトされている場合は、1 のソースコードを 1, 3 が持っているため、検索にヒットするのは 1, 3 がヒットする。同じソースコードであるため、場合によっては本当のサイトがミラーサイトとして、検索結果に表示されなくなる。
◆ YST
II-301. アクセスしたときに HTTP ステータスコードが 301 Moved Permanently であれば、Location で指定された URL にアクセスし直す。アクセスし直した先が 200 OK を返すとソースコードを取得する。
| ID | クロールページ | ソースコード |
|---|---|---|
| 1 | http://www.su-jine.com/ | <html>1 のソース</html> |
| 2 | http://www.su-jine.com/cgi/yomi.cgi?mode=kt&kt=01 | <html>2 のソース</html> |
| 3 | http://www.su-jine.com/cgi/rank.cgi?mode=link&id=1&url=http://www.su-jine.com/ | <html>1 のソース</html> |
II-302. アクセスしたときに HTTP ステータスコードが 302 Found であれば、Location で指定された URL にアクセスし直す。アクセスし直した先が 200 OK を返すとソースコードを取得する。
| ID | クロールページ | ソースコード |
|---|---|---|
| 1 | http://www.su-jine.com/ | <html>1 のソース</html> |
| 2 | http://www.su-jine.com/cgi/yomi.cgi?mode=kt&kt=01 | <html>2 のソース</html> |
| 3 | http://www.su-jine.com/cgi/rank.cgi?mode=link&id=1&url=http://www.su-jine.com/ | <html>1 のソース</html> |
結論:YST で検索した場合、301, 302 に関わらず、1 のソースコードを 1, 3 が持っているため、検索にヒットするのは 1, 3 がヒットする。同じソースであるため、順位付けで本来のサイトよりも Yomi-Search のアドレスの方が上に表示される場合がある。
Yomi-Search は Google にとってはメリットはありそうだが、古いバージョンの Yomi-Search では 301 ではなく、302 でリダイレクトされているため注意が必要だ。YST は 301 も 302 も同じ処理をするため、本来のサイトよりも上位に表示される場合がある。
HTTP ステータスを返すのは、Yomi-Search を設置しているサーバであるため、登録者がステータスコードをいじることはできない。また、クローラが Location で指定された URL にアクセスするときに REFERER に元の URL を設置してアクセすることもない。
では、登録する URL を変えてみてはどうだろうか?例えば、Yomi-Search に登録する URL を http://www.su-jine.com/redirect.php 等とする。この URL は自分のサイトであるため、クローラの制御も可能である。YST のクローラが redirect.php にアクセスがあったら空白ページを表示する。それ以外は 301 で http://www.su-jine.com/ にリダイレクトする。こうすれば、YST で Yomi-Search の方が上に表示されることはなくなるはずである。
投稿者 Su-Jine : 00:38 | コメント (3) | トラックバック | SEO
2004年08月03日Yahoo! JAPAN の YST はディレクトリ (カテゴリ) を優先する?
以前 CNET JAPAN で見た記事を何気なくもう一度読み返してみた。
その中に気になる一文があった。
| いまやりたいと思っているのは、Yahoo! JAPANのディレクトリに登録されているサイトの情報をキーワード検索の結果表示のパラメータとして使うこと。先ほど橋本さんがおっしゃていた、インターネットのメジャーサイト一覧のようなものがあるとする。クエリーがメジャーサイトとマイナーサイトどちらにも同じくらいヒットしているとしたら、メジャーサイトから情報を引き出した方がなんとなく気持ちよかったいいんじゃないか、そういうパラメーターとしてディレクトリのデータは使えるのかもしれないと。つまりページの優先順位にディレクトリの情報を反映させるという可能性は考えられるでしょうね。 |
上記の文章で気になるところは、「いまやりたいと思っているのは…」という箇所。「いまやりたいと思っている」と言うことは、5 月 31 日のリリース当初は「ディレクトリ優先ではない」と考えられること。それ以降、Yahoo! JAPAN での検索結果が大幅に変わったと感じないため、現在は「ディレクトリ優先をしていない」と言うことになるのではないだろうか。
しかし、上記引用部分の最後にもあるとおり、今後は確実にディレクトリに登録されているサイトの優先度は高くなっていくだろう。商用サイトであれば、出来るだけカテゴリへの登録をした方が良い。
投稿者 Su-Jine : 00:08 | コメント (0) | トラックバック | SEO
2004年08月01日検索エンジン別アクセス (2004/07/30)
Su-Jine へのアクセスを検索エンジン別にまとめてみた (7 月 30 日のアクセスログの結果)。これは単にデータとして残しておくだけのものである。
| 60.77% | |
| Yahoo! | 13.71% |
| msn | 4.76% |
| goo | 4.72% |
| excite | 4.52% |
| BIGLOBE | 4.31% |
| Infoseek | 2.94% |
| SOHU.COM | 2.38% |
| nifty | 0.93% |
| AOL | 0.93% |
| fresheye | 0.04% |
Google からの訪問者が 6 割を占める。次に、検索エンジンの系統別に見た場合をチェックしてみる。Google 系が 8 割を占めている。
| Google 系 | 79.11% |
|---|---|
| Yahoo! | 13.71% |
| Inktomi 系 | 4.80% |
| SOHU.COM | 2.38% |
投稿者 Su-Jine : 20:04 | コメント (0) | トラックバック | SEO
2004年07月30日Microsoft のローカル PC 内検索で SEO 対策が楽になる?
Microsoft が ローカル PC 内のファイルを検索する技術を披露した。
CNET Japan のニュース:マイクロソフト、多数の文書フォーマットに対応する検索ツールを初披露
この検索技術を、時期 OS Longhorn に搭載する予定であったが、このローカル PC 内のファイル検索は Longhorn 出荷前に提供される可能性があるようだ。Windows のアップデートなどで配布されると言うことだろうか。
この技術は Web の検索 (MSN の次期バージョン) にも使われるとされているため、非常に興味深い。もし、このローカル検索が Web 検索と同じアルゴリズムを使い、現在のローカル検索のようにヒット順や名前順ではなく、検索順 (重要度順) で結果が表示されるようであれば、SEO を施すのが非常に楽になるのではないだろうか。
Web にアップする前に、ローカルでファイルを検索し、どのような順位になるかを検証すれば、だいたいのアルゴリズムがわかってしまうだろう。ファイルがクロールされなくても判断できるため、アップする前にかなりの対策を施せる。また、検索モジュールを逆アセンブルされてしまったら、ある程度どころか全ての検索アルゴリズムがわかってしまうのではないだろうか。
今後、どのような形でこの検索技術が提供されていくのか非常に楽しみである。
投稿者 Su-Jine : 13:55 | コメント (0) | トラックバック | SEO
2004年07月29日Yahoo! JAPAN のドメイン内検索について
無コムのブログ で書かれてきた Yahoo!Jの変なクセ 中級ウェブマスターにとって役立つサイトは? について。
上記のブログで、Yahoo! JAPAN のドメイン内検索について書かれていた。Yahoo! JAPAN でドメイン内検索をした場合は最高 2 件までの表示であると書かれている。確かに、Yahoo! JAPAN で「site:www.su-jine.com su-jine」と検索すると「ページとの一致 (2件中1〜2件目)」の表示になる。米 Yahoo! ではどうだろうか?同様に「site:www.su-jine.com su-jine」で検索してみる。「Results 1 - 20 of about 22,100」と表示される。
もう一度、Yahoo! JAPAN の検索結果に戻ってみる。検索結果の横に [www.su-jine.com から検索] というリンクがある。それをクリックすると、「ページとの一致 (3509件中1〜20件目)」と表示される。
このとき URL を見てみると次のようになっている。
http://search.yahoo.co.jp/bin/query?p=su-jine&hc=0&hs=0&domain=www.su-jine.com&h=p
引数を見ると domain=www.su-jine.com となっている箇所がある。本来のドメイン内検索はこちらの方が正しいのではないだろうか?
通常の「site:www.su-jine.com su-jine」による検索結果はなぜ 2 件までの表示にしているのだろうか?Yahoo! JAPAN の方針として、上位 2 件に入る検索結果が求める検索結果に一番近いという仮定でそのようにしているのか?それともバグなのだろうか?
投稿者 Su-Jine : 11:13 | コメント (0) | トラックバック | SEO
2004年07月27日www 付き・なし の URL どっちに統一するべきか?
www があっても、なくても同じページを見られるサーバがある。
これはどちらかに統一するべきだと、第 1 回 http://www.su-jine.com/とhttp://su-jine.com/は同じ? で書いた。
基本的には www 付きの URL で統一するのが望ましい。なぜなら、Yahoo! JAPAN に登録された場合、www 付きの URL で登録されるからである。しかし、全てが www 付きの http://www.su-jine.com/ でリンクを張ってくれるとは限らず、www なしの http://su-jine.com/ とリンクを張られる場合もある。この場合、コラムでも書いたとおり、http://www.su-jine.com/ と http://su-jine.com/ は別々のページと Google は認識するため、リンクが分散してしまう。これでは SEO 的にかなりもったいない。では、どうすれば良いだろうか?
条件はあるが、http://www.su-jine.com/ または http://su-jine.com/ のどちらかに強制する方法がある。
.htaccess に次のように書くと良い。
RewriteEngine on
RewriteCond %{HTTP_HOST} ^(su-jine\.com)(:80)?
RewriteRule ^(.*) http://www.su-jine.com/$1 [R=301,L]
これは、http://su-jine.com/ は http://www.su-jine.com/ に永久的に移動しますと言う記述である。そのため、http://su-jine.com/ へのリンクは、http://www.su-jine.com/ に反映されるため、全てのリンクを吸収することが出来る。
既に、www なしの http://su-jine.com/ で統一している場合は、.htaccess に次のように書くと良い。
RewriteEngine on
RewriteCond %{HTTP_HOST} ^(www\.su-jine\.com)(:80)?
RewriteRule ^(.*) http://su-jine.com/$1 [R=301,L]
これで、Yahoo! JAPAN に http://www.su-jine.com/ と登録されている場合でも、リンクが分散することはない。
投稿者 Su-Jine : 00:10 | コメント (0) | トラックバック | SEO
2004年07月25日日本語ファイル名は有効か?
ファイル名やドメインなどに希望のキーワードを入れると良い。
例えば、「seo」と言うキーワードで上位表示したい場合は、ドメインやファイル名に「seo」を入ると、そのファイル名も検索対象になる。
しかし、日本語はどうだろうか。例えば、「アフィリエイト」というキーワードで上位表示を目指している場合、ファイル名を「affiliate.html」等としても全く意味がない。なぜなら「アフィリエイト」を「affiliate」と関連づけて検索してくれることはないからである。
では、「アフィリエイト.html」は有効だろうか?意外と知られていないが、日本語のファイル名も有効である。
例えば、Google で「アフィリエイト」を Su-Jine のドメイン内検索 してみる。ファイル名に「アフィリエイト.html」というファイルの存在が確認できる。
単純にファイル名を「アフィリエイト.html」としても文字化けするため、「アフィリエイト」を Google で検索し、URL の "q=" 以降の文字列をコピーしてファイル名に付ければ良い。
「アフィリエイト」は「%E3%82%A2%E3%83%95%E3%82%A3%E3%83%AA%E3%82%A8%E3%82%A4%E3%83%88」となる。従って、「アフィリエイト.html」というファイルを作成したい場合は、「%E3%82%A2%E3%83%95%E3%82%A3%E3%83%AA%E3%82%A8%E3%82%A4%E3%83%88.html」となる。
どなたかトラックバックを送ってくれるとうれしいです。まだ、誰からもトラックバックを受けていないので…。
投稿者 Su-Jine : 12:36 | コメント (2) | トラックバック | SEO
2004年07月23日Google で URL 検索時に URL しか表示されない現象
Su-Jine の掲示板で良く来る質問に次の質問があります。
・サイト名で検索しても結果に表示されなくなってしまいました。
・URLのみ表示されるようになってしまいました。題名とか?説明文など今までは表示されていたのに,,
・タイトルなしでURLだけ表示されています。
通常 Google で URL を検索すると、サイトの説明が表示されます。
しかし、上記の質問は URL で検索したときに URL のみの表示になり、サイトの説明が表示されないという不思議な状況です。その状態にあるサイトを調べてみたところ、気が付いた点がありますので書きたいと思います。
ch 値がわかっている場合に このように検索する と、XML での応答があります。
この、XML の応答を見ると、<R N="1" L="1" MIME="text/html"> という箇所があるのですが、URL しか表示されないページに共通することとして、<R N="1" MIME="application/octet-stream" L="1"> となっています。また、<LANG>ja</LANG> と言う箇所が、<LANG>un</LANG> となっています。
これは Google がこのページを処理するときにバイナリデータとして扱っているために、サイト名や内容を正しくインデックス出来ていないために起きる現象だと思います。これを直すには、Google が正常にインデックス処理をしてくれるまで待つしかなく、サイト運営者側でどうにかなるものではありません。
同じような現象になっている方は、復活するまでサイトの充実、相互リンクに励みましょう。





