2007年01月11日

Googleページランクチェックツールの更新

今まで、Googleページランクチェックツールを提供していたが、こちらは ch 値を知らなければチェックできなかった。そこで ch 値を自動で取得してチェックできるバージョンを用意。下記の URL から利用できる.

Googleページランクチェックツール(自動でch値を取得)

こちらは URL だけを入力すればサーバ毎に PageRank をチェックできる.2, 3 日前から更新が始まり、かなりのサーバで更新済みのようだ。

投稿者 Su-Jine : 16:51 | コメント (0) | トラックバック | SEO

2006年12月07日

googleoff/googleon タグは Google には無効

フォーラムで Adobe や asahi.com のページに、<!--googleoff: index--> <!--googleon: index-->と言うタグがあり、これは SEO に有効なのかという書き込みがあった。

googleoff や googleon で調べると、それらしきページを見つけることが出来る。ただし、Google 内にはこのタグについて説明はない。

上記ページを見ると、メニューやフッタ等の共通部分を Google のインデックスから排除するような内容になっている。たぶんこの記述を見ていろいろなブログで「<!--googleoff: index-->ここは検索されない<!--googleon: index-->と使います」のような書き込みがある。しかし、実際の Google では「ここは検索されない」も検索されてしまう。

これは「Google Search Appliance」用のタグであり、通常の Google 用のタグではないだろう。なので、これを SEO に使ったり、一般公開している Web サイトに使うのは意味がない。Adobe や asahi.com は社内で
Google Search Appliance を使っているため、このタグがあるのだろう。


現在ポイ探でデータベースの全文検索を導入しようと思っているが、お金があるなら Google Search Appliance と言う選択しもあるのかと思った。ただ、そんなにお金はかけられないため、MySQL の全文検索を使おうと思う。通常 LIKE で検索すると何十万レコードもあった場合はレスポンスが悪くなるが、MySQL の FULLTEXT インデックスを使うと解決できそう。

ただし、ちょっと面倒な処理を入れる必要があるようだ。実際に導入するときの手順などはまた機会を見て書こうと思う。

投稿者 Su-Jine : 20:58 | コメント (0) | トラックバック | SEO

2006年10月14日

MSRBOT (http://research.microsoft.com/research/sv/msrbot/) とは?

最近 MSRBOT (http://research.microsoft.com/research/sv/msrbot/) と言うクローラによるアクセスがある。特に何の目的でクロールしているのかが書かれていない。

ログを調べてみたところ、9 月 28 日頃からアクセスがあるようだ。そのころは MSRBOT となっていたが、10 月 12 日頃から MSRBOT (http://research.microsoft.com/research/sv/msrbot/) と URL が付いている。Microsoft が Vista 発売を前に何か動いているのだろうか?

投稿者 Su-Jine : 12:11 | コメント (0) | トラックバック | SEO

2006年09月25日

最近のクローラは…

先日、Baiduspider に関する記事を書いたが、最近他にもよくわからないクローラが回ってくる。

User Agent が「Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.0.3705; .NET CLR 1.1.4322)」という一見クローラには見えないアクセスもある。このクローラの IP アドレスは 208.66.195.X と 208.66.194.X のアドレスだ。ブラウザのふりをしているが明らかにクローラの動きをしている。

また、User Agent にタグを書いているクローラもあらわれた。アクセス解析のページに認証を設けていないサイトが多く、このようなアクセス解析ページから大量にリンクをもらうと言った手法だろうか。

BecomeBot もそうだが、REFERRER を残していくので、クローラなのか人間のアクセスなのかなかなか判断がしにくい。

robots.txt でクローラをはじく方法もあるが、どうも robots.txt は限界に来ているような気がする。hosts ファイルのイメージだろうか。hosts ファイルでドメインの管理は限界に来て DNS に移行された。robots.txt もいちいち全サイトに導入するのは大変なので、robots.txt を一元管理できる仕組みが欲しいところだ。

投稿者 Su-Jine : 15:26 | コメント (0) | トラックバック | SEO

2006年08月01日

goo ブログ除外検索

goo がブログを除外して検索できるオプションを付けた。どこでブログと判断しているのかわからないが、RSS を配信している「ポイ探」はブログとして扱われているようだ。Su-Jine 本体は RSS を配信していないが、こちらもブログとして扱われている。RSS だけ見ているのであれば CNET 等も排除されそうな気がするが、こちらは排除されていない。

ブログフィルタの説明文には、完全にブログを検索結果から消すことはできないと書いてあるが、ブログではないサイトがフィルタに引っかかると言うことについては書かれていない。goo に連絡してみようか。
<ブログを含まない(ブログフィルター)>
検索するキーワードによっては、ウェブ検索結果に多数のブログが含まれる場合があります。そのような場合で、検索結果をブログ以外のサイトのみに絞りたい際にこの機能を利用してください。『ブログフィルター』の左のチェックボックスをチェックした状態で、『以上の条件で検索』をクリックすると、ブログサイトが省かれたウェブ検索結果が表示されます。なお、検索結果右側に表示される「ブログ検索」については、そのまま表示されます。 ※本機能はブログを完全に省くものではなく、主なブログサイトをフィルタリング(減らす)するための機能です。
日々機能改良を行っておりますが、検索キーワードによってはブログが省かれない場合もございますので、あらかじめご了承ください。

投稿者 Su-Jine : 11:11 | コメント (0) | トラックバック | SEO

2006年07月28日

Google の類義語処理

Google の類義語処理が追加された時期というのはいつからでしょうか (意外と昔から追加されていたものかも)?

Google で 2 つ以上のキーワードを入れた場合に限り、類義語でも検索をするようになっている事に最近になってから気がついた (フォーラムでも類義語については書かれている)。

例えば、「転職」で検索すると「転職」を含む検索結果が表示される。しかし、「アルバイト 転職」と検索すると、類義語も検索対象となっているようだ。「アルバイト 転職」の場合は、「求人」「バイト」なども検索結果が太字となっている事からもそれがわかる。

「転職」で上位表示すれば「求人」でも上位表示されると言うことになる。SEO は楽になるような気がするが、類義語が検索対象になるとライバルが増えることにもなる。

地域名を検索対象に含めて上位表示を狙っている人の場合は、今までよりも楽になりそうだ。「東京都」と「東京」は別のキーワードだが、2 語以上で検索する場合は同じように扱われているようなので、2 つのキーワードをちりばめる必要もなくなる。

投稿者 Su-Jine : 15:20 | コメント (0) | トラックバック | SEO

2006年07月23日

Google のヘルプから「補足結果」の解説が消えた

最近は全然 SEO のことを気にしていなかった。ポイ探のアクセスも伸び悩んでいるので、SEO のことも考えようと思っていたところ、昨日あたりから Google の検索結果が微妙に変わっているような気がして少し調べていた。分かち書きが何か変わったのか、今まで 1 件しか表示されていなかったキーワードが、40 万件とかいう結果を返している。なぜ一気に 40 万件も増えたのかとみていると、1 件目以外はすべて「補足結果」と表示され、そのキャッシュをみると、ほとんどが「これらのキーワードは、このページにむけて張られているリンクに含まれています」となっている。

チェックしたキーワードの形は「○△△□」といったキーワード。○+△△+□という分かち書きになっている。で、補足結果になっていない 1 件は「○△△□です。」のような文章で、補足結果になっているページは「△△□は○だ。」のような文章だ。

ここで、補足結果の解説が Google のヘルプに掲載されていたはずなので、検索したところ補足結果の解説がヘルプから消えている。

補足結果の解説ページのキャッシュ画像 ヘルプでの「補足結果」の検索結果画像

キャッシュは 7/16 なので、それまでは補足結果の解説があった。昨日あたりから検索結果が微妙に変わったのと何か関係があるのかもしれない。

投稿者 Su-Jine : 01:03 | コメント (2) | トラックバック | SEO

2006年06月14日

日本独自の検索エンジン

毎日新聞の「<検索エンジン>日本の30社・機関が独自開発へ」と言う記事について。日本独自の検索エンジンを作るというのは良い傾向だと思う。現在の主要検索エンジンは、すべてが米国製。日本にも優秀な技術者がいるだろうし、優秀な人も数多くいる。米国の検索エンジンに負けないくらいのもの出来るはず。

個人的に検索エンジンを作りたいなぁと思っていた時期もあった。さすがに個人レベルで作成できるものではないが、ちょっとしたアイディアもある。このプロジェクトで意見を採り上げてくれるなら意見を送ってみようと思う。

投稿者 Su-Jine : 14:51 | コメント (4) | トラックバック | SEO

2006年06月03日

「地底人の秘密」の宣伝方法

最近は「検索エンジンで検索して」というようなテレビ CM や広告が多い。現在は FMV の CM で「地底人の秘密で検索」(←これであってる?) というのが放送されている。

雑誌の広告や中吊りでも「○○を検索」とあるが、 URL を表示したりするよりもアクセスが簡単だからこういう CM が多くなってきているんだろう。しかし、検索エンジンに依存しているため、確実に 1 番上に表示することができるわけでもない。また、アクセスを増やすためだけにそのキーワードで最適化するサイトも出てくるだろう。Overture では全く関係の無いサイトが広告を出している。

「○○で検索してね」というのは結構危険な宣伝方法ではないだろうか。

投稿者 Su-Jine : 20:02 | コメント (4) | トラックバック | SEO

2006年05月10日

MSN を Yahoo! に売却?

ちょっと古いニュースだが、「MicrosoftがYahoo!に出資交渉――米紙報道」というニュースについて。

この中に気になる一文が
『MicrosoftとYahoo!は過去1年で、可能な選択肢について交渉を行ってきたと同紙。MicrosoftがオンラインネットワークのMSNをYahoo!に売却し、Yahoo!の少数株を取得することも考えられると伝えている。』

MSN を Yahoo! に売却ってかなり衝撃的だ。この「オンラインネットワークの MSN」というのはどこのことを言っているのだろうか?単純にポータルということなのか、ポータル + 検索エンジンという事なのか。後者であれば、Windows Live (beta)start.com 等はどうなるのだろうか。これらの検索エンジンは MSN と同じ結果を返している。以前のニュースで Google しのぐ検索エンジン? というのは、現状の MSN とは全く異なるものなのだろうか?

投稿者 Su-Jine : 23:28 | コメント (0) | トラックバック | SEO

2006年04月03日

どこからもリンクされていないページがクロールされる

ポイ探」というドメインは、去年の 12 月に取得したわけだが、このドメインはどこからもリンクされていなかった。にもかかわらず、YST, Google はリリース前にクロールしていったわけだ。特に YST で「ポイ探」を検索 すると既に 76 件ヒットしている。Google のクローラも何度か訪れたが、Google の方はトップページのみインデックスされていた。クロール自体は下位のページもクロールしていたが、トップページ以外はインデックスされていなかった。

Google の場合はツールバー経由で新規ページを見つけると言うことも可能だが、YST, msn, Google の URL 申請ページは機能しているのか (2) を見る限りでは、ツールバー経由のみではロボットはアクセスしてこないようだ。YST はツールバーをインストールしていないので、YST がこのドメインを知るはずがない。ということは、新しく取得されたドメインをチェックしているということだろうか。もしドメインの whois 情報までチェックしているのであれば、whois 情報 (取得日とか取得者等) も検索結果に反映されている可能性もあるわけだ。

投稿者 Su-Jine : 00:20 | コメント (2) | トラックバック | SEO

2006年03月31日

Mozilla 無し Googlebot 終了

私が管理しているサイトだけかもしれないが、3/29 日以降、Mozilla 無しの Googlebot によるアクセスが無い。今アクセスのあるのは Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) という Mozilla 付きの Googlebot のみだ。今後、インデックス収集は、すべてこのロボットになっていくと思われる。なぜ、以前の Googlebot が集めたデータではなく、新しく集め直したのかは不明。

投稿者 Su-Jine : 09:21 | コメント (1) | トラックバック | SEO

2006年03月27日

Google 新データセンタに移行完了?

http://66.249.93.104/ の検索結果と通常の検索結果が先週金曜日あたりから一緒になっているような気がする。サーバ毎に検索結果の数が全然違っていた (2 倍以上の差があった) のもほぼ統一された感じだ。23 日から 1 〜 2 週間で新データセンタに反映とあったが、既に反映しているのだろうか?それともまだ変わることがあるのだろうか?

===

ここ 1 週間新しいサイトの構築をしていた。4 月にリリースできるかどうかわからなかったものも、一応 4/1 にリリースできそう。今週で一気に終わらせる予定。このサイトはどこからもリンクされていないし、登録の申請もしていないのに、Google、YST でインデックスされている。新規ドメインの場合は何か監視しているのだろうか?

投稿者 Su-Jine : 08:25 | コメント (0) | トラックバック | SEO

2006年03月19日

Mozilla Googlebot が主流に?

まだオープンしていないサイトがある。去年の 12 月頃に取得したドメインだ。まだオープンしていないし、どこからもリンクが貼られていない。にもかかわらず、YST, Google にインデックスされている。何も申請していないはずなのに。

で、Google のキャッシュとログを比較したところ、Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) がクロールしたときにインデックスされたようだ。この Mozilla 付きの Googlebot は 新データセンタで確認していた が、通常の検索でも Mozilla 付きのクローラによるインデックスが確認できた。Google に何らかの動きがあったような で書いたのは Mozilla 付きのクローラが主流になったために起こったことだろうか?

投稿者 Su-Jine : 12:33 | コメント (0) | トラックバック | SEO

2006年03月15日

Yahoo! サジェスト

Yahoo!検索に「キーワード入力補助機能」--キーワード候補を自動で表示 という記事が CNET Japan に掲載されていた。この キーワード入力補助 という機能は Google サジェスト と同じ機能だ。これらの表示されるキーワードを見比べてみるのもおもしろいと思う。

たとえば、「や」と入力すると Yahoo! の方は「矢田亜希子 妊娠」「ヤマハ バイク」「山下智久 画像」「クロサギ 山下智久」「山手線 路線図」といった感じだ。Google の方は「ヤフー」「ヤフオク」「ヤフーオークション」「ヤマダ電機」「ヤマト運輸」となる。「か」と入力すると「確定申告」というキーワードがどちらも上位に表示されているので、最近検索されたキーワードから順位を決定しているように思われる。

---

最近新しい Web サイトを作っているが、デザインが決まらないのでしばらくリリースができなさそう。3 月中旬〜下旬にはリリースしたかったのだが、このままいくと 4 月下旬くらいになるかも。開発は一人でやるのが一番良い。他の人が決定するまで何もできない状態というのは非常に非効率だ。

投稿者 Su-Jine : 23:28 | コメント (0) | トラックバック | SEO

2006年03月14日

Google に何らかの動きがあったような

アクセスログを見ていると、Google に何らかの動きがあったように思われる。具体的な動きはまだわからない。日曜日の夜中から動いているような感じで、本日 Mozilla 無しの Googlebot も 17:00 でぴたっと止まった。Mozilla 無しのクローラは良くぴたっと止まることがあるが、何か動いているようなときに止まるとちょっと気になる。

本日 Google APIs を使って自分専用の検索サイトを作ろうと思ったが、なぜか検索しても結果が 0 件になってしまう場合が多く、どうも不安定なので作成をやめた。以前いじったときには検索結果が 0 件になる (結果が帰ってこない?) 事はなかったと思うが。作り方が悪いのかなぁ。今作っている新しいサイトをリリースしてからもう一度チャレンジしてみようと思う。

投稿者 Su-Jine : 21:46 | コメント (0) | トラックバック | SEO

2006年03月13日

YST, msn, Google の URL 申請ページは機能しているのか (3)

YST, msn, Google の URL 申請ページは機能しているのか (2) を少しまとめてみる。2006/3/13 20:47 現在の状況を書くと、msn の申請ページ はクロールからインデックスまでしてくれる。リンクが無くても OK だ。米 YST の申請ページ のページ申請はクロールまでは OK だが、インデックスの確認はできていない。フィード申請の方は RSS 自体はクロールされたが、RSS にあるリンクはまだクロールされていない。Google に関しては Google Sitemaps はすぐクロールされ、そのサイトマップにあるリンクも 2 つクロールされた。インデックスされるかどうかを今後見ていく必要がある。日本の YST の申請ページGoogle の申請ページ はまだ確認できていない。

投稿者 Su-Jine : 20:47 | コメント (2) | トラックバック | SEO

2006年03月08日

YST, msn, Google の URL 申請ページは機能しているのか (2)

以前、YST への申請ページは機能しているのか (1) と言う記事を書いたのだが、すっかりその後の検証を忘れていた。そこで、今回は検証ページを用意した。検証内容は、YST, msn, Google の URL 申請ページを利用、Google ツールバーでのアクセス、サイトマップなどの登録等。作成したページはどこからもリンクされていない。それぞれのページ申請方法とページ番号を下記に示す。

ページ番号ページ申請方法
A, B, CYahoo! JAPAN の URL 申請ページ からの "ページ" 登録
D, E, F米 Yahoo! の URL 申請ページ からの "ページ" 登録
G米 Yahoo! のフィード申請ページ からの "RSSフィード" 登録
H, I, J上記 G の RSS に含まれているページ (G が巡回されれば H, I, J も巡回される可能性がある)
K, L, MYahoo! Web Rank でのアクセス (第19回 Yahoo! Web Rank について 参照)
N, O, PGoogle の URL 申請ページ からの "ページ" 登録
QGoogle Sitemaps のサイトマップ申請ページ からの "サイトマップ" 登録
R, S, T上記 Q のサイトマップに含まれているページ (Q が巡回されれば R, S, T も巡回される可能性がある)
U, V, WGoogle ツールバーを表示した状態でのアクセス (第11回 Google のフレッシュクロール対象サイトにするには、Googleツールバーが影響している? 参照)
X, Y, Zmsn の URL 申請ページ からの "ページ" 登録

ページ名、URL は公開すると検証にならないため公開しない。リンクされたりすると検証できなくなるためだ。ページの形式は http://blog.su-jine.com/○○/△△.html または http://blog.su-jine.com/○○/△△.xml と言う形式となっている。ページには YST, msn, Google のクローラのみのアクセスログをとれるようにした。下記のフレーム内にクローラのアクセスがあれば上記ページ名に何のクローラがアクセスあったかわかるようになっている。

検証ページを作成し、1 日経過したところ msn のページ申請は動いているようだ。また、Google Sitemaps も xml ファイルをクロールしている。

投稿者 Su-Jine : 00:23 | コメント (6) | トラックバック | SEO

2006年03月07日

YST の 301, 302 リダイレクトの処理

リダイレクトを設定している場合、どちらのURLがデータベースに登録されますか? と言うページを発見。いつ作成されたページなのかわからないが、YST が 301, 302 をどうやって扱っているかを解説しているページだ。meta refresh 等も解説されている。引数有り無しの解説はためになるが、「引数有り→引数無し」のリダイレクトや「引数有り→引数有り」のリダイレクトも解説して欲しい。

投稿者 Su-Jine : 12:39 | コメント (0) | トラックバック | SEO

2006年02月23日

Google ローカルのデータ元

マイミクさんが Google ローカルのデータ元は何かという記事を書いていた。住所などのデータ元は Yahoo! 電話帳 だろう。ただ、Yahoo! 電話帳にはビル名までは載っていないようなので、その他にもデータ元はあるのかも。詳細タブの情報に関しては CNET の記事 で確認できる。情報などが間違っている場合や追加する場合は、Google ローカル ビジネス センター で対応可能だ。

投稿者 Su-Jine : 09:22 | コメント (11) | トラックバック | SEO

2006年02月22日

Google 「ローカル」を格上げ

Google のトップページから「ディレクトリ」が消え、「ローカル」が格上げとなった。以前の Google はディレクトリを検索結果にも表示していたが、それが消えて、今回はトップページからのリンクも消えてしまった。ディレクトリを表示するには more をクリックする必要がある。

現状の Google ツールバー 3 にも「サイト検索」「イメージ検索」「グループ検索」「ニュース検索」はあるが、「ディレクトリ検索」は無いようだ。ディレクトリ検索は消えていく運命だったのだろう。

ディレクトリ表示が無くなった Google トップページ

投稿者 Su-Jine : 20:11 | コメント (0) | トラックバック | SEO

2006年01月28日

Mozilla 無し Googlebot は?

いつもなら大量にアクセスのある Googlebot/2.1 (+http://www.google.com/bot.html) だが、本日 14:00 あたりからぴたっとアクセスが無くなった。私が管理しているサイトのほぼすべてで Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) のクローラによるアクセスのみ。この状態が続くとなると、新データセンタのリリースが近いと言うことだろうか。
それとも Googlebot/2.1 (+http://www.google.com/bot.html) のサーバが何かのトラブルでアクセスがないだけなのか。PageRank が更新される前触れか。

===

【追記】18:00
Mozilla 無し Googlebot によるアクセスが再開。単にスケジュールが遅れただけなのか。

投稿者 Su-Jine : 16:31 | コメント (0) | トラックバック | SEO

2006年01月25日

Googlebot の謎

昨年からずっと気になっていたことがあった。Googlebot は下記の 2 種類存在する。

A. Googlebot/2.1 (+http://www.google.com/bot.html)
B. Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

A がクロールした後は確実にインデックスされていたにもかかわらず、B がクロールしてもインデックスがされていなかった。

今年に入って Google は http://66.249.93.104/http://64.233.179.104/ を検証用データセンタとしたらしい。この 2 つは検索しても検索結果はさほど変わらない。しかし、インデックス数が他のデータセンタと全く異なる。現在のインデックス数の 2 〜 3 倍程度だ。

インデックス数は増えているが、サイト毎に見ると大幅に減っているサイトもあれば、大幅に増えているサイトもある。この検証用のデータがすぐに本番用としてリリースされるかはわからないが、意外と打撃を受けるサイトも多いだろう。

そこで、検索順位もさほど変わらないので何が違うかというのを調べていた。気になったことはキャッシュの日付が違うこと。キャッシュの日付が違うので、クローラの情報を調べてみた。そうすると、新データセンタのキャッシュは、確認したものは B によるキャッシュであり、A のキャッシュではない。

しかし、なぜ新しいクローラでクロールする必要があったのか。このあたりに疑問が残る。

投稿者 Su-Jine : 10:04 | コメント (2) | トラックバック | SEO

2006年01月06日

YST への申請ページは機能しているのか (1)

YST へのページ申請 というページは機能しているのだろうか?あまり気にしたことがなかったが、YST のインデックスが非常に遅いような気がするので、ちょっとしたプログラムを作成してみた。YST への申請には Yahoo! JAPAN のアカウントが必要だ。アカウントを作成し、送信時のパケットを取得。URL と Cookie を POST しているようなので、それらの変数を POST するように作成。作成したソフトは↓のような感じ。

syst.gif

1 ヶ月前くらいに完成したので早速申請。1 ヶ月ほど経ったがそれほどインデックスページは増えていない。単純にリンクをたどったという感じの方が強い。どこからもリンクされていない実験ページを 100 件程度申請してチェックしてみよう。

投稿者 Su-Jine : 09:05 | コメント (8) | トラックバック | SEO

2005年12月20日

Google と AOL の提携

先週 Google が AOL の株を 5% 購入する というニュースが発表された。SEO 的には何も影響はないだろうが、Google としては単に広告収入を増やすためだけに提携したのだろうか?

本日 タイムワーナー大株主、AOLとグーグルの提携に異議 と言う記事が載っていたのだが、AOL としては Microsoft や Yahoo!、その他と提携しにくくなるため反対するのもうなずける。TBS が楽天を拒否したのと同じ理由だろう。

Google からしてみると Microsoft と AOL が独占契約を結ぶとかなりの脅威となる。一時は AOL と Microsoft との提携が有力という記事も掲載されていた。単にこれを阻止するために提携したのだろうか。

Google にとってポータル系との提携というのは今まで無かったような気がする。単純な検索エンジンの提供だけだったはずだ。どうも AOL との提携は今までの Google の方向性と違うような感じだ。微々たるものだが、Google の株を購入したのでこういう話題は非常に気になる。

===

最近は寝付きが悪く、眠りが浅い。どうにかならないものだろうか。

投稿者 Su-Jine : 11:02 | コメント (4) | トラックバック | SEO

2005年11月24日

Googlebot のアクセス頻度が減少

昨日、ロボットのアクセスが少し減っていると書いたが、今日もちょっと少なめのような気がする。サイトによってはここ 2 週間くらいの平均の約半分程度。あまり変更がないサイトでも 3/4 程度まで減少している。何かの前触れか、特定のサイトだけの現象か、それともクローラも Thanksgiving Day でお休みなのか…。

フォーラム掲示板 にも書き込んだので、少しずつユーザは増えている。が、ちょっと書き込みが少ないなぁ。やはりユーザ登録の障壁が高いのだろうか。
これから RSS で新着情報を配信する予定。

投稿者 Su-Jine : 17:43 | コメント (0) | トラックバック | SEO

2005年11月23日

ウェブマスターフォーラムをオープン

ウェブマスターフォーラム をオープン。とりあえずブログのみで告知。SEO フォーラムではないのは、SEO 以外の話題も扱えるようにウェブマスターフォーラムとした。ネーミングは安直。

このフォーラムはユーザの登録が必要。ユーザ登録といってもメールアドレスとハンドルネーム、パスワードの登録のみ。書き込まない限りユーザ登録は不要だが、登録ユーザにしか見られないトピックも作ることが可能だ。

このフォーラムには書き込んだ人を評価する機能がついている。Yahoo! Auction の評価のような感じだ。評価が高い人の書き込みが必ずしも正しいとは限らないが、何らかの目安になるだろうと思って付けた機能。評価は 100 ポイントがマックスで、登録時は 10 ポイント。

mixi のような招待機能も付けてみた。招待されたユーザは招待したユーザの半分のポイントが与えられる。20 ポイント以上のユーザが招待権利を持っている。20 ポイントのユーザから招待されても 10 ポイントなので普通に登録するのと変わらない。30 ポイントのユーザから招待されると 15 ポイントから開始することができる。

しばらくの間はフォーラムと掲示板は平行して運用しようと思う。定着してきたらフォーラムの方に移行できればと思っている。診断掲示板もフォーラムにトピックを作って対応可能だろう。

海外の方ではフォーラムは活発だが、日本でも活発に利用されることを望んでいる。

===

今日はロボットの巡回がいつもよりも少ない。いつもの半分程度。

投稿者 Su-Jine : 22:40 | コメント (1) | トラックバック | SEO

2005年11月22日

msnbot/0.9

最近の msnbot は 1.0 だったような気がするが、11/20 日頃から msnbot/0.9 というログが残っている。もっと前からアクセスあるのかもしれないが。1.0 から 0.9 になっているのでバージョンはダウン。この 1.0 と 0.9 の違いは何だろうか。

投稿者 Su-Jine : 09:23 | コメント (0) | トラックバック | SEO

2005年11月15日

Google Analytics

Google がアクセス解析 Google Analytics を発表した。先日、アカウントを作成したが、あまりにも重い。12 時間以内にレポートが作成されるとあったが、12 時間以上経ってもレポートは作成されていないようだ。かなり負荷がかかっているのだろう。

アクセス解析を Google が提供するというのは非常に怖いところもある。ユニークアクセス数などの情報をすべて Google が把握してしまうわけだ。それらのデータを利用して検索のアルゴリズムを変更する可能性もある。取得したサイトのデータは広告などにも使える。アクセスが多いサイトは単価を高めに、アクセスが少ないサイトは単価を低めにということだって可能だ。

良いところとしては、新しいページをクローラが発見しやすくなると言うところだろうか。新しいページにアクセスすれば、データベースに無いページと判断されればクロールするようにすれば、どんどん新しいページを発見することができる。

しかし、サイトのデータをすべて検索エンジンに把握されるというのは何となく怖い気がする。

投稿者 Su-Jine : 12:48 | コメント (0) | トラックバック | SEO

2005年11月01日

Google の検索結果変動

http://66.102.9.104/ のサーバで昨日から順位が変動している。今更新中なのか、これが最終形なのだろうか?他にも微妙に動いているサーバがあるが、http://66.102.9.104/ が一番大きな変動を見せている。

投稿者 Su-Jine : 17:25 | コメント (0) | トラックバック | SEO

2005年10月21日

Google イメージ検索が微妙に変わった?

先日、Google の イメージ検索 をしていて、なんか違うような気がした。以前のイメージ検索のフォーマットと微妙に違うような気がする。

1. イメージの表示方法
 以前は、1 行目、3 行目と奇数行目は背景に色が付いていたような気がする。

2. 大きさの指定
 以前は、「検索結果 約 ○○ 件中」の右下に「大 中 小」というリンクがついていたような気がする。現在は、プルダウンで指定。

3. ファイル名
 以前はファイル名がフルで表示されていたと思うが、現在はドメインのみ。

投稿者 Su-Jine : 15:44 | コメント (1) | トラックバック | SEO

2005年10月20日

YST カテゴリ情報修正中

YST と騒いでいると Google も更新を始める、と言うような事がよく起こる。偶然なのか偶然ではないのか…。

YST でカテゴリ情報がついているサイトとついていないサイトがあるという騒ぎが起きているが、まだ何らかの不具合があるようだ。カテゴリに登録されているのにカテゴリマークがなくても、時間が解決してくれるだろう。

しつこいようだが、JAL で検索してみると、2 番目に表示される「JAPAN AIRLINES」がある。この説明文は「持株会社。企業情報、プレスリリース等。」となっていて、カテゴリは「航空会社 > 日本航空 (JAL) > 関連企業」となっている。ドメインは「www.jal.com」だ。

実際に 関連企業カテゴリ をクリックすると、カテゴリ内に www.jal.com は存在しない。しかし、全く同じ説明文がある。それは、「日本航空」というページ。しかし、ドメインは「www.jal.jp」。

一つ前の 日本航空 (JAL) カテゴリ を表示すると、「JAPAN AIRLINES」とある。このサイトのドメインは「www.jal.com/ja/」。説明文は「JALグループの企業情報、投資家情報、採用情報、環境活動等。」。

www.jal.com の情報を表示しなければならないのに、www.jal.jp の説明文を表示していると言うことだ。www.jal.jp と www.jal.com の区別がついていない。

投稿者 Su-Jine : 10:38 | コメント (0) | トラックバック | SEO

2005年10月19日

jal.com

先日 YST のカテゴリ アイコンはどこに消えた? の記事という記事を書いた。本日、jal をもう一度調べると、カテゴリアイコンが表示され、タイトルが「JAL-航空券 予約・空席照会・運賃案内-」、説明が「国内線、国際線の予約、マイレージ、ツアー、ホテル情報等。国内線のチケットレスサービスも。」となっており、カテゴリの情報が表示されるようになったようだ。まぁ、カテゴリのマークが戻ることは予想通りだったのだが、「あれ?」と思うことが。

記憶が確かであれば、jal.com というドメインに対して、JAL が以前裁判を起こしたことがあったような気がする。その裁判で負けて、jal.com のドメイン停止ができなかったような気がしていた。しかし、上記のように YST で jal を検索すると、2 番目に「JAPAN AIRLINES」と表示される。URL は www.jal.com。タイトルからして、JAL そのものじゃないかと思い表示してみたが、やはり JAL そのものだった。

気になって調べてみると、2000 年にやはり JAL が裁判で負けている。いくつかの掲示板の情報だが、2001 年 1 月から JAL の所有になっているようだ。jal.com を買い取ったなんて言うことは全く知らなかった。

投稿者 Su-Jine : 23:30 | コメント (0) | トラックバック | SEO

2005年10月18日

YST のカテゴリ アイコンはどこに消えた?

今まで YST で検索すると、Yahoo! JAPAN のカテゴリに登録されているサイトは、黄色いカテゴリアイコンが付いていた。最近このアイコンがつかなくなった。Yahoo! ヘルプ -Yahoo! 検索 には「Yahoo!カテゴリのアイコンがつきます」とある。Yahoo! が意図的にこのカテゴリのアイコンを消したのであれば、この説明文も変更するはずであり、アイコンが消えているのは一時的なものだろう。

掲示板 でも書いたが、カテゴリ DB とページの DB との連携で何らかの不具合があるように感じられる。

JAL を検索
YST の検索結果タイトルホーム
説明文国内線、国際線の予約、e割、マイレージ、ツアー、ホテル情報等。国内線のチケットレスサービスも。
Yahoo! に登録されているカテゴリ情報タイトル日本航空 (JAL)ホームページ
説明文国内線、国際線の予約、マイレージ、ツアー、ホテル情報等。国内線のチケットレスサービスも。
実際のタグ情報タイトルJAL−航空券 予約・空席照会・運賃案内−
説明文
(Description)
JALホームページ。国内線、国際線航空券の予約、購入をはじめ、スケジュール照会、空席照会、運賃案内などをサポート。JALマイレージバンクのご案内や国内、海外の現地情報、ホテル、レンタカーの予約などもご用意しております。

YST での検索結果はタイトルが「ホーム」となっているが、実際の JAL のページのタイトルにはホームというキーワードはない。この「ホーム」がどこから出てきたかというと、Yahoo! のカテゴリ情報のタイトルに、「日本航空 (JAL)ホームページ」とあり、この「ホーム」が表示されているのだろう。「ホーム」以外のキーワードは何らかの原因で消えてしまったように思われる。検索結果の説明文はカテゴリの説明文が使われているように思われる。しかし、Yahoo! カテゴリにはない「e割」と言うキーワードが入っているのが気になるところ。

レクサス を検索
YST の検索結果タイトルホーム
説明文LEXUS.jp ...
Yahoo! に登録されているカテゴリ情報タイトルレクサスホームページ
説明文モデル、販売店、サービス紹介等。
実際のタグ情報タイトルLEXUS.jp
説明文
(Description)
なし

レクサスの検索結果のタイトルも「ホーム」となっている。これもカテゴリ情報から抽出しているようだが、やはり「ホーム」以外のキーワードが消えている。説明文はカテゴリから抽出されたものではなく、meta タグの Description がないからなのか、<title> タグが使われているようだ。

YST の検索結果はカテゴリに登録されているものはカテゴリの情報が表示されるはずだが、タイトルはページ情報から表示しているのに、説明文だけをカテゴリ情報から表示してみたり、逆であったり、カテゴリ情報をすべて表示していたりと非常に不安定だ。どうもこの辺がカテゴリのアイコンが消える原因だろう。

例えば、DHCルイ・ヴィトン 等は今でもカテゴリのリンクが表示されている。すべてのカテゴリアイコンが消えたわけではない。やはり何らかの不具合と考えた方が良さそうだ。

今回の件で Yahoo! の順位が上がったとか下がったとかあるようだが、これが単純にカテゴリ情報との連携ミスによる順位の変動であると考えると、Yahoo! のカテゴリは YST にとって、それだけ影響力があると言うことになる。

投稿者 Su-Jine : 10:07 | コメント (0) | トラックバック | SEO

2005年10月17日

Yahoo! Search の IP アドレス指定

Google の場合は、各サーバの IP アドレスを直に指定すると、その IP アドレスのサーバで検索ができる。例えば、http://66.102.7.104/ にアクセスすると Google のページが表示される。search.yahoo.co.jp の IP アドレスを nslookup で調べてみると、次の 3 つが表示される。

203.216.231.214
210.80.240.218
203.216.227.246

複数表示されるのは DNS ラウンドロビン による負荷分散のため。上記 IP アドレスで直にアクセスすると Yahoo! 検索のトップ に強制リダイレクトされる。そのため、Google のように IP アドレスを指定して検索することができない。

ちょっと手間はかかるが hosts ファイルを使うと解決することができる。Windows XP (NT 系) の場合、次の箇所に hosts ファイルが存在する。

drive:\windows\system32\drivers\etc\hosts (NT や 2000 の場合は windows の箇所が winnt だと思う)

このファイルを開くと IP アドレスとホスト名の対が表示されているので、次の 1 行を加えて保存。

203.216.231.214 search.yahoo.co.jp

こうすると、DNS にアクセスする前に hosts ファイルで名前を解決するため、203.216.231.214 のサーバで検索することが可能。ブラウザで search.yahoo.co.jp にアクセスすれば 203.216.231.214 のサーバに接続される。210.80.240.218 のサーバで検索したいのであれば、上記 IP アドレスを 210.80.240.218 に変更して保存すれば良い。

hosts ファイルに記載されているホストの場合は、DNS で名前解決はしないため、自分の意図した IP アドレスを指定できる。フィッシング詐欺等でも hosts ファイルは使われることがあるので、この機会に hosts ファイルに変な IP アドレス、ホストの対が書かれていないかをチェックしてみてはいかがだろうか?(デフォルトで記述されているのは 127.0.0.1 localhost のみ。その上に # がついているのはコメントアウトなので無視)

投稿者 Su-Jine : 09:00 | コメント (0) | トラックバック | SEO

2005年10月08日

【ブックレビュー】最強の SEO 対策!

SoftBank Publishing から出ている 最強のSEO対策! という本を、SoftBank Publishing の担当者から送って頂いたので感想を書こうと思う。この本の著者は SEO コンテストで審査員を務めてくれたスマートシステム 田村さん。

まず、タイトルとしては SEO とあるが、全体的に SEM に関する内容の方が多いと感じられる。SEO としては、初心者向けであり、ホームページビルダーの GUI を使いながら、どのプロパティをどのように変更するとタグが書き換わるのかという内容だ。ホームページビルダーを使っている方はタグを読んだり書いたりはあまり得意ではないと思うので、このような方には非常に参考になると思う。逆にタグを読んだり書いたりできる方にとっては少し物足りないような気がする。

SEM 的な内容としては、効率の良いキーワードの決定方法や、Overture・AdWords のリスティング広告の使い方など。キーワードの決定方法 (キーワードアドバイスツールの使用など) は個人サイトでも使えそうだ。また、クリックされやすくなるような文章の書き方などのテクニックが紹介されている。このクリックされやすくなるような文章の書き方は Overture、AdWords の説明の部分に載っているのだが、これはスニペットに応用もできるだろう。しかし、リスティング広告については商用サイトがターゲットになるので、個人的にはなるほどなという程度だ。これからショッピングサイトを立ち上げる方とか、サイトを立ち上げたばかりで困っている方なんかには参考になると思う。

最後にアフィリエイトについて書かれている。アフィリエイトの本はほとんど読んだことがないので比較はできないが、この本では実際の体験談が書かれていて、どうやって商材を見つけるのか、それでどの程度収入を得たかが書かれている。以前読んだアフィリエイトの本は、成功事例が載っているのだが、具体的な内容は一切書かれていなかった。ゴッゴル本 を書いてわかったのだが、印税というのはそれほど入らない。著者に入る印税よりもアフィリエイトで稼いでいる方が収入になるために、「アフィリエイトで儲けよう!!」的な本ですべてのノウハウを公開することはほとんどないだろう。そのような本よりも、この本の最後に少し書かれているノウハウの方が収入アップになるような気がする。

投稿者 Su-Jine : 01:12 | コメント (2) | トラックバック | SEO

2005年10月04日

Yahoo! のクローラ (cdev1002.inktomisearch.com)

先日切り替わった Yahoo! JAPAN の検索は、かなりの衝撃を与えたのだろう。Yahoo! の検索が極端に重くなると言うのは、それだけ注目度が高いと言うことだ。一般のユーザにはこの切り替えはそれほど大きなものではないが、これだけアクセスが集中すると言うことは、SEO というか、検索エンジンの順位を気にしているユーザがかなり多いと言うことがわかる。

Yahoo! も切り替わったので、最近あまり見ていないログのチェックをしてみた。Yahoo! のクローラで cdev1002.inktomisearch.com (66.196.81.175) というアクセスがある。Yahoo! のクローラは fj 系と lj 系の 2 種類だったはず。cdev 系という新しい (以前からアクセスがあるがあるようだが) アクセスが気になった。cdev は c + dev のような気がするので新しいクローラの開発段階ということだろうか。IP アドレス的には fj 系に近い。

投稿者 Su-Jine : 00:30 | コメント (0) | トラックバック | SEO

2005年10月03日

Yahoo! JAPAN が Yahoo! SEARCH に移行

とうとう Yahoo! JAPAN の検索が Yahoo! SEARCH に移行された。予想では明日の日中かなぁと思っていたが、意外と早く更新されたようだ。明日のアクセス数がどうなるのか。
Yahoo! SEARCH

Yahoo! SEARCH のトップページも変更されたようだ。β版の時のデザインは、ほぼ Google だったのが、少しは変えてきたようだ。

投稿者 Su-Jine : 00:36 | コメント (0) | トラックバック | SEO

2005年10月02日

Google イメージ検索更新

10 月になりました。Yahoo! がいつ切り替わるのか。CNET の記事 でも「10月より新方式に切り替える。」とは書いてあるが、10 月 1 日からとは書いていない。早ければ明日 (10/3) かなぁなんて予想してみる。

Yahoo! に話題を持って行かれるのが気にくわないのか、Google イメージ検索のインデックス更新があった。ゴッゴルミニ イメージ検索 で書いたのだが、ようやく「ゴッゴルミニ」でイメージ検索がヒットするようになった。検証用の画像は下記の画像。
ゴッゴルミニ

この画像を「ゴッゴルミニ」でイメージ検索したときに上位を狙おうと思っていたが、インデックスすらされていない…。Google イメージ検索に関する FAQ で書かれている、「重複を排除し、最高品質の画像が最初に表示されます」 で同一画像と見なされて排除されているだけなのか。

投稿者 Su-Jine : 13:51 | コメント (0) | トラックバック | SEO

2005年09月30日

■Yahoo! SEARCH による SEO

10 月から Yahoo! JAPAN の検索が切り替わる。Yahoo! JAPAN のトップページがどうなるのかはわからないが、検索結果は現在の Yahoo! SEARCH (beta) のような形になるだろう。

今回は、「Yahoo! SEARCH による SEO」という題名だが、Yahoo! SEARCH で上位表示する対策を書くわけではないのであまり期待しないように。

Yahoo! SEARCH のトップページは UserAgent で何らかの制御を行っているようだ。Yahoo! SEARCH のキャッシュを見ると面白い事がわかる (Google によるキャッシュmsn によるキャッシュ)。Google のキャッシュでテキストで表示するともっと面白い (Google のテキストキャッシュ)。「Yahoo!」に関する文言以外はほぼ消えている。キーワード出現率が非常に高い。ソースを見ると <h1><img src="〜" alt="〜"></h1> というタグを自サイトでも使っているわけだから、Yahoo! SEARCH では <h1> で囲まれた img の ALT 属性は有効そうだ。

Google のキャッシュmsn のキャッシュ
図 1. Google によるキャッシュ図 2. msn によるキャッシュ
Google のテキストキャッシュYahoo! SEARCH オリジナル
図 3. Google によるテキストキャッシュ図 4. Yahoo! SEARCH オリジナル

投稿者 Su-Jine : 00:21 | コメント (0) | トラックバック | SEO

2005年09月29日

Google のインデックス数が消えた

Google のトップページを見ることはあまりない。本日たまたま Google のトップページを見たが、©2005 Google の右に今までは「8,168,684,336ウェブページから検索」という文言があったのだが、それが消えている。グーグルCEO:「インデックスの数は他社の3倍以上に」 という記事に、インデックス数を消した理由が書いてあった。その記事の中で、

Googleは以前、80億ページをインデックス化していると述べたことがあったが、「人によってインデックス数の数え方がまちまち」であることから、今後は登録されたページの数を明らかにしないことにしたとSchmidt は語った。

Googleは先月、Yahooが200億ページを上まわるページをインデックス化しており、その大きさでGoogleを上まわったと主張した際、異議を唱えていた。

という文章があるが、インデックス数を消したと言うことは負けを認めたとしかとらえられないような気がする。具体的な数字を出さずに「他の検索エンジンの 3 倍をインデックスしている」なんて言うのは全く説得力がない。

投稿者 Su-Jine : 00:01 | コメント (0) | トラックバック | SEO

2005年09月23日

■Yahoo! SEARCH は日本語ドメインを表示可能に

もう少しで Yahoo! JAPAN の検索結果の表示方法が変わる (Yahoo! のダイジェスト表示は 9 月まで? 参照)。ダイジェスト表示が無くなるため、カテゴリに登録されていなくても上位を狙えるチャンスではある。

以前メールマガジンで書いたことのある、日本語ドメインが対応されるのかをちょっと調べてみた (第21回 日本語ドメインについて - YST, msn (beta) 編 参照)。面白いことに、10 月以降に切り替わるであろう Yahoo! SEARCH (beta) で「お正月.com」を検索したところ、Punycode が日本語ドメインに変換されている。

下記の画像を見るとわかるとおり、左側の画像 (現状の YST) は検索結果の URL が「http://xn--t8j316ntzc.com/」となっているが、右側の画像 (Yahoo! SEARCH beta) は検索結果の URL が「お正月.com」となっていることがわかる (リンク先は、「http://xn--t8j316ntzc.com/」へのリンクとなっている)。この結果から Punycode の逆変換 (Punycode から日本語ドメインへの変換) 機能は持っていることになる。

YST での日本語ドメイン表記Yahoo! SEARCH beta での日本語ドメイン表記

検索結果を見ると、「お正月.com」「お正月.com/link.php」の 2 ページしかヒットしていない。第21回 日本語ドメインについて - YST, msn (beta) 編 で検証用に用意した「http://お正月.com/others.php」へのクロール形跡は無いため、「<a href="http://お正月.com/">http://お正月.com/</a>」というリンクがあってもクロールできないと言うことになる。そのため、Punycode への変換機能は持っていないと言うことがわかる。リンクするときには、やはり「<a href="http://xn--t8j316ntzc.com/">http://お正月.com/</a>」とする必要があるようだ。

まだまだ日本語ドメイン対応している検索エンジンは少ないが、今後 IE が日本語ドメインを対応するようになれば、一気に普及する可能性は高い。ちなみに IE7 で日本語ドメインは対応される予定だ (Internet Explorer次期バージョンにてIDN対応 参照)。

■日本語ドメインを取得するには
早い者勝ち! com/co.jp/jp ドメイン取るならお名前.com

投稿者 Su-Jine : 12:05 | コメント (0) | トラックバック | SEO

2005年09月22日

Google のインデックスは 110 億?

Google オフィシャルとしては 8,168,684,336 ページインデックスしているようだ。約 80 億ページ。一番ヒットするキーワード「the」で検索すると次のような結果が帰ってくる (A)。(調べたサーバは http://64.233.167.104/)

the の検索結果 約 8,690,000,000 件中 1 - 10 件目 (0.07 秒)

で、「the」を含まない検索をすれば、全体のインデックス数がわかるはずである。「-the」を検索すると次のような結果が帰ってくる (B)。

-the の検索結果 約 2,420,000,000 件中 1 - 10 件目 (0.04 秒)

A は「the」を含むページを検索したもので、B は「the」が入っていないページを検索したものであるから、A と B を合計すると全インデックス数がわかるはずである。

実際に A + B を計算すると 11,110,000,000 ページ存在することになり、約 110 億ページということになる。同様に「blog」や「ブログ」「ゴッゴル」「SEO」などでも検索してみた。

blog の検索結果 約 437,000,000 件中 1 - 10 件目 (0.16 秒)
-blog の検索結果 約 10,750,000,000 件中 1 - 10 件目 (0.33 秒)

合計:11,187,000,000 件

ブログ の検索結果 約 18,500,000 件中 1 - 10 件目 (0.15 秒)
-ブログ の検索結果 約 11,190,000,000 件中 1 - 10 件目 (0.34 秒)

合計:11,208,500,000 件

ゴッゴル の検索結果 約 381,000 件中 1 - 10 件目 (0.28 秒)
-ゴッゴル の検索結果 約 11,210,000,000 件中 1 - 10 件目 (0.26 秒)

合計:11,210,381,000 件

seo の検索結果 約 30,800,000 件中 1 - 10 件目 (0.12 秒)
-seo の検索結果 約 11,180,000,000 件中 1 - 10 件目 (0.38 秒)
合計:11,210,800,000 件

どの検索結果も合計は約 111 〜 112 億となるので、現在の Google のインデックス数は約 110 億くらいだと思われる。ただし、この中には URL のみのインデックスもあるわけで、公式に発表するときには、このようなページをインデックスしているとは見なさない可能性もあるため、次回 Google のトップページのインデックス数が更新される時にはもっと少ない数値になる可能性もある。

投稿者 Su-Jine : 23:05 | コメント (1) | トラックバック | SEO

2005年09月17日

ウェブマ}スターのための Google 情報

何気なく検索をしていたところ、「ウェブマ}スターのための Google 情報」という文字を発見。
ウェブマ}スターのための Google 情報

たまに Google のヘルプページっておかしな文字が単語の間に挟まっていることがある。今回は "}" という記号が挟まっていた。タイトルだけではなく、左側にも同じように "}" がある。当然、分かち書きがおかしくなるため、どのように分かち書きされるのかを調べてみた。

「ウェブ|ウエブ|ウェヴ|ウェッブ」「マ」「スター」「の」「ため」「の」「google」「情報」

ウェブ マ スター」とか検索すると 1 番上に Google の SEO ページが表示される。

投稿者 Su-Jine : 01:20 | コメント (0) | トラックバック | SEO

2005年09月05日

サーバとサーバー、SEO には関係がある?

「サーバ」と「サーバー」。皆さんはどちらを使いますか?一般的には「サーバー」、理系の場合は「サーバ」と語尾を伸ばさない場合が多いだろう。

Google で「サーバ」「サーバー」をそれぞれ検索すると、検索件数は違うものの、同じ検索結果が帰ってくる。そのため今まで「サーバ」と「サーバー」の違いを気にしたことはない。

Powered by Google 系を使っている goo, excite, biglobe で「サーバ」と「サーバー」を検索してみた。

検索エンジン「サーバ」での 1 位のサイト「サーバー」での 1 位のサイト
Googleレンタルサーバの決定版 ファーストサーバ : HOMEレンタルサーバの決定版 ファーストサーバ : HOME
gooレンタルサーバの決定版 ファーストサーバ : HOME自宅サーバーWebRing(ウェブリング)
exciteレンタルサーバの決定版 ファーストサーバ : HOME自宅サーバーWebRing(ウェブリング)
BIGLOBEレンタルサーバの決定版 ファーストサーバ : HOME自宅サーバーWebRing(ウェブリング)

私が知らなかっただけなのかもしれないが、「サーバ」と「サーバー」は Google 内では基本的に別の単語である事がわかった。同じ単語でインデックスされている場合は、Powered by Google 系の検索エンジンでも同じ結果が帰ってくるはずである。


A. クエリ → B. クエリの処理 → C. 検索リクエスト → D. 検索結果表示

上記の流れのうち、Powered by Google 系の検索エンジンは、C 以降が提供されているわけで、B のクエリの処理に関しては、各検索エンジン会社にまかされていることだ。Google だけが、「サーバ」と「サーバー」は同じであると関連付けられていて、「サーバ」と検索されたときに「サーバ OR サーバー」というクエリに変更し、検索していると言うことがわかった。

Google では「サーバ」「サーバー」は同じだが、Powered by Google 系の検索エンジン対策はそれぞれの単語で上位表示しなければならない。「サーバ」「サーバー」の検索結果には明らかにこのことを知っていて対策をしているなぁというサイトもあるようなので、この違いは有名な事だったのかも。

投稿者 Su-Jine : 10:35 | コメント (0) | トラックバック | SEO

2005年09月03日

動的な CSS 作成

先日、CSS がインデックスされる という記事を書いたが、面白い内容ではない。

今回は CSS を動的に作成するということを考えてみる。参考にページを作ってみた。ランダム CSS というページ。何度かリロードしてみると、【リロードするたびにこの文字色が変わる】 という文字の色が変わる。これは、CSS 自体を PHP で動かしているためにこういう事ができる。試しに、CSS ファイル を見て欲しい。この CSS ファイルを何度かリロードすると、color が動的に変わっていく。

こんな感じで、CSS を動的に作ることも可能だ。使えるサーバも限られてくると思うが ランダム CSS にソースコードも載せているので、実際に動かしてみると面白いことに使えるような気がする。例えば、JavaScript で IE 用、Firefox 用など別の CSS を作って JavaScript で判定しているのをサーバサイドで行うとか、cookie に保存して、ユーザごとに色を変えられるようにするとか。何に使えるかはアイディア次第。

投稿者 Su-Jine : 15:47 | コメント (0) | トラックバック | SEO

2005年09月02日

CSS がインデックスされる

CSS がインデックスされると言うことが 掲示板 でも話題になっているので、そのことについてちょっと書こうと思う。

display: none はスパムと見なされるようになるかもしれないという噂もあるが、display: none 自体はちゃんと定義されているもの である。定義されていると言うことは使い道があるから定義したわけで、この仕様を守った Web サイトを作っているのにスパムと見なされるとしたら、ちょっと問題があるような気がする。私が検索エンジンの開発者であれば display: none はコメントアウト (<!-- -->) と同様に扱うかな。

まぁ、150km/h 出せる車があって、150km/h 出すとスピード違反で捕まるというようなものだろうか。そもそも 150km/h まで出せない仕様にすれば良いのになぁといつも思う。

次回は「動的な CSS」について書こうと思う。


これを書いていて新しいアイディアを思いついたが、これを実現するのは 1 人では無理だろうな。新しく検索エンジンを作るようなものだから。

投稿者 Su-Jine : 10:38 | コメント (0) | トラックバック | SEO

2005年08月25日

Yahoo! のダイジェスト表示は 9 月まで?

久しぶりに SEO ネタ。

ヤフー日本法人、完全自動検索に移行・閲覧数伸ばすグーグル型 という記事が IT-PLUS で書かれている。


検索サイトのヤフー日本法人は人手を利用して登録したサイトを優先的に表示する方式をやめ、10月にも検索を完全自動化した「グーグル型」に切り替える。人手を利用する方式は創業以来、採用してきた。自動検索の精度が上がるにつれグーグルが閲覧数を伸ばしており、ヤフーもライバルの方式に改める。


ということは 10 月あたりから Yahoo! JAPAN での検索結果は こんな感じ になっていくのだろう。ビジネスエクスプレスの申請は少しは減るのではないだろうか?それでも変更すると言うことは、ビジネスエクスプレスよりもリスティング広告の方が稼げると言うことだろうか。SEO がさらに注目されるようになるかも。

投稿者 Su-Jine : 11:13 | コメント (0) | トラックバック | SEO

2005年08月17日

クローラ

世の中にはたくさんのクローラがある。Google や YST, msn 等のロボット型検索エンジン用クローラ。Yahoo! JAPAN や Su-Jine 等の登録サイトのダウンチェック用クローラ。メールアドレスを収集するクローラ等。

最近、クローラが多すぎると思う。管理しているサイトで、毎日 7 割 〜 8 割程度がクローラによるアクセスというサイトもある。場合によってはクローラのアクセスが多すぎて httpd がダウンする。サーバは専用サーバで、スペック的には問題ないはずだが、毎秒 10 程度のアクセスが数時間続くためダウンしてしまう。検索エンジンのクローラを排除するわけにもいかないため、頻繁にサーバがアップしているかを確認する必要がある。検索エンジン会社が別々に収集するというのも非常に効率が悪いし、ネットワークにもサーバにも負荷をかけている。

先日オープンした HTML PING WORLD というサイトはクローラを使う必要がない。なぜなら、ユーザが自分で情報を送ってくれるからだ。今後、クローラ以外の情報収集方法を考えていく必要もあるのではないだろうか?例えば、ブラウザはクローラと同じ動きをするわけだから、ブラウザが取得したデータをどこかのサーバに PUT する事でクローラを使わなくてもソースコードを収集できる。取得したソースコードは、検索エンジン会社で共有するのが良いのではないか。

投稿者 Su-Jine : 09:01 | コメント (0) | トラックバック | SEO

2005年07月24日

SEO 対策意見交換掲示板 全文検索

Su-Jine の主要コンテンツになっている SEO 対策意見交換掲示板全文検索 を付けた。今までも 検索 はできたが、この検索は 過去ログ を検索することができなかった。はっきり言って使えないという意見が多かったので、ようやく重い腰を上げて 全文検索 を付けた。

ブログを .net に移行したので容量が空いたというのが検索をつけられるようになった大きな要因。しかし、実際にインデックスを作成してみると、インデックスのサイズはそれほど大きくなかった。もっと前からつけられたかも…。

Namazu を使った検索は初めてつけたので、使いにくい点とか、こうした方が良いというアドバイスがあれば連絡ください。

投稿者 Su-Jine : 14:37 | コメント (3) | トラックバック | SEO

2005年07月23日

Web 制作業者

先週 Web 制作業者の営業が来た。全部社内でやっているから必要ないと言ったのだが、どうしてもというので話だけでも聞いてみようと思って聞いてみた。

その業者は Yahoo! JAPAN のカテゴリにたくさん登録しますという営業をしてきた。それをやる前に現状を知りたいとのことで、どんなキーワードを狙っているかを話した。

で、その営業が提案してきた内容は「それぞれ狙っているページで新しいサイトを立ち上げる」という内容。まぁ、Su-Jine 内で書くとすれば、SEO の掲示板サイト、ディレクトリサイトなどを別ドメインで立ち上げて Yahoo! JAPAN に申請するというだけ。で、それぞれのサイトを「Su-Jine が運営」という申請をする。そうすると、Yahoo! JAPAN に「Su-Jine」というカテゴリが作成され、そこにたくさんのサイトが登録されるというわけだ。じゃあ、その価格はいくらなのかを聞いてみたが答えない。

その代わりに、リスティング広告などでいくら使っているかを聞いてきたので、まぁ、1 万円くらいじゃないかと答えると、「今回は縁がなかったということで」という事になった。最後にその業者は「毎月 30 万くらいはかかります」と言った。Yahoo! JAPAN のカテゴリに載せる Web サイトを作るのに毎月 30 万ってあり得ない。SEO ならまだしも、Yahoo! JAPAN のカテゴリは毎月変動するわけでもなく、一回載せれば終了。自分で Web サイトを作って 5 万円払えばすむ話 (ビジネスの場合)。ランニングコストはサーバ代だけ。それを毎月 30 万って…。

正直、これが商売になるんだなぁとかなり驚いた。以前、Su-Jine 内で、SEO 業者の報告をお願いした時期もあったが、全く情報が集まらなかったので、その企画は終了した。なんか、価格ドットコムみたいな、ユーザ同士でこういう業者の比較ができるサイトでもあれば面白いかなぁなんて思ったりしている。

投稿者 Su-Jine : 15:00 | コメント (2) | トラックバック | SEO

2005年07月02日