複数のホスト名における同一コンテンツ問題に関して

本記事は「SEO by the Sea」のエントリの翻訳記事となります。

参考記事:『Google Granted Patent on Hostname Mirrors』



<引用ここから>

Google Granted Patent on Hostname Mirrors

ニューヨークタイムズのサイトは良い一例となるだろう。
私は良いサイトがSEOの基本となるということは違うと指摘していた。

“http://newyorktimes.com/” にアクセスするとツールパーのPRは7となっていることが分かるだろう。
一方で、“http://www.newyorktimes.com/”ではPRが9であることが分かる。

ニューヨークタイムズのページは、wwwのありなしを解決した。
なぜなら、すべてのインデックスされたページはwwwありなしともにアクセスが可能であったが
これらのページはすべてPRを獲得できていたわけではなかったからだ。

何年か前、SEOの基本的な考え方をもった誰かがニューヨークタイムズの問題を修正した。
よく知られているサイトであってもミスを起こすし、基本を無視しているという一例がなくなってしまったわけだが、
スモールビジネスが大きな予算を投下する大きな会社に勝つことができることが分かる。

(中略)

昨日、Googleがはウェブ上のミラー調査に関する特許を届けた。
特許では2つの異なるホスト名にアクセスできるサイトに関する問題と
それが引き起こす問題について書かれている。

2005.08.09
複数のホスト名における同一コンテンツ問題は検索エンジンのクロールとインデックスされた複数のホスト名をもつコンテンツによって作られるものである。

例えば、検索エンジンは2つのホスト名を見分けることができない。
それが同じコンテンツであっても、検索エンジンは両方のホスト名をクロールしてインデックスしてしまう。
これによってクロール範囲とインデックススペースを無駄につかってしまうし、2つのホスト名をクロールするのに2倍かかってしまう。
また、同一コンテンツをもつ複数のホスト名は検索結果のランキングにも問題を与える。

現在のランキング技術を使うと、特定のウェブページはより高いランキングを与えられるだろう。
それゆえ、同一コンテンツをもち2つのホスト名をもつサイトがランキングの目的のためにわざと別々で扱われている場合、各ホスト名のランキングは半分程度で評価されるかもしれない。

この問題を解決する最善のアプローチは、検索エンジンが2つのホスト名をクロールして
インデックスしないようにすることだ。
ホスト名の重複問題は通常、簡単に解決できるものである。
301リダイレクトなどの恒久的なリダイレクトをサーバーに設置して、wwwありかwwwなしを選んで
ユーザーがアクセスできるようにすればいい。

Googleはこの問題に関してウェブマスターツールのヘルプページ情報を使用している。
ページの下部にはGoogleが役立つヒントを提供している。

注意:一度設定したいドメインを選択すると、管理者は選択したくないドメインからトラフィックを移行させるために301リダイレクトを使用したいかもしれない。
そのため、検索エンジンとユーザは管理者が好きなドメインを知ることができる。

検索エンジンはこの問題について”Canonicalization“というページで呼びかけている。
何週間か前、Googleは私達にこの問題を起こしている人々に対してメッセージを送っていることを伝えていた。

もちろん、ベストな解決方法はGoogleが理解できることに頼ることではない。
Googleは正しい場合もあるが、そうでない場合もある。

もう私はニューヨークタイムズのウェブサイトをこの問題に関する例として確認できないが、
彼らがこの問題を修正してくれたことは何よりだ。
ウェブマスターはこうした問題を起こさないようにするとともに、
Googleがウェブマスターのためにこうした問題を修正してくれると思わないようにしなければならない。
この特許は7年も前のものだが、Googleはニューヨークタイムズに対してこの問題を修正するようなことはしなかった。
本当に幸運なことは、彼らは自分でサイトを修正したことにある。

<引用ここまで>

今日のまとめ

wwwありなしをしっかり設定するという基本的なSEOが特許として公開されていて、
ランキングにも影響を与える重要な指標になっているということです。

内部施策の提案ではもちろんここまで網羅したご提案を差し上げるように心がけていますが、
外部施策でも徹底したサイト作りをしなければという最近のつぶやきを思い出しました。

サイト作成時にテンプレートとして”.htaccess”ファイルと”canonical”タグを
最初から入れておいてしまうのが良いかもしれません。
書いてて思ったのは、canonicalをすべてTOPに設定してインデックスが増えないというアレです。
基本的な知識を体系的に利用することがSEOではとても重要です。

参考記事:『rel=”canonical”タグの誤用でインデックスから消滅』



LiAメディアマーケティングセクション 加藤

このエントリーをはてなブックマークに追加

Related posts

This entry was posted in SEO/SEM 全般, 検索エンジン別SEO -Google SEO and tagged , , , , . Bookmark the permalink.

コメントを残す

Get Adobe Flash player