イントロ
重複コンテンツとは、1つのURLの複数の場所に存在するコンテンツのことです。検索エンジンは、どのバージョンのコンテンツがより適切で、関連する検索クエリからSERPに読み込むべきかを判断できないため、重複したコンテンツは検索エンジンを混乱させる。最も正確な検索結果を提供するために、当該エンジンは重複するコンテンツの表示を控え、「正しい」コンテンツを最もよく反映するものを選択します。
重複コンテンツ サンプルコーディング
Rel=Canonicalコードサンプル
<head> <link rel="canonical" href="https://123abc.com/blog/" /> </head>
Meta Robotsのコード例
<head> <meta name="robots" content="noindex, follow" /> </head>
重複コンテンツの問題点
- 検索エンジンは、どのコンテンツをインデックスに含めるかを選択するのに苦労している。
- 検索エンジンは、リンクジュースを分けるべきか、1つのページに流すべきか、わからない。
- 検索エンジンは、特定の結果ページに対してどのページがランク付けされるべきかわからない 重複コンテンツは、サイトがランキングやトラフィックを失う原因となりえます。また、検索エンジンが無関係な結果を提供する原因にもなります。
重複コンテンツの例
URL パラメーター
クリックトラッキングや分析コーディングによって、コンテンツが重複することがあります。
印刷用ドキュメント
プリンターフレンドリーバージョンのページが生成され、インデックスが作成された場合、重複コンテンツの問題が発生する可能性があります 。
セッションID
すべてのサイト訪問者にそのウェブサイト用のセッション ID が割り当てられ、さらに別のセッション ID が割り当てられて URL に保存される場合に発生します。
トップSEO対策。重複コンテンツ
検索エンジンは、重複したコンテンツが複数のURLで見つかった場合、そのコンテンツを正規化します。この正規化は、301リダイレクトを作成することで行われます。これは、URLを修正し、rel=canonicalタグを使用します 。
301リダイレクトは、コンテンツの重複を解決するための最良の方法です。ページが複数見つかった場合、より強い関連性を持つ1つのページに統合され、このページに遭遇した検索エンジンのランキングにプラスの影響を与えます。
Rel=canonicalは、重複したコンテンツを処理するためのもう一つの選択肢です。このタグは、リンクジュースを分割してページに渡す解決策を作り出し、工数も少なくて済みます。このタグは、デジタル・ページの見出しのHTMLヘッドに追加されます。metaタグは再作成されないが、代わりにrelパラメータが追加される。インデックスに含めない方が良いページには、メタロボットタグに値を追加することができます。これらの値を追加することで、検索エンジンのボットがページをスキャンし、インデックスに2度追加することがなくなります。
**例:**の場合
<link href="https://www.123abc.com/canonical-version-of-page/" rel="canonical" />
パラメータ管理用Googleウェブツール
Googleウェブマスターツールでは、ドメインごとに好みのURLパラメータを設定することができます。この方法には、Google検索エンジンのみで動作するという欠点があります。これらのツールを使用して行った変更は、Bingや他の検索エンジンでの変更には影響しません。
ドメインの優先設定
これらは、すべてのサイトに設定されています。Googleはこの簡単な方法で、SERPのリストでサイトをwwwの見出しで表示するかどうかを決定します。URLは、大文字と小文字の間違いのような小さなミスに悩まされ、重複エラーの原因となることがあります。同じウェブページを3回書き、それぞれ異なる文字が大文字で書かれていた場合、検索エンジンは3つのページをすべて異なるものとしてカウントし、重複コンテンツとして扱います。2つ目と3つ目のURLにrel=canonicalを導入することで、検索エンジンは1つ目のURLに戻り、残りの2つは1つ目と同じコピーのように扱われます。