【東証プライム企業も多数利用!】最先端のSNSマーケティングツール「Tofu Analytics」、「InstantWin」とは?

Webサイトの運営者からすると、「重複コンテンツはSEOに悪影響を及ぼす」ということは、ある種の常識として認識されているのではないでしょうか。

重複コンテンツは、URLが別々で、全く無関係のコンテンツでありながら、その内容が同じ、もしくは酷似しているコンテンツのことです。よく知られているとおり、やはりSEOに悪盈虚を及ぼし、最悪の場合は検索結果に表示されなくなることもあります。

しかし、実際、具体的にはどのようなコンテンツが「重複コンテンツ」とみなされてしまうのか、どうやって重複しているか否かを調べるのかという点に疑問を持たれている方もいるでしょう。

そこで本記事では、重複コンテンツがSEOに与える影響や、確認方法、対処法まで解説していきます。

1.重複コンテンツとは?

重複コンテンツとは、自社のWebサイト内外に類似しているWebページがあることです。

重複コンテンツは、類似コンテンツが自社のWebサイト内にある場合と外部の他サイトに掲載されている場合があります。

重複コンテンツとみなされる可能性のあるパターンとして、以下の3点があげられます。

  1. URLは異なるが内容が重複している
  2. 文章は異なるが記述内容が類似している
  3. KWは違っても検索意図が類似している

単語や文章の順番が違っても、内容自体は同じであれば、重複コンテンツとみなされる可能性が高いです。なお自サイト内では、定型文の使用や似たテーマでのコンテンツ作成などにより、どうしても内容の重複が発生しがちです。またサイトの構造によっては、別のコンテンツで扱った内容でも記載したほうが良いケースもあります。

このような理由から自サイト内での重複コンテンツは、多くの場合ペナルティの対象とはなりません。もし自サイトのコンテンツ同士で重複がみられても、必ずしも修正する必要があるとは限らないのです。

2.重複コンテンツの確認方法

自分のサイトを盗作した重複コンテンツがあるか調べる方法として、最もシンプルなのが、自分のサイトの文章の一部をコピーして検索にかけることです。そのままコピー&ペーストして検索しても良いですが、コピーした文章の両端に「”」を付けて検索すると、完全に一致しているページのみを表示できるので、より高い精度で調べられます。

例えば、本ページが盗作されているか調べる場合は、上記の文章に「”」をつけて、「”自分のサイトを盗作した重複コンテンツがあるか調べる方法として、最もシンプルなのが、自分のサイトの文章の一部をコピーして検索にかけることです。”」といった形で検索します。その結果、検索結果ページに当記事以外のサイトが表示される場合は、盗作されている可能性があると言えるでしょう。

ただし、この方法だけでは厳密に「盗用」と判断できるわけではありません。重複コンテンツの疑いがあるページを特定できたら、「sujiko.jp」など、2つのURLを入力することで類似度を数値化して教えてくれるチェックツールの活用がおすすめです。ツールの総合判定結果が、「激似」など高い度合いを示した場合は、確信犯的な盗用を疑うべきです。後述する対処を行うようにしましょう。

3.重複コンテンツがSEOに与える3つの影響

重複コンテンツがSEOに与える影響は主に以下の3つです。

  • 検索結果に表示されなくなる
  • リンクが分散する
  • ペナルティ対象になる

重複コンテンツの危険性・影響を正しく理解して、健全なサイト運営を行いましょう。

3-1.検索結果に表示されなくなる

Googleから重複コンテンツと判断されると、検索結果ページに表示されなくなります。

Googleは、ユーザーの利便性を第一に考えているため、内容が重複したコンテンツが散乱することによってユーザーが検索エンジンを使いづらくなるという事態を避けようとします。そのための措置として、重複コンテンツと認識したコンテンツの評価を下げたり、検索結果から排除したりするのです。

自分のサイトのコンテンツが検索結果ページで見つけられないときは、知らず知らずのうちに外部のサイトのコンテンツと重複していると判断されてしまっている場合もありますので、前述した方法で確認することをおすすめします。

3-2.リンクが分散する

自分のサイトの中で重複コンテンツがある場合は、リンクが分散してしまうという問題があります。

Googleは、被リンクが多いページを人気が高いと判断して、検索結果の上位に表示させる傾向があるため、SEO対策としてリンクを集めることは非常に重要です。

ところが、自分のサイト内で同一の内容のページであるにも関わらず、「http://www.example.com/」や「http://example.com/」など、複数のURLが存在する場合は、外部からのリンクも分散してしまい正当な評価を得られません。

例えば、「http://www.example.com/」のURLに1,500の被リンクがあり、「http://example.com/」のURLにも1,500の被リンクがあった場合、本来なら3,000の被リンクを得られていたはずが、1,500の被リンクしか得られていないことになってしまうため、単純に損と言えるでしょう。

このような事態を避けるためにも、後述する「URLの正規化」や「アノテーション」を行います。

3-3.ペナルティ対象になる

重複コンテンツは、Googleのペナルティ対象になる可能性があります。

ただし、あくまで「可能性」であって、全ての重複コンテンツがペナルティにより検索結果に表示されなくなるわけではありません。実際、Googleは公式に「サイトに重複するコンテンツが存在しても、偽装や検索エンジンの結果を操作する意図がうかがえない限り、そのサイトに対する処置の根拠とはなりません。」(引用:Google検索セントラル)と明記しています。

簡単に言えば、たとえ複数のコンテンツで重複する文章が認められた場合でも、盗作や偽装、Googleアルゴリズムの悪用など、悪意を持って作成されたものでない限り、ペナルティの対象にはなりにくいです。

逆に、意図的な重複コンテンツはペナルティの対象となるため、そのコンテンツだけでなくサイト全体の評価を下げてしまいます。一度ペナルティの対象になると、改善をして再度審査を受けても、以前の評価が戻ってくる保証はありません。既存のコンテンツの盗作行為などは、絶対に行わないようにしましょう。

4.重複コンテンツをチェックする方法

重複コンテンツを確認する方法は以下の3つです。

  • Googleサーチコンソールを使う
  • コピぺチェックツールを使う
  • Google検索のコマンドを使う

Webサイト内の重複に加えて記事コンテンツの確認方法を解説します。

〇Googleサーチコンソールを使う

Googleサーチコンソールで以下の手順から、Webサイト内の重複コンテンツが確認できます。

  1. セキュリティと手動による対策
  2. 手動による対策
  3. 「問題は検出されませんでした」が出れば確認完了

問題が検出された場合は、Googleサーチコンソールの指示に沿って改善を進めましょう。

〇コピぺチェックツールを使う

コピペチェックツールは、Webページ内の文章がコピーされたコンテンツかどうかを判定する無料ツールです。

確認したい文章を「調査対象テキスト」に貼り付け「コピペチェックする」をクリックすれば確認できます。

調査結果で良好と出れば、重複コンテンツではないといえます。一方で、重複した文章が多いと、以下のようにコピーコンテンツと判断されるので修正や改善が必要です。

〇Google検索のコマンドを使う

Google検索結果URLの末尾に「&filter=0」を追加して再検索すると、該当するURLと重複したコンテンツを確認できます。

Googleは、類似率の高いコンテンツは検索結果に表示しないようフィルタをかけているため、「&filter=0」を追加してフィルタを除外した検索結果を表示させているのです。

検索結果に表示されているはずのWebページが表示されていない場合、フィルタを除外して確認すれば、重複コンテンツと判定されて除外されているかどうかを確認できます。

5.重複コンテンツ6つの対策方法

ここでは重複コンテンツの対策方法を6つ紹介します。

1.301リダイレクトの設定

301リダイレクトとは、特定のページに流入したユーザーを別のページに転送させる方法です。ホームページがリニューアルした際に、古いURLから新しいURLに転送させたいときなどに利用されます。

例えば、ホームページのドメインにwwwが付いているURLから付いていないドメインに正規化したい場合は、以下のようなコードをhtaccessファイルに記述して実行できます。

1 Options +FollowSymLinks

2 RewriteEngine on

3 RewriteCond %{HTTP_HOST} ^www\.ferret-one\.com$

4 RewriteRule ^(.*)$ https://ferret-one.com$1 [R=301,L]

301リダイレクトはSEO評価もそのまま引き継げるので、大幅なドメイン変更をした際には必ず設定しておきましょう。

2.canonicalの設定

canonicalタグとは、重複するコンテンツの中で正規化させたいURLを決定しGoogleのクローラーに伝えるHTMLタグのことです。

正規化したいURLにcanonicalタグを付与して、HTMLの<head>タグ内に設置することで重複コンテンツを改善できます。

例えば、「https://ferret-one.com/」が統一したいURLの場合、以下のコードを<head>内に記述すればGoogleのクローラーに正規URLだと認識させることができます。

<link rel=”canonical” href=”https://ferret-one.com/”>

主に記事コンテンツや商品ページの重複を改善する際に活用する施策です。

3.noindexの設定

noindexとは、Googleのクローラーにコンテンツをインデックスさせないための指示のことです。noindexの設定を行えばインデックスされなくなるため、重複コンテンツが検索結果に表示されなくなり、ペナルティを回避できます。

canonicalタグが重複コンテンツを統一するやり方である一方、noindexはそもそもインデックスさせないという手法です。

ただし、noindexの設定を行ってもインデックスされないだけでクローラーは回遊するため、価値のない不必要なWebページであれば削除するのもいいでしょう。

4.alternateタグの設定

alternateタグとは、スマートフォン用のURLが存在することをGoogleに伝えるためのHTMLタグです。alternateタグを使えば、パソコン用のURLと同じものであるとGoogleが認識できるため重複を改善できます。

以下のようなコードを<head>タグ内に記述することでコンテンツの重複を防げます。

<link rel=”alternate” media=”only screen and (max-width: 640px)” href=”https://ferret-one.com/sh/” />

ただし、Google公式の見解では、同じWebサイトで別々のURLを使用するのは推奨されていません。そのため、パソコンとスマートフォン両方のデザインを実装できるレスポンシブWebデザインを検討するといいでしょう。

5.オリジナルコンテンツの作成

コンテンツ作成において、オリジナルコンテンツの作成は基本です。ただし、Webページが多くなってくると定型文で作成されたページも増えるため、重複コンテンツが多くなりがちです。

特に記事コンテンツでの著者情報や商品・サービスの定型文は定型文になりやすいため、要約文を用意して詳細ページにリンクするなどの対策が有効になります。

コンバージョンや権威性の担保などの狙いがある場合は無理に実施しなくてもよいですが、重複コンテンツとして判定されるページが多くなってきた際は検討してみてください。

6.外部サイトへの削除申し立て

外部サイトに重複コンテンツがある場合は、先方に削除申し立てを行いましょう。外部サイト先が削除申し立てに応じない場合は、Googleサーチコンソールから検索エンジンへ申し立ても可能です。

参考:著作権問題によるコンテンツの除外

6.重複コンテンツ対策を万全にしよう

重複コンテンツが過度に存在していると、SEOや検索順位に悪影響が出る可能性があり、最悪の場合はペナルティとして検索結果に表示されなくなってしまいます。

自社サイト内外に重複コンテンツがあるかを確認する方法として、Googleサーチコンソールなどの外部ツールを使うといいでしょう。

対策としては301リダイレクトやcanonicalタグやnoindexの設定などを積極的に行うと改善につながりやすくなります。

重複コンテンツ対策を万全にして、適切なSEO評価を受けられるようにしましょう。

【東証プライム企業も多数利用!】最先端のSNSマーケティングツール「Tofu Analytics」、「InstantWin」とは?