1. カバレッジ 重複しています

一つのページがGoogle search consoleで除外されてしまいました。

除外メッセージ

送信されたURLが正規URLとして選択されていません

Google Search Console
Figure 1. スクリーンショット

この事象についての原因と対応方法を調べたので共有します。

2. HUGOのタクソノミーページが原因

原因はHUGOのタクソノミーページです。

私のブログではCategoryとTagの2つのタクソノミーを使用しています。そしてこの2つのタクソノミーに同じ単語を登録しているページが存在します。この場合にタクソノミーページの内容が同じになってしまい重複コンテンツと判断されます。

言葉では説明が難しいので例で説明します。

あるページのCategoryにasciidoctor、そしてTagにもasciidoctorを指定します。そうすると、

  1. Category=asciidoctorの一覧ページ ー> このページが一覧として表示

  2. Tag=asciidoctorの一覧ページ ー> このページが一覧として表示

が表示され結果として重複コンテンツとなってしまいます。

3. 原因と対応方法についての記事を検索

検索すると英語サイトで記事を見つけることができます。

Adjust your theme’s baseof.html file The file baseof.html defines the basic structure of your website. You can find it under layouts/_default of your theme’s folder. For example, my baseof.html is located under themes/Mainroad/layouts/_default/baseof.htm. Simply add this code within the head tag:

{{ if .Data.Singular }}
    <meta name="robots" content="noindex">
{{ end }}

タクソノミーが存在する場合にはrobotsにnoindexを指定します。

つまりタクソノミーページを検索の対象外とします。

この対応方法で検索対象から除外できますが、もしタクソノミーページがランディングページとして価値がある場合に検索対象から除外するのはもったいないのでやめたほうが良さそうです。

4. 別のアナログな対応方法

アナログな方法ですがCategoryとTagに同じ単語を使うことをやめましょう。

私の場合はCategoryとTagの2つのタクソノミーを使用する必要性が低いのでTag一本で行こうかなと考えています。これで重複コンテンツを避けることができます。

5. まとめ

タクソノミーページは重複コンテンツが発生するかもしれないので気をつけましょう。

この記事では調べた原因と対応方法を共有しました。

今回は以上です。