「このサイトを誰かに見られたら嫌だな。Googleの検索結果に表示されないようにしたいんだけど、どうしたらいいんだろう」
上記の疑問にお答えします
サイトや記事を作成したものの、事情によりGoogleの検索結果に表示されたくないというケースがあると思います。
そういった場合にどのように対処すれば良いかをこの記事ではご紹介していきたいと思います。
2種類の方法
Googleの検索結果に表示されないようにする場合は主に2種類の方法があります。
・HTMLのmeta robotsで指定する
・.htaccessで指定する
では具体的に上記の方法と違いについて見ていきましょう。
meta robotsやhtaccessによる記載はGoogleBotの動作を制御する設定です。
GoogleBotとは、Webサイトを回遊し、数多く存在するWEBサイトの様々な情報を取得しているロボットのようなものです。別名で、クローラーとも呼ばれます。
このGoogleBotがWEBサイトの情報を取得する事でページの検索順位を上げたり、ページの表示/非表示などを切り替えています。
では一つ目のHTMLのmeta robotsで指定する方法を見て行きましょう。
meta robotsで指定する方法
meta robotsでは、HTMLのhead内にmetaタグを記載して、name属性にrobotsを指定し、content属性に制御内容を記載します。
<meta name="robots" content="noindex">
上記のように記載すれば検索エンジンにサイトや記事を登録させないように出来ます。
他にもcontentの内容を以下のように記載する事も出来ます。
nosnipet:スニペットを表示させない
noimageindex:ページの画像を画像検索で表示させない
noarchive:ページのキャッシュを表示させない
.htaccessで指定する方法
二つ目の方法が.htaccessで指定する方法です。
PDFデータや画像などはmeta要素を記入することが出来ないため、これらのデータを検索結果に反映させたくない場合は.htaccsessに書き加えることになります。
書き方は以下です。
PDFを非表示にする方法
<Files ~ "\.pdf$">
Header set X-Robots-Tag "noindex"
</Files>
画像を非表示にする方法
<Files ~ "\.(png|jpe?g|gif)$">
Header set X-Robots-Tag "noindex"
</Files>
上記の「?」は直前の文字が0個、もしくは1個であることを意味する正規表現です。
この場合、jpe?gはjpeg、もしくはjpgに合致します。
上記のように記載することで画像やPDFファイルを検索結果から除外する事が出来ます。
ちなみに.httacessとは以下のようなものです。
.htaccessとはWebサーバーの基本的な動作を、ディレクトリ単位で制御するためのファイルです。
引用元:カゴヤのサーバー研究室
少し小難しいですが、要はwebサイト内の様々な挙動を管理する事が出来るファイルです。
例えば.htaccessを使う事で、https://◯◯◯.comというURLにアクセスした時にhttps://◯◯◯.netに自動で移動する「リダイレクト」が可能です。
WEBサイト内の挙動を管理できるものなんだな、と覚えてもらえたらと思います。
まとめ
というわけで本記事では記事やWEBサイトを検索結果に反映させたくない場合の方法について見てきました。
htmlやPHPファイルの場合はmeta要素を使用し、画像やPDFの場合は.htaccsessを使用すれば良かったですね。
ちょっとした時に使えるテクニックとして覚えておいて頂ければと思います。
それではまた次の記事でお会いしましょう。