検索エンジンに残ったウェブページのキャッシュを削除する方法

基本的に、検索エンジンにキャッシュされているウェブページの古い情報を消去したいときには「noarchive タグ」を利用します。

たとえばネットショップの商品ページで、商品の種類や値段が頻繁に変わる場合などに使われるそうです。メンバーシップ制サイトでも利用されているとか。また古いキャッシュデータを盗んで無許可で使われるケースを防ぐために利用される場合もあるといいます。

今回、サイトの重要な変更をしたにもかかわらず、なかなかインデックスに反映されないようなので、Google にある古いキャッシュデータを削除するようにリクエストをしてみました。これにより検索結果にサイトの説明文などの表示がなくなり、キャッシュにあるデータにもアクセスできないようにしてしまいます。

ウェブページのキャッシュを削除するには

Google ウェブマスターツールのヘルプでは以下のように説明されています。

ページのキャッシュ コピーを削除するには、noarchive メタ タグをページに追加するか、ページのコンテンツを変更する必要があります。一般的に、キャッシュを完全に削除するには noarchive メタ タグを使用します。Google がそのページを再クロールして最新のコンテンツでキャッシュを更新するまで一時的にキャッシュを削除するには、コンテンツを変更します。

コンテンツを削除するための要件 – ウェブマスター ツール ヘルプ

つまり、キャッシュを完全に削除するには、noarchive メタタグをHTMLで記述するか、コンテンツを完全に別のものにしてしまえばいい、ということですね。クローラーが来て変更を認識するには多少の時間がかかりますから、検索エンジンのキャッシュがすぐに無くなるわけはありませんが、再クロールされた際には一新されるというわけです。

サイトにnoarchive メタタグを記述する方法

自身のサイトでは、HTML の<head>~</head>内につぎのコードを挿入します。

これで検索エンジンのクローラーが来たとき、ウェブページの情報をキャッシュとして保存しないように指示するわけです。常に現在のページしか見れないようにしてしまいます。

ただし、この方法ではクローラーがいつやって来て該当ページのデータを更新してくれるのかわかりません。気長に待つ方法になります。

Google ウェブマスターツールでウェブページのキャッシュを削除する方法

こちらは直接Google へキャッシュ削除のリクエストを送る方法です。全てのリクエストが直ちに処理されるわけではないですが、通知しておくほうがよいでしょう。

注意書き

「URLの削除に関する問題」にはこう書かれていました。

ページのキャッシュ コピーが削除された後も、Googlebot が次にそのサイトをクロールするまでの間は、そのページのタイトルと URL が同じ検索キーワードでの検索結果に引き続き表示されることに注意してください。その間ユーザーは引き続きライブ ページにアクセスできます。この情報はライブ ページから削除されているため、次回のクロール後に、関連するキーワードでの検索結果にこのページは表示されなくなります。既にご存知のことと思いますが、Google のスパイダーは定期的にウェブをクロールしてインデックスを再構築しています。Google のクロール プロセスは完全自動化されており、個々のサイトをクロールする頻度はさまざまな要因の影響を受けるため、このページの次回クロールがいつになるかをお知らせすることはできません。対応が完了するまで、しばらくお待ちくださいますようお願い申し上げます。

URL の削除に関する問題 – ウェブマスター ツール ヘルプ

リクエストが全て要求通りに処理されるわけではありませんし、キャッシュが削除されたからといっても検索結果には表示されるようです。今回はURLそのものを検索結果から完全に削除するわけではなく、あくまでキャッシュデータのみを削除したいので、これでかまいません。

Google ウェブマスターツールでやってみた

まずGoogle ウェブマスターツールにログインします。こちらから削除リクエストを送信します。

 

Google ウェブマスターツール 管理画面

該当サイトをクリックしてから、左にあるメニューの「Google インデックス」→「URL の削除」へと行きます。

 

URLの削除画面

「新しい削除リクエストを作成」をクリックしてください。

ウェブマスターツール キャッシュ削除選択

ここに該当するウェブページのURLを入力します。 正しく入力してから「続行」をクリック。

 

リクエスト送信

すると、このような画面に変わります。「URL:該当ページ」が正しいことを確認してください。次に「理由:◯◯◯」を変更します。

 

キャッシュからのみページを削除

「理由」は以下の3つから選択できます。

  • 検索結果とキャッシュからページを削除
  • キャッシュからのみページを削除
  • ディレクトリを削除

たとえば、重複する2つのウェブページのどちらか一方だけを、インデックスから完全に消したいときには1番目を選びます。また、サイトのURL移行が終了するなどで、元のURLデータを削除したい場合には3番目です。

今回は検索エンジンに残ったキャッシュデータのみを削除したいので2番目を選択しました。あとは「リクエストを送信」をクリックします。

 

完了画面

すると上部に「http://該当するウェブページのURLを削除の対象にしました」と表示され、下の欄に今回リクエストを送信したURLが追加されます。

ステータスには「保留中」、削除の種類には「キャッシュの削除」、リクエスト済みには「日付」が記載されているので、間違いがなければこれで完了です。

もし間違った場合は「キャンセル」でリクエストを取り消せます。

あとは待つだけ

リクエストが送信されたからといって、すぐに変更されるわけでもありません。失敗した場合は再度送信するとよいでしょう。「成功」の場合には、以下のように処理されます。

成功

リクエストが処理され、送信された語句がそのページに存在しないことを Google が確認すると、検索結果にスニペットが表示されなくなり、キャッシュにあるページもアクセス不可能になります。このページのタイトルと URL は引き続きアクセス可能であり、削除されたコンテンツに関連する検索の結果にエントリが表示されることがあります(前述の語句がスニペットには表示されていなくても)。ただし、ページが再びクロールされ、インデックスに登録されると、更新されたスニペットとキャッシュ ページが検索結果に表示されるようになります。

ページのキャッシュからの削除をリクエストする – ウェブマスター ツール ヘルプ

もちろん、該当するウェブページのコンテンツが全く変更されていなければ、再クロールされた後にも同じ内容が表示されます。リクエストを送信する前に、該当するウェブページのコンテンツが変更されているかを確認して下さい。また、永続的にキャッシュデータを保存されたくければnoarchive メタタグを記述しておきましょう。

自身のサイトとGoogle の検索エンジンの両方に対処しておくことで期待する結果が生まれるとおもいます。

 

初めてやってみましたが、翌日にはリクエストの送信が「成功」されました。あとは再クロールされるのを待つだけです。

関連記事

WordPress の運用に特化した「wpX レンタルサーバー」が初期費用無料キャンペーン中!

「wpX レンタルサーバー」はエックスサーバー社の提供するサービスひとつで、「WordPress の運用に特化したレンタルサーバー」です。 WordPress の運用に特化したレンタルサーバー いままでに無料ブログサービスをやっていてこれを…

エックスサーバーの 「mod_pagespeed設定」で Google のサイト高速化ツールをインストールしよう!

エックスサーバー社で簡単に「mod_pagespeed」が使えるようになった 2014年11月17日(月)にエックスサーバー社から新しい発表がありました。サーバー全プランに対して、Google 社の開発・提供している Apache 拡張モジ…

Google AdSense の住所(PIN)の確認手続き

Google AdSense で一定額の収益を上げると、ホーム画面でつぎのような通知が表示されます。 お客様の住所の確認が完了していないため、お客様のお支払いは現在保留中となっています。PINが郵送で届き次第、ここをクリックして住所の確認手…