archive.org web archiveに保存された恥ずかしい過去ログを消す方法

wayback machine(ウェイバックマシン)というものがあります。

↓ご存知ない方はこちらに好きなアドレスを入力してください。
http://archive.org/web/web.php

archive0

たとえばヤフーをいれてみますと。

こんな感じにカレンダーが表示されます。

上の部分の「年」の表示をみると、1995年から遡れるようです。

ちなみにこの画面↑が1996年11月10日のヤフーだそうです。
多少表示はくずれていますが、十分わかります。
なつかしいですね。

さて、このように過去のコンテンツを遡るには非常に便利なサービスです。

すでに消えてしまったサイトでも、アドレスを覚えていれば遡ることは可能!

・・・・ということはそうです!

過去にあなたが作った「○○のホームページへようこそ!Sorry Japanese Only! あなたは000000番目のお客様です!」も保存されている可能性があるのです!

archive3


↑これは、ウェイバックマシンで表示した1999年11月28日の水産庁のホームページです。

・・・・

ということで前置きが長くなりましたが、

ウェイバックマシンの過去ログを抹消する方法です。

公式の説明はこちら
– http://archive.org/about/exclude.php
↑こちらで説明されていることは↓です

1)「robots.txt」を作る
テキストファイル(メモ帳)で、以下の内容をコピペし


User-agent: ia_archiver
Disallow: /

robots.txtという名前で保存

2)「robots.txt」を、トップディレクトリ(ドメイン直下)におく。

example.comだとしたら、
– http://example.com/robots.txt になるように置く。

以上。

あとは放置。
クローラーが回ってくるので、しばらくするとすべて消されます。

しかし!結構時間がかかります。

自分はいくつかのサイトを消したのですが、同じサーバに置いていても、消える時間にはばらつきがありました。

1日で消えたものもあれば、10日かかったものもあります。
途中、早く消えないかしらと思ってalexa.comにURLを入力したりもしましたが、入れても入れなくても時間は変わらなかった気がします。


– http://www.alexa.com/ ←ここの中央部にURLを入れて虫眼鏡をクリック。

いずれにせよ、気長に待つと完全に消えました。

web-archive


消えるとこういう感じになります。

すでにドメインが消滅している・自分でファイルアップロードが出来ない場合

↓以下のように書いてあります。

If you cannot put a robots.txt file up, read our exclusion policy. If you think it applies to you, send a request to us at info@archive.org.

↓削除ポリシーを読んで、あてはまるならinfo@archive.orgにメールしろとのこと。
– http://www2.sims.berkeley.edu/research/conferences/aps/removal-policy.html

こちらについては、以下のサイトが詳しいです!ありがとうございます!
– http://blue.ribbon.to/~korokan/?http://blue.ribbon.to/~korokan/reference/iawm.html

タイトルとURLをコピーしました