体調不良のため長らくお休みしていました、過去をさかのぼって更新していきます。

archive.org web archiveに保存された恥ずかしい過去ログを消す方法

[PR] 記事内には広告が含まれています。

wayback machine(ウェイバックマシン)というものがあります。

↓ご存知ない方はこちらに好きなアドレスを入力してください。

Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine

たとえばヤフーをいれてみますと。

こんな感じにカレンダーが表示されます。

上の部分の「年」の表示をみると、1995年から遡れるようです。

ちなみにこの画面↑が1996年11月10日のヤフーだそうです。
多少表示はくずれていますが、十分わかります。
なつかしいですね。

さて、このように過去のコンテンツを遡るには非常に便利なサービスです。

すでに消えてしまったサイトでも、アドレスを覚えていれば遡ることは可能!

・・・・ということはそうです!

過去にあなたが作った「○○のホームページへようこそ!Sorry Japanese Only! あなたは000000番目のお客様です!」も保存されている可能性があるのです!

archive3


↑これは、ウェイバックマシンで表示した1999年11月28日の水産庁のホームページです。

・・・・

ということで前置きが長くなりましたが、

ウェイバックマシンの過去ログを抹消する方法です。

公式の説明はこちら

https://archive.org/about/exclude.php

↑こちらで説明されていることは↓です

1)「robots.txt」を作る
テキストファイル(メモ帳)で、以下の内容をコピペし


User-agent: ia_archiver
Disallow: /

robots.txtという名前で保存

2)「robots.txt」を、トップディレクトリ(ドメイン直下)におく。

example.comだとしたら、
– http://example.com/robots.txt になるように置く。

以上。

あとは放置。
クローラーが回ってくるので、しばらくするとすべて消されます。

しかし!結構時間がかかります。

自分はいくつかのサイトを消したのですが、同じサーバに置いていても、消える時間にはばらつきがありました。

1日で消えたものもあれば、10日かかったものもあります。
途中、早く消えないかしらと思ってalexa.comにURLを入力したりもしましたが、入れても入れなくても時間は変わらなかった気がします。


– http://www.alexa.com/ ←ここの中央部にURLを入れて虫眼鏡をクリック。

いずれにせよ、気長に待つと完全に消えました。

web-archive


消えるとこういう感じになります。

すでにドメインが消滅している・自分でファイルアップロードが出来ない場合

↓以下のように書いてあります。

If you cannot put a robots.txt file up, read our exclusion policy. If you think it applies to you, send a request to us at info@archive.org.

(訳)あなたがrobots.txtファイルをアップできない場合、削除ポリシーを読んでください。もしこれがあなたに当てはまるなら、 info@archive.orgに申請してください。

↓削除ポリシーを読んで、あてはまるならinfo@archive.orgにメールしろとのこと。
https://help.archive.org/help/how-do-i-request-to-remove-something-from-archive-org/

こちらについては、以下のサイトが詳しいです!ありがとうございます!
?http://blue.ribbon.to/~korokan/reference/iawm.html