wayback machine(ウェイバックマシン)というものがあります。
↓ご存知ない方はこちらに好きなアドレスを入力してください。

たとえばヤフーをいれてみますと。

こんな感じにカレンダーが表示されます。
上の部分の「年」の表示をみると、1995年から遡れるようです。

ちなみにこの画面↑が1996年11月10日のヤフーだそうです。
多少表示はくずれていますが、十分わかります。
なつかしいですね。
さて、このように過去のコンテンツを遡るには非常に便利なサービスです。
すでに消えてしまったサイトでも、アドレスを覚えていれば遡ることは可能!
・・・・ということはそうです!
過去にあなたが作った「○○のホームページへようこそ!Sorry Japanese Only! あなたは000000番目のお客様です!」も保存されている可能性があるのです!

↑これは、ウェイバックマシンで表示した1999年11月28日の水産庁のホームページです。
・・・・
ということで前置きが長くなりましたが、
ウェイバックマシンの過去ログを抹消する方法です。
公式の説明はこちら
https://archive.org/about/exclude.php
↑こちらで説明されていることは↓です
1)「robots.txt」を作る
テキストファイル(メモ帳)で、以下の内容をコピペし
User-agent: ia_archiver
Disallow: /
robots.txtという名前で保存
2)「robots.txt」を、トップディレクトリ(ドメイン直下)におく。
example.comだとしたら、
– http://example.com/robots.txt になるように置く。
以上。
あとは放置。
クローラーが回ってくるので、しばらくするとすべて消されます。
しかし!結構時間がかかります。
自分はいくつかのサイトを消したのですが、同じサーバに置いていても、消える時間にはばらつきがありました。
1日で消えたものもあれば、10日かかったものもあります。
途中、早く消えないかしらと思ってalexa.comにURLを入力したりもしましたが、入れても入れなくても時間は変わらなかった気がします。

– http://www.alexa.com/ ←ここの中央部にURLを入れて虫眼鏡をクリック。
いずれにせよ、気長に待つと完全に消えました。

消えるとこういう感じになります。
すでにドメインが消滅している・自分でファイルアップロードが出来ない場合
↓以下のように書いてあります。
If you cannot put a robots.txt file up, read our exclusion policy. If you think it applies to you, send a request to us at info@archive.org.
(訳)あなたがrobots.txtファイルをアップできない場合、削除ポリシーを読んでください。もしこれがあなたに当てはまるなら、 info@archive.orgに申請してください。
↓削除ポリシーを読んで、あてはまるならinfo@archive.orgにメールしろとのこと。
https://help.archive.org/help/how-do-i-request-to-remove-something-from-archive-org/
こちらについては、以下のサイトが詳しいです!ありがとうございます!?http://blue.ribbon.to/~korokan/reference/iawm.html