サイトの過去を見る・調べる方法とは?

すでに公開されているサイトの過去を見たいと思ったことはないでしょうか?人気のサイトがどういった過程を得てリニューアルされてきたのか、時系列に見ていくことはWEB担当者であれば勉強になります。

現在、過去のサイトを保存し見ることができるツールは複数ありますが、その中でも無料で簡単に時系列で遡れるWayback Machineを紹介・解説します。

Wayback Machineとは

Wayback Machineは、WEB上に公開されているサイトをインターネットアーカイブ(Internet Archive)によって保存し閲覧できるサービスです。ユーザは無料で使用でき、運用資金は寄付でまかなわれております。

インターネットアーカイブ(Internet Archives)はアメリカのサンフランシスコで発足した非営利団体です。保存されているものであれば自社サイトはもちろん、競合サイトも閲覧することができます。

Wayback Machineは3億5000万を超えるサイトのホームページへの数千億のリンクから用語を評価することによって構築されたインデックスに基づいています。

但し、本格的にWEBサイトをクローリングしたのは2010年の後半とされている為、それ以前を閲覧できないこともあります。

ウェイバックマシンで閲覧可能なウェブアーカイブは、1996年のサービス開始当時はアレクサ・インターネットから提供されたデータが元であったが、インターネットアーカイブは2010年後半から独自の大規模Webクローリングを開始し、現在では自身で収集したデータが半分以上を占める。以前はデータ収集から公開まで半年から一年かかっていたが、独自のWebクローリングと2013年の技術革新により、数時間から一日で公開されるようになった。また「Save Page」で保存されたものは即時に閲覧可能である。

https://ja.wikipedia.org/wiki/インターネットアーカイブ

Wayback Machineの使い方

実際にWayback Machineを使って、過去の「Yahoo! JAPAN」 を調査していきます。

対象となるサイトのURLで検索する

まずは、「Wayback Machine」にアクセスします。URLを入力し、「BROWSE HISTORY」のボダンをクリックします。

調べたい年月、日付を選択する

棒グラフ

画面上部には年単位で棒グラフが表示されます。更新が多いほど棒グラフは長くなります。棒グラフをクリックすると該当する年のカレンダーが表示されます。

日付の背景にある円

変更点が大きいほど日付の背景にある円は大きくなります。また、色でその時のページのステータスコードを示しています。

  • 青:2xx
  • 緑:3xx(リダイレクト)
  • オレンジ:4xx(クライアントエラー)
  • 赤:5xx(サーバエラー)

日付にカーソルを合わせると、保存した時間が表示されるのでクリックします。

問題がなければ、下記のようにページが表示されます。表示されたサイトのリンクも、クリック先が保存されていれば閲覧することができます。

もちろん、該当する保存データがない場合は表示されません。

WaybackMachine上でページを保存する方法

WaybackMachineのトップページにある「Save Page Now(今すぐページを保存)機能」を使用して、特定のページを1回保存できます。これは現在、将来のクロールにURLを追加したり、その1ページ以上を保存したりすることはありません。複数のページ、ディレクトリ、またはサイト全体を保存することはありません。

WaybackMachineから自分のサイトのページを除外または削除する方法

削除申請はEメールで行うことができます。メッセージに該当するURL(Webアドレス)を記載して、info@archive.org宛におくります。所有者確認が必要になります。証明できる管理者メールアドレス、SNSアカウントなどを用意しておきましょう。

自動でWaybackMachineに保存されないようにする方法

事前にWaybackMachineにクローリングされないように、クローラーを拒否することを設定しておくことが必要です。クローラーは「robots.txt」に下記の内容を記述することで拒否することができます。

User-agent: ia_archiver
Disallow: /

Wayback Machine以外で調べる方法

「Wayback Machine」以外でもサイトの過去を調べるツールはあります。「Wayback Machine」でお目当てサイトやページが見つからない場合には、おすすめです。

魚拓サービス

魚拓サービスは「株式会社アフィリティー」という日本企業が運営しています。特徴としてはURL検索だけでなく、キーワード検索もできるところです。例えば元ページはなくなっても、それを引用していたページを探すことができます。証明用・資料用非公開として有料サービスもあります。

Wayback Machineの活用方法

Wayback Machine(インターネットアーカイブ)は単に過去のサイトやページを見るだけでく、様々な場面で活用できます。

  • 中古ドメイン購入時に過去運営されていたサイトの状態を知る
  • 競合サイトの検索順位が上昇した場合、サイトの変更点を知る
  • サイトの改ざんが発生した場合の時期を推測する
  • 競合サイトのUI変更を見て、自サイトの参考にする
  • 誹謗中傷など裁判における証拠として使用する

今回は、サイトの過去を見る方法・調べ方についてご説明しました。

このように、Wayback Machine(インターネットアーカイブ)を使って過去のサイトをみることで、SEOやUI改善にも役立ち勉強にもなります。

Wayback Machine(インターネットアーカイブ)無料で誰でも使えるので、まだ使用したことが無い方は是非活用してみてください。(各ブラウザのアドオンやプラグインもあります。Chrome FireFox

タイトルとURLをコピーしました