多くのニュースサイト等では、掲載から一定期間が経過すると記事が削除されて、ブックマークに登録しておいて、あとから検索しようとしてもページが消えてしまうことがよくあります。
HPを保存するサービスとして、先日紹介したInternet Archiveがあり、それはシステムが決めたスケジュールで不定期的にコピーしに行くので、コピーを取りに行く間隔次第では、取りこぼしの発生することがあります。
コピーを取る間隔は自分で指定できません。
その補完サービスとして、ウェブ魚拓というサービスがあります。
名前の通り写真を撮るように、ある瞬間のウェブをコピーすることが出来ます。
(それにしてもウェブ魚拓とはうまいネーミング・・・(^^; )
何年も見てきた感じ、一度保管された物は、明らかな違法の物は消されることがあっても、法律違反でないものは謎の大人の事情で消されることも、ほとんどないと感じています。
<使い方>
1.保存したいHPのURLをコピーします。
ここでは一例として、粉飾決算で社長逮捕のニュースにしておきます。
2.コピーしたURLをウェブ魚拓に貼り付け右横の【検索と確認】ボタンを押します。
3.【取得】ボタンをクリックします。
4.スクリーンショット撮ろうとしたら・・・mOm
気を取り直し、、、これもいい例です。。。^^;
サイトにrobots.txtをおいて、ロボットのクロールを拒否しているサイトは。このようにブロックされます。説明は ↓↓↓
スクリーンショットはこの前の物と違いますが急きょ以下に差し替え。
取得が完了すると、自動的に取得済みページが表示されます。
同時にURLも表示されるので、URLをコピーすれば魚拓取得完了です。
ニュースサイトコピー以外でも様々活用できるので、使い方を考えてみては?
ちなみにこれでサイトコピーすると、Googleの検索インデックスにも入ります。
キーワード site:megalondon.jp
で、google検索をすると半永久的に残ります。
site:megalondon.jp という検索オプションは、megalondon.jpサイトを検索対象として、キーワードを検索して、という意味です。