気になったニュース等をその場で押さえたいときはウェブ魚拓【webarchiveとはちょっと違う】│ITエンジニアの独り言 IT系フリーランス~デジタルマーケティング~社内SE(何でも屋?)~秋葉原パソコン販売員 幅広い経験を元にIT/ネット関連の話を幅広く綴ったブログです

気になったニュース等をその場で押さえたいときはウェブ魚拓【webarchiveとはちょっと違う】

多くのニュースサイト等では、掲載から一定期間が経過すると記事が削除されて、ブックマークに登録しておいて、あとから検索しようとしてもページが消えてしまうことがよくあります。

HPを保存するサービスとして、先日紹介したInternet Archiveがあり、それはシステムが決めたスケジュールで不定期的にコピーしに行くので、コピーを取りに行く間隔次第では、取りこぼしの発生することがあります。

コピーを取る間隔は自分で指定できません。

その補完サービスとして、ウェブ魚拓というサービスがあります。

名前の通り写真を撮るように、ある瞬間のウェブをコピーすることが出来ます。

(それにしてもウェブ魚拓とはうまいネーミング・・・(^^;  )

megalodon.jp

何年も見てきた感じ、一度保管された物は、明らかな違法の物は消されることがあっても、法律違反でないものは謎の大人の事情で消されることも、ほとんどないと感じています。

ウェブ魚拓の考え方

<使い方>

1.保存したいHPのURLをコピーします。

www.itmedia.co.jp

ここでは一例として、粉飾決算で社長逮捕のニュースにしておきます。

2.コピーしたURLをウェブ魚拓に貼り付け右横の【検索と確認】ボタンを押します。

f:id:aagi123:20200719105243p:plain

3.【取得】ボタンをクリックします。

f:id:aagi123:20200719105555p:plain

4.スクリーンショット撮ろうとしたら・・・mOm

f:id:aagi123:20200720170525p:plain

気を取り直し、、、これもいい例です。。。^^;

サイトにrobots.txtをおいて、ロボットのクロールを拒否しているサイトは。このようにブロックされます。説明は ↓↓↓

megalodon.jp

スクリーンショットはこの前の物と違いますが急きょ以下に差し替え。

取得が完了すると、自動的に取得済みページが表示されます。

megalodon.jp

同時にURLも表示されるので、URLをコピーすれば魚拓取得完了です。

ニュースサイトコピー以外でも様々活用できるので、使い方を考えてみては?

ちなみにこれでサイトコピーすると、Googleの検索インデックスにも入ります。

f:id:aagi123:20200720173036p:plain

キーワード site:megalondon.jp

で、google検索をすると半永久的に残ります。

site:megalondon.jp という検索オプションは、megalondon.jpサイトを検索対象として、キーワードを検索して、という意味です。