wget でウェブページやウェブサイトを取得する方法(オプション指定方法)

wget

wget でウェブのコンテンツを取得するときの説明です。サイトのミラー取得などにも使えるかと思います。

最低限のオプション

最低限で設定するオプションは以下の3点でしょう。

  • -pオプション
  • -rオプション
  • -lオプション

それぞれのオプションの説明をします。

-pオプション

htmlファイルのみでなく、埋め込まれている画像なども取得するというオプションです。必須でしょう。

-rオプション

ページ内のリンクをたどってくれるオプションです。まず必須だと思います。

-lオプション

-rオプションが有効な場合に、どれだけの数のリンクをたどってくれるかを指定するオプションです。-lのあとに数字を与えて指定します。例えば-l 3のような感じになります。

数字に0を指定した場合は無限にリンクを取得(存在する全てのリンクを取得)になります。

コマンドの具体例と結果

上記の3つのオプションを指定した場合に作られるコマンドの具体例は以下のようになります。

$ wget -p -r -l 1 http://www.geocities.co.jp/Bookend/2172/walpurgis/index.html

このコマンドを実行すると、カレントディレクトリにwww.geocities.co.jpというディレクトリが作られて、その配下にウェブと同じディレクトリ構成でファイルが保存されます。

他のオプション

他にもオプションがありますので調べてみるとよいと思います。例えば-pオプションは指定したディレクトリ配下に保存をしてくれるオプションです。-p ./mirror_siteのように使います。

参考(感謝!)

Powered by はてなブログ