wget
wget
でウェブのコンテンツを取得するときの説明です。サイトのミラー取得などにも使えるかと思います。
最低限のオプション
最低限で設定するオプションは以下の3点でしょう。
-p
オプション-r
オプション-l
オプション
それぞれのオプションの説明をします。
-p
オプション
html
ファイルのみでなく、埋め込まれている画像なども取得するというオプションです。必須でしょう。
-r
オプション
ページ内のリンクをたどってくれるオプションです。まず必須だと思います。
-l
オプション
-r
オプションが有効な場合に、どれだけの数のリンクをたどってくれるかを指定するオプションです。-l
のあとに数字を与えて指定します。例えば-l 3
のような感じになります。
数字に0
を指定した場合は無限にリンクを取得(存在する全てのリンクを取得)になります。
コマンドの具体例と結果
上記の3つのオプションを指定した場合に作られるコマンドの具体例は以下のようになります。
$ wget -p -r -l 1 http://www.geocities.co.jp/Bookend/2172/walpurgis/index.html
このコマンドを実行すると、カレントディレクトリにwww.geocities.co.jp
というディレクトリが作られて、その配下にウェブと同じディレクトリ構成でファイルが保存されます。
他のオプション
他にもオプションがありますので調べてみるとよいと思います。例えば-p
オプションは指定したディレクトリ配下に保存をしてくれるオプションです。-p ./mirror_site
のように使います。