wget で URLエンコードされた文字列が含まれる URL の対処方法
あとで、考える。
GNU Wget 1.11 Manual
wget の使い方で質問です。ダウンロードしたいファイル名に日本語が…
Wikipedia 形式の URL の場合。
% wget -O index.html http://ja.wikipedia.org/wiki/%E3%82%AB%E3%83%AA%E3%83%BC%E5%8C%96 --2008-03-21 23:06:58-- http://ja.wikipedia.org/wiki/%E3%82%AB%E3%83%AA%E3%83%BC%E5%8C%96 ja.wikipedia.org をDNSに問いあわせています... 203.212.189.253 ja.wikipedia.org|203.212.189.253|:80 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 200 OK 長さ: 20156 (20K) [text/html] `test.html' に保存中 100%[========================================================================================================>] 20,156 --.-K/s 時間 0.1s 2008-03-21 23:06:59 (150 KB/s) - `index.html' へ保存完了 [20156/20156] %
Google 形式の URL の場合。
% wget -O index.html 'http://www.google.co.jp/search?hl=ja&q=%E3%81%AF%E3%81%A6%E3%81%AA&btnG=Google+%E6%A4%9C%E7%B4%A2&lr=' --2008-03-21 23:29:17-- http://www.google.co.jp/search?hl=ja&q=%E3%81%AF%E3%81%A6%E3%81%AA&btnG=Google+%E6%A4%9C%E7%B4%A2&lr= www.google.co.jp をDNSに問いあわせています... 66.249.89.147 www.google.co.jp|66.249.89.147|:80 に接続しています... 接続しました。 HTTP による接続要求を送信しました、応答を待っています... 200 OK 長さ: 特定できません [text/html] `index.html' に保存中 [ <=> ] 49,525 --.-K/s 時間 0.1s 2008-03-21 23:29:18 (476 KB/s) - `index.html' へ保存終了 [49525] % ls -l total 1 -rw-r--r-- 1 littlebuddha littlebuddha 49525 3 21 23:29 index.html %