URL からディレクトリ名だけを取得する
require 'uri' url = URI.parse('http://ja.wikipedia.org/dir/test/wiki/%E5%BD%B9%E6%89%80%E5%BA%83%E5%8F%B8') path = url.path.sub(/^(\/)/, '') p path.scan(/(.*?)\//) url = URI.parse('http://headlines.yahoo.co.jp/hl') path = url.path.sub(/^(\/)/, '') p path.scan(/(.*?)\//) url = URI.parse('http://headlines.yahoo.co.jp/hl?a=20080406-00000033-jij-soci') path = url.path.sub(/^(\/)/, '') p path.scan(/(.*?)\//) url = URI.parse('http://www.amazon.co.jp/gp/product/B0014W25HY/ref=s9newrf_c4_img2-rfc_p?pf_rd_m=AN1VRQENFRJN5&pf_rd_s=center-2&pf_rd_r=0ESPKSBSGS6C240NGMMX&pf_rd_t=101&pf_rd_p=70116906&pf_rd_i=489986') path = url.path.sub(/^(\/)/, '') p path.scan(/(.*?)\//)
実行結果。
% ./get_path.rb [["dir"], ["test"], ["wiki"]] [] [] [["gp"], ["product"], ["B0014W25HY"]]