URL からディレクトリ名だけを取得する

require 'uri'

url = URI.parse('http://ja.wikipedia.org/dir/test/wiki/%E5%BD%B9%E6%89%80%E5%BA%83%E5%8F%B8')
path = url.path.sub(/^(\/)/, '')
p path.scan(/(.*?)\//)

url = URI.parse('http://headlines.yahoo.co.jp/hl')
path = url.path.sub(/^(\/)/, '')
p path.scan(/(.*?)\//)

url = URI.parse('http://headlines.yahoo.co.jp/hl?a=20080406-00000033-jij-soci')
path = url.path.sub(/^(\/)/, '')
p path.scan(/(.*?)\//)

url = URI.parse('http://www.amazon.co.jp/gp/product/B0014W25HY/ref=s9newrf_c4_img2-rfc_p?pf_rd_m=AN1VRQENFRJN5&pf_rd_s=center-2&pf_rd_r=0ESPKSBSGS6C240NGMMX&pf_rd_t=101&pf_rd_p=70116906&pf_rd_i=489986')
path = url.path.sub(/^(\/)/, '')
p path.scan(/(.*?)\//)

実行結果。

% ./get_path.rb
[["dir"], ["test"], ["wiki"]]
[]
[]
[["gp"], ["product"], ["B0014W25HY"]]