Ruby/Mechanizeでのスクレイピングで対象の要素を絞り込む方法と複数のURLを処理する方法
RubyでMechanizeを使用しでスクレイピングを行いたいです。
<div id="movie_photo">
<a href="movie/83603/">
<img alt="ポスター画像" src="画像のURL">
という構成のWEBサイトから、画像のURLを取得したいです。
問題が2つあります。
1つめが
require 'mechanize'
agent= Mechanize.new
page = agent.get("http://eiga.com/movie/83603/")
elements = page.search('a img')
elements.each do |ele|
puts ele.get_attribute('src')
end
のように記述したら、そのWEBサイト内の他のa img src 構造の欲しくないURLの情報も取ってきてしまいました。
2つめが
上記のコードでは1このWEBサイトから1このURLの情報も取って来るように記述しようとしていますが、page = agent.get("http://eiga.com/movie/83603/")
で指定したURLの連番の/83604/,
/83605/,/83606/....の計20個のa img src 構造の欲しいURL情報も取りたいということです。
links=[]と記述するようですがどうコードを記述すればいいのかわかりません。
欲しいURL1個だけを取得して、連番のURLの20個の欲しいURLも一遍に取得できるようなコードを書きたいです。
お願いいたします。