jonasjohn.de
htmlSQLとな。SQLライクなクエリでスクレイピングやらかすというシロモノ。phpですがこれはおもしろい。
Scrapy(こっちはpython)つうのもあるんだな。こっちはxpathっぽい表現でやるみたい。
hxs = HtmlXPathSelector(response)
とかあるからほかのもあんのかな、時間あるときに調べる。
#
http://sourceforge.net/projects/simplehtmldom/
こんなのもあった。セレクタで行けるぽ