jonasjohn.de
htmlSQLとな。SQLライクなクエリでスクレイピングやらかすというシロモノ。phpですがこれはおもしろい。

Scrapy(こっちはpython)つうのもあるんだな。こっちはxpathっぽい表現でやるみたい。
hxs = HtmlXPathSelector(response)
とかあるからほかのもあんのかな、時間あるときに調べる。

#
http://sourceforge.net/projects/simplehtmldom/
こんなのもあった。セレクタで行けるぽ

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です