Snoopyを使えばhtmlを簡単に取得する事が出来ます。
COOKIEやSSLにも対応しているようです。
RSS情報を解析する「MagpieRSS」
もこれを使ってるみたいです。。
こんな感じで使う…
require_once(“snoopy.class.php”);
$Snoopy = new Snoopy();
$url = “http://hogegoge.com/”;
$Snoopy->fetch($URI); //$URIのHTMLソースを取得
$Snoopy->fetchtext($URI); //$URIのテキストのみを取得
$Snoopy->fetchform($URI); //$URIのフォームの部分を取得
$Snoopy->fetchlinks($URI); //$URIのリンク部分を取得
$Snoopy->submit($URI,$param); //$paramの内容を$URIに送る
$Snoopy->submittext($URI,$formvars); //$paramの内容を$URIに送る(返りがテキスト)
$Snoopy->submitlinks($URI); //$paramの内容を$URIに送る(返りがリンク)
