スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

Zend_HttpとZend_DomでHTML解析

PHPでHTMLを取得して解析したくなって色々調べてみたのですが、灯台下暗し、普段使っているZend Frameworkの中にありました。
PHPで何かやりたかったら、まずZend Frameworkを調べるようにしよっと。

まずは、Zend_Http_Clinet。これでHTMLを回収します。
タイムアウトやらクッキーやら色々設定できます。リダイレクトも5回くらいは追尾してくれます。
結果はZend_Http_Responseに返ってきますが、ここではテキストとしてのみ回収できます。

次に返ってきた結果をZend_Dom_Queryで受けます。
これはjQueryみたいなセレクターやXPathなどで要素を取得できます。

以下サンプルですが、見ての通りシンプルな作りで、これだけの行数でHTMLの内部の情報がとってこれるのは驚きです。

<?php
require_once 'Zend/Dom/Query.php';
require_once 'Zend/Http/Client.php';

$client = new Zend_Http_Client('http://framework.zend.com/manual/ja/manual.html');
$response = $client->request();
$dom = new Zend_Dom_Query($response->getBody());
$results = $dom->query('title');
foreach ($results as $result) {
echo $result->nodeValue;
}
?>
スポンサーサイト

COMMENTS

COMMENT FORM

TRACKBACK


この記事にトラックバックする(FC2ブログユーザー)

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。