本文實例講述了php使用simple_html_dom解析HTML的方法。分享給大家供大家參考,具體如下:
今天寫了兩個爬蟲, 一個使用Python, 一個使用PHP, 說實在, 兩個實現的方式都很方便.
下面說一下使用simple_html_dom這個開源類來解析HTML代碼:
1. 下載simple_html_dom:
http://sourceforge.net/projects/simplehtmldom/files/
2. 用法示例:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
|
<?php // example of how to use basic selector to retrieve HTML contents include ( '../simple_html_dom.php' ); // get DOM from URL or file $html = file_get_html( 'http://www.google.com/' ); // find all link foreach ( $html ->find( 'a' ) as $e ) echo $e ->href . '<br>' ; // find all image foreach ( $html ->find( 'img' ) as $e ) echo $e ->src . '<br>' ; // find all image with full tag foreach ( $html ->find( 'img' ) as $e ) echo $e ->outertext . '<br>' ; // find all div tags with id=gbar foreach ( $html ->find( 'div#gbar' ) as $e ) echo $e ->innertext . '<br>' ; // find all span tags with class=gb1 foreach ( $html ->find( 'span.gb1' ) as $e ) echo $e ->outertext . '<br>' ; // find all td tags with attribite align=center foreach ( $html ->find( 'td[align=center]' ) as $e ) echo $e ->innertext . '<br>' ; // extract text from table echo $html ->find( 'td[align="center"]' , 1)->plaintext. '<br><hr>' ; // extract text from HTML echo $html ->plaintext; ?> |
希望本文所述對大家PHP程序設計有所幫助。