程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> PHP抓取網頁、解析HTML常用的方法總結

PHP抓取網頁、解析HTML常用的方法總結

編輯:PHP綜合

概述

爬蟲是我們在做程序時經常會遇到的一種功能。PHP有許多開源的爬蟲工具,如snoopy,這些開源的爬蟲工具,通常能幫我們完成大部分功能,但是在某種情況下,我們需要自己實現一個爬蟲,本篇文章對PHP實現爬蟲的方式做個總結。

PHP實現爬蟲主要方法

1.file()函數
2.file_get_contents()函數
3.fopen()->fread()->fclose()方式
4.curl方式
5.fsockopen()函數,socket方式
6.使用開源工具,如:snoopy

PHP解析XML或HTML主要方式

1.正則表達式
2.PHP DOMDocument對象
3.插件,如:PHP Simple HTML DOM Parser

總結

這裡對PHP實現爬蟲的方式做個簡單得總結,本篇設計到得內容還有很多,稍後會對PHP解析HTML和XML的方式做個總結。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved