程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> PHP抓取網頁、解析HTML常用的方法總結

PHP抓取網頁、解析HTML常用的方法總結

編輯:關於PHP編程

       這篇文章主要介紹了PHP抓取網頁、解析HTML常用的方法總結,本文只是對可以實現這兩個需求的方法作了總結,只介紹方法,不介紹如何實現,需要的朋友可以參考下

      概述

      爬蟲是我們在做程序時經常會遇到的一種功能。PHP有許多開源的爬蟲工具,如snoopy,這些開源的爬蟲工具,通常能幫我們完成大部分功能,但是在某種情況下,我們需要自己實現一個爬蟲,本篇文章對PHP實現爬蟲的方式做個總結。

      PHP實現爬蟲主要方法

      1.file()函數

      2.file_get_contents()函數

      3.fopen()->fread()->fclose()方式

      4.curl方式

      5.fsockopen()函數,socket方式

      6.使用開源工具,如:snoopy

      PHP解析XML或HTML主要方式

      1.正則表達式

      2.PHP DOMDocument對象

      3.插件,如:PHP Simple HTML DOM Parser

      總結

      這裡對PHP實現爬蟲的方式做個簡單得總結,本篇設計到得內容還有很多,稍後會對PHP解析HTML和XML的方式做個總結。

    1. 上一頁:
    2. 下一頁:
    Copyright © 程式師世界 All Rights Reserved