概述
爬蟲是我們在做程序時經常會遇到的一種功能。PHP有許多開源的爬蟲工具,如snoopy,這些開源的爬蟲工具,通常能幫我們完成大部分功能,但是在某種情況下,我們需要自己實現一個爬蟲,本篇文章對PHP實現爬蟲的方式做個總結。
PHP實現爬蟲主要方法
1.file()函數
2.file_get_contents()函數
3.fopen()->fread()->fclose()方式
4.curl方式
5.fsockopen()函數,socket方式
6.使用開源工具,如:snoopy
PHP解析XML或HTML主要方式
1.正則表達式
2.PHP DOMDocument對象
3.插件,如:PHP Simple HTML DOM Parser
總結
這裡對PHP實現爬蟲的方式做個簡單得總結,本篇設計到得內容還有很多,稍後會對PHP解析HTML和XML的方式做個總結。