程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> php curl的深入解析

php curl的深入解析

編輯:PHP綜合
curl可以說是php裡一個非常強大的功能,每個php程序員都應該學習並熟悉curl,使用curl前確保你的php_curl擴展已經開啟。

一、curl使用
例如:我們采集深圳智聯招聘上PHP招聘的第一頁信息
復制代碼 代碼如下:
$url='http://sou.zhaopin.com/jobs/searchresult.ashx?jl=%E6%B7%B1%E5%9C%B3&kw=php&sm=0&p=1';
//初始化
$ch = curl_init();
//設置選項,包括URL
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);//不自動輸出內容
curl_setopt($ch, CURLOPT_HEADER, 0);//不返回頭部信息
//執行curl
$output = curl_exec($ch);
//錯誤提示
if(curl_exec($ch) === false){
    die(curl_error($ch));
}
//釋放curl句柄
curl_close($ch);
header('Content-type: text/html; charset=utf-8');
echo $output;

當然我們必須對返回的數據使用<<正則表達式>>處理,找出我們想要的那一部分,然後根據你的需要把數據填充到你網站裡
復制代碼 代碼如下:
//職位名稱
preg_match_all('/<td class="Jobname">.*?<a\s*href="(.*?)"\starget="_blank">(.*?)<\/a>/s', $output, $title);
$title[1];//鏈接
$title[2];//標題
//公司名稱
preg_match_all('/<td class="Companyname">.*?<a href="(.*?)"\starget="_blank">(.*?)<\/a>/s', $output, $company);
$company[1];//鏈接
$company[2];//名字
//工作地點
preg_match_all('/<td class="Companyaddress">\s*(.*?)\s*<\/td>/s', $output, $address);
$address[1];//地點
//發布日期
preg_match_all('/<td class="releasetime">\s*(.*?)\s*<\/td>/s', $output, $time);
$time[1];//時間
var_dump($time[1]);

二、常用功能
curl的核心是通過設置各種選項來達到各種功能,這裡我們介紹幾種常用的選項。
1.post數據
復制代碼 代碼如下:
$post=array(
'uid'=>'test',
'pwd'=>'curl123'
);
curl_setopt($ch, CURLOPT_POST, 1);//設置為POST方式
curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($post));//POST數據

2.cookie
復制代碼 代碼如下:
$savefile=dirname(__FILE__).'save.txt';
$getfile=dirname(__FILE__).'get.txt';
//可以分開使用
curl_setopt($ch, CURLOPT_COOKIEJAR, $savefile); //保存 
curl_setopt($ch, CURLOPT_COOKIEFILE, $getfile); //讀取

3.偽造IP、來路
復制代碼 代碼如下:
curl_setopt($ch, CURLOPT_HTTPHEADER, array('X-FORWARDED-FOR:8.8.8.8', 'CLIENT-IP:8.8.8.8'));//構造IP 
curl_setopt($ch, CURLOPT_REFERER, "http://www.baidu.com");//構造來路 

curl_setopt選項大全,詳見PHP手冊:http://www.php.net/manual/zh/function.curl-setopt.php
三、多線程
官方示例
復制代碼 代碼如下:
// 創建一對cURL資源
$ch1 = curl_init();
$ch2 = curl_init();
// 設置URL和相應的選項
curl_setopt($ch1, CURLOPT_URL, "http://www.example.com/");
curl_setopt($ch1, CURLOPT_HEADER, 0);
curl_setopt($ch2, CURLOPT_URL, "http://www.php.net/");
curl_setopt($ch2, CURLOPT_HEADER, 0);
// 創建批處理cURL句柄
$mh = curl_multi_init();
// 增加2個句柄
curl_multi_add_handle($mh,$ch1);
curl_multi_add_handle($mh,$ch2);
$running=null;
// 執行批處理句柄
do {
    usleep(10000);
    curl_multi_exec($mh,$running);
} while ($running > 0);
// 關閉全部句柄
curl_multi_remove_handle($mh, $ch1);
curl_multi_remove_handle($mh, $ch2);
curl_multi_close($mh);

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved