從去年想這個事情怎麼解決,今年終於算是把他搞清楚了,但驗證碼必須要填。
如果你能像360搶票哪有自動識別驗證碼,那就沒事了。廢話不多扯了。回歸正題
這裡要用CURL。
設計思路:先登錄頁面獲取COOKIES,然後拿著cookies找服務器要驗證碼。最後提供服務器需要的全部信息。
(這種思維是完全模擬游覽器訪問頁面,根本區別出來是人還機器)
public function index(){ $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); //填對於的URL就可以了 curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"); curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file); //主要cookie的路徑,本保存頁面cookie curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); //返回結果自動輸出 $response = curl_exec($ch); curl_close($ch); }
訪問正方教務系統的首頁,第一獲取頁面中的HTML,第二是獲取cookies。
其他的就想問?獲取HTML有啥用?
如果你細心觀察教務系統首頁的HTML的話,你會發現裡面有很多隱藏字段,而這些字段又是變化的。
所以你干脆把HTML都獲取然後解析,然後把需要的字段都桃出來
看到沒有,那麼的隱藏字段,都是提交數據的必須,而且不能多。
接下來我要將一個最重要的問題,怎麼獲取驗證碼?
開始我想直接
<img src="xxxx/CheckCode.aspx" />
不就行了?這樣驗證碼雖然是出來,但這個驗證碼不屬於你,所以在你存遠程登錄時候,都會告訴你,驗證碼錯誤
那怎麼獲取屬於自己的驗證碼呢?這時候,自然想到的是cookies。
服務器是怎麼區分游覽器請求是不是同一個人,就看cookies裡面的sessionid了
這樣。你拿著你在首頁獲取到的cookies,再找服務器要你的驗證碼,它會給錯?
public function getImg() { $url = "http://xxxx/CheckCode.aspx"; $filedir = SITE_PATH."/TMP/Cookies"; $cookie_file = $filedir."/cookie.txt"; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)"); curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file); // curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); curl_setopt($ch, CURLOPT_TIMEOUT, "10"); header("Content-type:image/gif"); //這個視不同圖片格式不一樣,請注意 echo curl_exec($ch); curl_close($ch); }
然後再在其他頁面調用這個方法,你就可以獲取到驗證碼。
CURL的PHP請求跟你游覽器發出的PHP屬於兩個不同的線程,所以,他們的cookies是不同共用的。
————————–
這樣你就可以登錄了,但不要以為這樣登錄了,你可以操作全部功能了,那你就想錯了。還有一個很小的細節。。