十月二十四日,1024,程序員的節日~ 祝大家 節日快樂了!
今晚別加班,下面給你吃!
不要委屈了自己,晚上回家吃頓好的把。
一直都對爬蟲,數據方面挺感興趣的,也爬過很多數據。當然了,必須使用的是c#了~~
今天公布一個很早之前做的小偷程序。數據來自世紀佳緣。
Demo: find.izk.cloud
我是直接在世紀佳緣的頁面找到接口地址,然後構造相關參數,進行post請求,然後數據就出來了...就這樣出來了!!!
像這種公開了接口,還沒做任何限制的,簡直是...不要太簡單!
接口地址:http://search.jiayuan.com/v2/search_v2.php
可能需要注意就是參數的構造,貼個代碼片段:
1 string postdata = string.Format("sex={4}&key=&stc=1:{0},2:{1}.{2},23:1&sn=default&sv=1&p={3}&f=select&listStyle=bigPhoto&pri_uid=0&jsversion=v5", area, ages, agee, pageindex,sex);
地區,年齡段,分頁,性別
因為是早期的項目了,Http請求最早用的別人封裝好的一個HttpHelper。
1 HttpHelper http = new HttpHelper(); 2 HttpItem item = new HttpItem() 3 { 4 URL = "http://search.jiayuan.com/v2/search_v2.php",//URL 必需項 5 Method = "Post",//URL 可選項 默認為Get 6 Timeout = 100000,//連接超時時間 可選項默認為100000 7 ReadWriteTimeout = 30000,//寫入Post數據超時時間 可選項默認為30000 8 IsToLower = false,//得到的HTML代碼是否轉成小寫 可選項默認轉小寫 9 Cookie = "", 10 UserAgent = "Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.101 Safari/537.36",//用戶的浏覽器類型,版本,操作系統 可選項有默認值 11 Accept = "text/html, application/xhtml+xml, */*",// 可選項有默認值 12 ContentType = "application/x-www-form-urlencoded; charset=UTF-8", 13 Postdata = postdata, 14 }; 15 HttpResult result = http.GetHtml(item); 16 string html = result.Html;
當然了,爬了那麼多的數據,我也有一套自己封裝的httphelper~~之後有時間也分享給大家。
目前,項目已托管在GitHub上,有需要的朋友可以拿去~
代碼地址