先來看看CSDN統計博客訪問量的原理:
當客戶端向服務器發起請求的時候,每個ip被統計一次,上圖的三個客戶端指的是三個不同的ip地址。並且在某段時間內,同以ip訪問同一篇文章,只能算是一次訪問量。同一ip在某個時間段內訪問同一博客不同的文章,被訪問到的文章次數+1。知道上訴簡單的原理之後,接下來就想解決的辦法了。
首先,准備一大批ip代理。一百度,嚯出來一大堆啊,這個年代雷鋒還是挺多的,我選擇了這家ip代理網站,並提供了api的調用接口,調用地址是:
http://www.xicidaili.com/api。
其次,引入我們需要的jar包,這裡只需要一個jsoup包,千萬別被jsoup這個名詞嚇到,下面我會貼出我的博客,說說這個哥們干嘛用的。
接下來寫一個封裝ip類的java bean,其實不寫bean也可以,直接放在String[]數組裡面也是ok的,不過這樣做的時候,代理調用的時候方便取出。
public class MyIp { private String address; private String port; public String getAddress() { return address; } public void setAddress(String address) { this.address = address; } public String getPort() { return port; } public void setPort(String port) { this.port = port; } }
現在主要用到的調用這個接口的工具是:jsoup,這個哥們我推薦看我的博客http://blog.csdn.net/zhang5476499/article/details/52205150。當然你也可以用httpClient等工具把網頁的內容拿下來。用java 代碼實現如下:
public static List<MyIp> getIp(String url) { List<MyIp> ipList = null; try { //1.向ip代理地址發起get請求,拿到代理的ip Document doc = Jsoup.connect(url) .userAgent("Mozilla") .cookie("auth", "token") .timeout(3000) .get(); //2,將得到的ip地址解析除字符串 String ipStr = doc.body().text().trim().toString(); //3.用正則表達式去切割所有的ip String[] ips = ipStr.split("\\s+"); //4.循環遍歷得到的ip字符串,封裝成MyIp的bean ipList = new ArrayList<MyIp>(); for(final String ip : ips) { MyIp myIp = new MyIp(); String[] temp = ip.split(":"); myIp.setAddress(temp[0].trim()); myIp.setPort(temp[1].trim()); ipList.add(myIp); } } catch (IOException e) { System.out.println("加載文檔出粗"); } return ipList; }
這裡需要注意的是,api調用這個頁面的 時候,使用的是get請求。好了,假設已經拿到了api給的100個代理的ip,那麼,我們就可以設置代理了,設置代理的主要代碼如下:
System.setProperty("http.maxRedirects", "50"); System.getProperties().setProperty("proxySet", "true"); System.getProperties().setProperty("http.proxyHost", myIp.getAddress()); System.getProperties().setProperty("http.proxyPort", myIp.getPort());
下一步的工作是:循環這些拿到的代理ip,每設置一次代理,向博客地址發一次請求。
1 public static void main(String[] args) { 2 //1.想http代理地址api發起請求,獲得想要的代理ip地址 3 String url = "http://api.xicidaili.com/free2016.txt"; 4 List<MyIp> ipList = getIp(url); 5 String blogUrl = ""; 6 Scanner sc = new Scanner(System.in); 7 8 System.out.print("請輸入文章地址:"); 9 blogUrl = sc.nextLine(); 10 System.out.print("請輸入輪番刷新的倍數(x100):"); 11 int time = sc.nextInt(); 12 int count = 0; 13 14 for(int i = 0; i< time; i++) { 15 //2.設置ip代理 16 for(final MyIp myIp : ipList) { 17 System.setProperty("http.maxRedirects", "50"); 18 System.getProperties().setProperty("proxySet", "true"); 19 System.getProperties().setProperty("http.proxyHost", myIp.getAddress()); 20 System.getProperties().setProperty("http.proxyPort", myIp.getPort()); 21 22 try { 23 Document doc = Jsoup.connect(blogUrl) 24 .userAgent("Mozilla") 25 .cookie("auth", "token") 26 .timeout(3000) 27 .get(); 28 if(doc != null) { 29 count++; 30 logger.info("成功刷新次數: " + count); 31 } 32 } catch (IOException e) { 33 logger.error(myIp.getAddress() + ":" + myIp.getPort() + "報錯"); 34 } 35 } 36 } 37 }代理寫到這差不多就結束了,其實刷流量也不需要多高深的技術,本文只是一個引子,希望能夠祈禱拋磚引玉的作用。相關代碼地址:http://download.csdn.net/detail/zhang5476499/9687448 --2016.11.27 14:08:30