程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> .NET網頁編程 >> C# >> C#基礎知識 >> 利用C#編寫一個簡單的抓網頁應用程序

利用C#編寫一個簡單的抓網頁應用程序

編輯:C#基礎知識

  本文利用C#和.NET提供的類來輕松創建一個抓取網頁內容源代碼的程序 。HTTP是WWW進行數據訪問最基本的協議之一,在.NET的基本類型庫類中提供了兩個對象類:HTTPWebRequest和HTTPWebResponse,分別用來向某資源發送請求和獲得響應。為了得到一個資源的內容,我們先指定一個想要抓取的URL地址,用HTTPWebRequest對象進行請求,用HTTPWebResponse對象接收響應的結果,最後用TextStream對象來提取我們想要的信息,並在控制台打印出來。

  下面就是看看如何實現這樣的功能:

  第一步:打開VS.NET,點“文件”-“新建”-“項目”,項目類型選擇“Visual C#項目”,模板選“Windows應用程序”,

  第二步:在Form1裡加入Label1,Button1,TextBox1,TextBox2四個控件,TextBox2的Multiline屬性改為True,

  第三步:在Form1窗體上點擊右鍵,選“查看代碼”,然後在最頂端輸入:

  

using System.IO;
using System.Net;
using System.Text;
private void button1_Click(object sender, System.EventArgs e)
{
} 

  括號之間輸入下面的代碼:

  

byte[] buf = new byte[38192];
HttpWebRequest request = (HttpWebRequest)
WebRequest.Create(textBox1.Text);
HttpWebResponse response = (HttpWebResponse)
request.GetResponse();
Stream resStream = response.GetResponseStream();
int count = resStream.Read(buf, 0, buf.Length);
textBox2.Text = Encoding.Default.GetString(buf, 0,
count);
resStream.Close(); 

  第四步:點“Save all”按鈕,按“F5”運行應用程序,在“請輸入URL地址:”後面的單行文本框裡輸入http://lucky.myrice.com/down.htm,點擊“得到 HTML 代碼”按鈕,就可以看到該地址的代碼了!

  下面,我們就對上面的程序做一個分析:

  上面的這個程序的功能是抓取網頁http://lucky.myrice.com/down.htm的內容,並在多行文本框裡顯示出HTML代碼,由於返回的數據是字節類型的,因此,我們創建一個名為buf的字節類型的數組變量來存儲請求返回來的結果,其中數組的大小與我們要請求返回的數據大小有關系。首先,我們實例化HttpWebRequest對象,使用WebRequest類的靜態方法Create(),該方法的字符串參數就是我們要請求頁面的URL地址,由於Create()方法返回的是WebRequest類型的,我們必須對它進行造型(即類型轉換)成HttpWebRequest類型,再賦給request變量。一旦我們建立了HttpWebRequest對象,就可以使用它的GetResponse()方法來返回一個WebResponse對象,然後再造型成HttpWebResponse對象賦給response變量。現在,就可以使用response對象的GetResponseStream()方法來得到響應的文本流了,最後用Stream對象的Read()方法把返回的響應信息放到我們最初創建的字節數組buf中,Read()有3個參數,分別是:要放入的字節數組,字節數組的開始位置,字節數組的長度。最後把字節轉換成字符串,注意:這裡采用的采用的是Default編碼,它使用默認的編碼方式,我們就不用再進行字符編碼之間的轉換了。也可以利用WebRequest和WebResponse實現以上的功能,代碼如下:

  

WebRequest request = WebRequest.Create(textBox1.Text);
WebResponse response =request.GetResponse(); 

  輸入其它的URL看看是不是很方便!

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved