用Java開發網絡軟件非常方便和強大,Java的這種力量來源於他獨有的一套強大的用於網絡的 API,這些API是一系列的類和接口,均位於包java.net和Javax.Net中。在這篇文章中我們將介紹套接字(Socket)慨念,同時以實例說明如何使用Network API操縱套接字,在完成本文後,你就可以編寫網絡低端通訊軟件。
什麼是套接字(Socket)?
Network API是典型的用於基於TCP/IP網絡Java程序與其他程序通訊,Network API依靠Socket進行通訊。Socket可以看成在兩個程序進行通訊連接中的一個端點,一個程序將一段信息寫入Socket中,該Socket將這段信息發送給另外一個Socket中,使這段信息能傳送到其他程序中。如圖1
我們來分析一下圖1,Host A上的程序A將一段信息寫入Socket中,Socket的內容被Host A的網絡管理軟件訪問,並將這段信息通過Host A的網絡接口卡發送到Host B,Host B的網絡接口卡接收到這段信息後,傳送給Host B的網絡管理軟件,網絡管理軟件將這段信息保存在Host B的Socket中,然後程序B才能在Socket中閱讀這段信息。
假設在圖1的網絡中添加第三個主機Host C,那麼Host A怎麼知道信息被正確傳送到Host B而不是被傳送到Host C中了呢?基於TCP/IP網絡中的每一個主機均被賦予了一個唯一的IP地址,IP地址是一個32位的無符號整數,由於沒有轉變成二進制,因此通常以小數點分隔,如:198.163.227.6,正如所見IP地址均由四個部分組成,每個部分的范圍都是0-255,以表示8位地址。
值得注意的是IP地址都是32位地址,這是IP協議版本4(簡稱Ipv4)規定的,目前由於IPv4地址已近耗盡,所以IPv6地址正逐漸代替Ipv4地址,Ipv6地址則是128位無符號整數。
假設第二個程序被加入圖1的網絡的Host B中,那麼由Host A傳來的信息如何能被正確的傳給程序B而不是傳給新加入的程序呢?這是因為每一個基於TCP/IP網絡通訊的程序都被賦予了唯一的端口和端口號,端口是一個信息緩沖區,用於保留Socket中的輸入/輸出信息,端口號是一個16位無符號整數,范圍是0-65535,以區別主機上的每一個程序(端口號就像房屋中的房間號),低於256的短口號保留給標准應用程序,比如pop3的端口號就是110,每一個套接字都組合進了IP地址、端口、端口號,這樣形成的整體就可以區別每一個套接字t,下面我們就來談談兩種套接字:流套接字和自尋址數據套接字。
流套接字(Stream Socket)
無論何時,在兩個網絡應用程序之間發送和接收信息時都需要建立一個可靠的連接,流套接字依靠TCP協議來保證信息正確到達目的地,實際上,IP包有可能在網絡中丟失或者在傳送過程中發生錯誤,任何一種情況發生,作為接受方的 TCP將聯系發送方TCP重新發送這個IP包。這就是所謂的在兩個流套接字之間建立可靠的連接。
流套接字在C/S程序中扮演一個必需的角色,客戶機程序(需要訪問某些服務的網絡應用程序)創建一個扮演服務器程序的主機的IP地址和服務器程序(為客戶端應用程序提供服務的網絡應用程序)的端口號的流套接字對象。
客戶端流套接字的初始化代碼將IP地址和端口號傳遞給客戶端主機的網絡管理軟件,管理軟件將IP地址和端口號通過NIC傳遞給服務器端主機;服務器端主機讀到經過NIC傳遞來的數據,然後查看服務器程序是否處於監聽狀態,這種監聽依然是通過套接字和端口來進行的;如果服務器程序處於監聽狀態,那麼服務器端網絡管理軟件就向客戶機網絡管理軟件發出一個積極的響應信號,接收到響應信號後,客戶端流套接字初始化代碼就給客戶程序建立一個端口號,並將這個端口號傳遞給服務器程序的套接字(服務器程序將使用這個端口號識別傳來的信息是否是屬於客戶程序)同時完成流套接字的初始化。
如果服務器程序沒有處於監聽狀態,那麼服務器端網絡管理軟件將給客戶端傳遞一個消極信號,收到這個消極信號後,客戶程序的流套接字初始化代碼將拋出一個異常對象並且不建立通訊連接,也不創建流套接字對象。這種情形就像打電話一樣,當有人的時候通訊建立,否則電話將被掛起。
這部分的工作包括了相關聯的三個類:InetAddress, Socket, 和 ServerSocket。 InetAddress對象描繪了32位或128位IP地址,Socket對象代表了客戶程序流套接字,ServerSocket代表了服務程序流套接字,所有這三個類均位於包Java.Net中。
InetAddress類
InetAddress類在網絡API套接字編程中扮演了一個重要角色。參數傳遞給流套接字類和自尋址套接字類構造器或非構造器方法。InetAddress描述了32位或64位IP地址,要完成這個功能,InetAddress類主要依靠兩個支持類Inet4Address 和 Inet6Address,這三個類是繼承關系,InetAddrress是父類,Inet4Address 和 Inet6Address是子類。
由於InetAddress類只有一個構造函數,而且不能傳遞參數,所以不能直接創建InetAddress對象,比如下面的做法就是錯誤的:
InetAddress ia = new InetAddress ();
但我們可以通過下面的5個工廠方法創建來創建一個InetAddress對象或InetAddress數組:
. getAllByName(String host)方法返回一個InetAddress對象的引用,每個對象包含一個表示相應主機名的單獨的IP地址,這個IP地址是通過host參數傳遞的,對於指定的主機如果沒有IP地址存在那麼這個方法將拋出一個UnknownHostException 異常對象。
. getByAddress(byte [] addr)方法返回一個InetAddress對象的引用,這個對象包含了一個Ipv4地址或Ipv6地址,Ipv4地址是一個4字節數組,Ipv6地址是一個16字節地址數組,如果返回的數組既不是4字節的也不是16字節的,那麼方法將會拋出一個UnknownHostException異常對象。
. getByAddress(String host, byte [] addr)方法返回一個InetAddress對象的引用,這個InetAddress對象包含了一個由host和4字節的addr數組指定的IP地址,或者是host和16字節的addr數組指定的IP地址,如果這個數組既不是4字節的也不是16位字節的,那麼該方法將拋出一個UnknownHostException異常對象。
. getByName(String host)方法返回一個InetAddress對象,該對象包含了一個與host參數指定的主機相對應的IP地址,對於指定的主機如果沒有IP地址存在,那麼方法將拋出一個UnknownHostException異常對象。
. getLocalHost()方法返回一個InetAddress對象,這個對象包含了本地機的IP地址,考慮到本地主機既是客戶程序主機又是服務器程序主機,為避免混亂,我們將客戶程序主機稱為客戶主機,將服務器程序主機稱為服務器主機。
上面講到的方法均提到返回一個或多個InetAddress對象的引用,實際上每一個方法都要返回一個或多個Inet4Address/Inet6Address對象的引用,調用者不需要知道引用的子類型,相反調用者可以使用返回的引用調用InetAddress對象的非靜態方法,包括子類型的多態以確保重載方法被調用。
InetAddress和它的子類型對象處理主機名到主機IPv4或IPv6地址的轉換,要完成這個轉換需要使用域名系統,下面的代碼示范了如何通過調用getByName(String host)方法獲得InetAddress子類對象的方法,這個對象包含了與host參數相對應的IP地址:
InetAddress ia = InetAddress.getByName ("www.Javajeff.com"));
一但獲得了InetAddress子類對象的引用就可以調用InetAddress的各種方法來獲得InetAddress子類對象中的IP地址信息,比如,可以通過調用getCanonicalHostName()從域名服務中獲得標准的主機名;getHostAddress()獲得IP地址,getHostName()獲得主機名,isLoopbackAddress()判斷IP地址是否是一個loopback地址。
List1 是一段示范代碼:InetAddressDemo
// InetAddressDemo.Java
import Java.Net.*;
class InetAddressDemo
{
public static void main (String [] args) throws UnknownHostException
{
String host = "localhost";
if (args.length == 1)
host = args [0];
InetAddress ia = InetAddress.getByName (host);
System.out.println ("Canonical Host Name = " +
ia.getCanonicalHostName ());
System.out.println ("Host Address = " +
ia.getHostAddress ());
System.out.println ("Host Name = " +
ia.getHostName ());
System.out.println ("Is Loopback Address = " +
ia.isLoopbackAddress ());
}
}
當無命令行參數時,代碼輸出類似下面的結果:
Canonical Host Name = localhost
Host Address = 127.0.0.1
Host Name = localhost
Is Loopback Address = true
InetAddressDemo給了你一個指定主機名作為命令行參數的選擇,如果沒有主機名被指定,那麼將使用localhost(客戶機的),InetAddressDemo通過調用getByName(String host)方法獲得一個InetAddress子類對象的引用,通過這個引用獲得了標准主機名,主機地址,主機名以及IP地址是否是loopback地址的輸出。