TCP 中繼器
在實現 socks4a proxy 之前,我們先寫一個功能更簡單的網絡程序—— TCP 中繼器 (TCP relay),或者叫做窮人的 tcpdump (poor mans tcpdump)。
一般情況下,客戶端程序直接連接服務端,如下圖。有時候,我們想在 client 和 server 之間放一個中繼器 (relay),把 client 與 server 之間的通信內容記錄下來。這時用 tcpdump 是最方便省事的,但是 tcpdump 需要 root 權限,萬一沒有 root 密碼呢?窮人有窮人的辦法,自己寫一個 relay,讓 client 連接 relay,再讓 relay 連接 server,如下圖中的 T 型結構,relay 扮演了類似 proxy 的角色。
TcpRelay 是我們自己寫的,可以動動手腳。除了記錄通信內容,還可以制造延時,或者故意翻轉 1 bit 數據以模擬 router 硬件故障。
TcpRelay 的功能(業務邏輯)看上去很簡單,無非是把連接 C 上收到的數據發給連接 S,同時把連接 S 上收到的數據發給連接 C。但仔細考慮起來,細節其實不那麼簡單:
1.建立連接。為了真實模擬 client,TcpRelay 在 accept 連接 C 之後才向 server 發起連接 S,那麼在 S 建立起來之前,從 C 收到數據怎麼辦?要不要暫存起來?
2.並發連接的管理。上圖中只畫出了一個 client,實際上 TcpRelay 可以服務多個 clients,左右兩邊這些並發連接如何管理,如何防止串話(cross talk)?
3.連接斷開。Client 和 Server 都可能主動斷開連接。當 Client 主動斷開連接 C 時,TcpRelay 應該立刻斷開 S。當 Server 主動斷開連接 S 時,TcpRelay 應立刻斷開 C。這樣才能比較精確地模擬 Client 和 Server 的行為。在關閉連接的剎那,又有新的 client 連接進來,復用了剛剛 close 的 fd 號碼,會不會造成串話? 萬一 Client 和 Server 幾乎同時主動斷開連接,TcpRelay 如何應對?
4.速度不匹配。如果連接 C 的帶寬是 100KB/s,而連接 S 的帶寬是 10MB/s,不巧 Server 是個 chargen 服務,會全速發送數據,那麼會不會撐爆 TcpRelay 的 buffer?如何限速?特別是在使用 non-blocking IO 和 level-trigger polling 的時候如何限制讀取數據的速度?
在看 muduo 的實現之前,請讀者思考:如果用 Sockets API 來實現 TcpRelay,如何解決以上這些問題。
Socks4a 代理服務器
Socks4a 的功能與 TcpRelay 非常相似,也是把連接 C 上收到的數據發給連接 S,同時把連接 S 上收到的數據發給連接 C。它與 TcpRelay 的區別在於,TcpRelay 固定連到某個 server 地址,而 socks4a 允許 client 指定要連哪個 server。在 accept 連接 C 之後,Socks4a server 會讀幾個字節,以了解 server 的地址,再發起連接 S。
muduo 這個 socks4a 是個標准的網絡服務,可以供 Web 浏覽器使用(我正是這麼測試它的)。
n:1 與 1:n 連接轉發
雲風在《寫了一個 proxy 用途你懂的》中寫了一個 TCP 隧道 tunnel,程序由三部分組成:n:1 連接轉發服務,1:n 連接轉發服務,socks 代理服務。
我仿照他的思路,用muduo 實現了這兩個個程序。不同的是,我沒有做數據混淆,所以不能用來翻傳說中的牆。
n:1 連接轉發服務就是《Muduo 網絡編程示例之七:“串並轉換”連接服務器及其自動化測試》中的 multiplexer (數據選擇器)。
socks 代理服務正是本文實現的 socks4a。
有興趣的讀者可以把這兩個程序級聯起來試一試。
Muduo 編程示例系列告一段落
《html">Muduo 網絡編程示例》從今年2月初開始寫,到今天正好是四個月,我寫了十一篇博客,基本按計劃完成了任務。這個系列暫告一段落。
這個系列基本涵蓋了 muduo 為編寫單線程服務端和客戶端 TCP 網絡程序提供的功能,muduo 的能力不止於此:
多線程,muduo::net::TcpServer 內置了一個簡單但適應性很強的線程模型。目前博客上的例子涉及的業務邏輯很簡單,沒有復雜的運算,瓶頸通常在 IO 上,多線程的優勢發揮不出來。
高級應用。比方說用 muduo::net::Channel 配合 signalfd 來處理信號;其他非阻塞網絡客戶端庫(例如 ZooKeeper 的 C 客戶端,PostgreSQL 的客戶端 libpq)與 muduo EventLoop 的集成。
以上兩點在以後的文章裡會提及,不會明珠暗藏。
接下來的計劃
接下來,我還會寫一系列博客,目前想到的有:
1.談一談我的網絡編程學習經驗。文章已經完成大半,端午節之後可以發布。
2.用 muduo 實現一些稍微復雜一些的網絡程序,比如小規模的分布式系統。計劃有:利用 Paxos 算法實現一個高可用的 in-memory key value 存儲,在此基礎上實現 naming service,然後實現我以前多次提到的簡單機群管理系統等等。目前 muduo 的示例程序都是簡單獨立的網絡程序,下半年我想多寫一寫由多個程序組成的系統,具體談一談分布式系統細節設計。