java培訓-java應用一般架構
現在我們常見的不同系統不同語言之間的交互使用WebService,Http請求。WebService,即“Web 服務”,簡寫為 WS。從字面上理解,它其實就是“基於 Web 的服務”。而服務卻是雙方的,有服務需求方,就有服務提供方。服務提供方對外發布服務,服務需求方調用服務提供方所發布的服務。如果說得再專業一點,WS 其實就是建立在 HTTP 協議上實現異構系統通訊的工具。沒錯!WS 說白了還是基於 HTTP 協議的,也就是說,數據是通過 HTTP 進行傳輸的。最早我們是用CXF開發SOAP服務實現WS,後面我們是用REST服務實現WS(這個目前使用比較多,也最我用得最多的這一種)。基於CXF也可以開發REST服務,不過我們一般直接使用springMVC或者其他MVC框架實現REST服務。
但是在很多人的印象中Web service的話一般指十來年前IBM主導的基於XML的各種交互技術,現在除了一些公司在用之外用得人也很少了。廣義的話Webservice就是Web 服務了,一切皆服務。
常見的不同系統相同語言之間的交互用RPC(遠程過程調用),或者RMI(遠程方法調用)實現,不用對外部提供服務,當然上面說的也可以使用在相同語言之間的交互,只是我常用的是RPC。
不同產品的架構
一般我們只是一個產品的情況下的架構演進歷程,如果需要對外提供webService,通常使用REST服務實現。
以下一段內容來源於知乎
初始階段 的小型系統 應用程序、數據庫、文件等所有的資源都在一台服務器上通俗稱為LAMP
特征:應用程序、數據庫、文件等所有的資源都在一台服務器上。
描述:通常服務器操作系統使用linux,應用程序使用PHP開發,然後部署在Apache上,數據庫使用Mysql,匯集各種免費開源軟件以及一台廉價服務器就可以開始系統的發展之路了。
好景不長,發現隨著系統訪問量的再度增加,webserver機器的壓力在高峰期會上升到比較高,這個時候開始考慮增加一台webserver
特征:應用程序、數據庫、文件分別部署在獨立的資源上。
描述:數據量增加,單台服務器性能及存儲空間不足,需要將應用和數據分離,並發處理能力和數據存儲空間得到了很大改善。
特征:數據庫中訪問較集中的一小部分數據存儲在緩存服務器中,減少數據庫的訪問次數,降低數據庫的訪問壓力。
描述:系統訪問特點遵循二八定律,即80%的業務訪問集中在20%的數據上。緩存分為本地緩存和遠程分布式緩存,本地緩存訪問速度更快但緩存數據量有限,同時存在與應用程序爭用內存的情況。
在做完分庫分表這些工作後,數據庫上的壓力已經降到比較低了,又開始過著每天看著訪問量暴增的幸福生活了,突然有一天,發現系統的訪問又開始有變慢的趨勢了,這個時候首先查看數據庫,壓力一切正常,之後查看webserver,發現apache阻塞了很多的請求,而應用服務器對每個請求也是比較快的,看來 是請求數太高導致需要排隊等待,響應速度變慢
特征:多台服務器通過負載均衡同時向外部提供服務,解決單台服務器處理能力和存儲空間上限的問題。
描述:使用集群是系統解決高並發、海量數據問題的常用手段。通過向集群中追加資源,提升系統的並發處理能力,使得服務器的負載壓力不再成為整個系統的瓶頸。
享受了一段時間的系統訪問量高速增長的幸福後,發現系統又開始變慢了,這次又是什麼狀況呢,經過查找,發現數據庫寫入、更新的這些操作的部分數據庫連接的資源競爭非常激烈,導致了系統變慢
特征:多台服務器通過負載均衡同時向外部提供服務,解決單台服務器處理能力和存儲空間上限的問題。
描述:使用集群是系統解決高並發、海量數據問題的常用手段。通過向集群中追加資源,使得服務器的負載壓力不在成為整個系統的瓶頸。
特征:采用CDN和反向代理加快系統的訪問速度。
描述:為了應付復雜的網絡環境和不同地區用戶的訪問,通過CDN和反向代理加快用戶訪問的速度,同時減輕後端服務器的負載壓力。CDN與反向代理的基本原理都是緩存。
隨著系統的不斷運行,數據量開始大幅度增長,這個時候發現分庫後查詢仍然會有些慢,於是按照分庫的思想開始做分表的工作
特征:數據庫采用分布式數據庫,文件系統采用分布式文件系統。
描述:任何強大的單一服務器都滿足不了大型系統持續增長的業務需求,數據庫讀寫分離隨著業務的發展最終也將無法滿足需求,需要使用分布式數據庫及分布式文件系統來支撐。分布式數據庫是系統數據庫拆分的最後方法,只有在單表數據規模非常龐大的時候才使用,更常用的數據庫拆分手段是業務分庫,將不同的業務數據庫部署在不同的物理服務器上。
特征:系統引入NoSQL數據庫及搜索引擎。
描述:隨著業務越來越復雜,對數據存儲和檢索的需求也越來越復雜,系統需要采用一些非關系型數據庫如NoSQL和分數據庫查詢技術如搜索引擎。應用服務器通過統一數據訪問模塊訪問各種數據,減輕應用程序管理諸多數據源的麻煩。
特征:系統上按照業務進行拆分改造,應用服務器按照業務區分進行分別部署。
描述:為了應對日益復雜的業務場景,通常使用分而治之的手段將整個系統業務分成不同的產品線,應用之間通過超鏈接建立關系,也可以通過消息隊列進行數據分發,當然更多的還是通過訪問同一個數據存儲系統來構成一個關聯的完整系統。縱向拆分:將一個大應用拆分為多個小應用,如果新業務較為獨立,那麼就直接將其設計部署為一個獨立的Web應用系統縱向拆分相對較為簡單,通過梳理業務,將較少相關的業務剝離即可。橫向拆分:將復用的業務拆分出來,獨立部署為分布式服務,新增業務只需要調用這些分布式服務橫向拆分需要識別可復用的業務,設計服務接口,規范服務依賴關系。
特征:公共的應用模塊被提取出來,部署在分布式服務器上供應用服務器調用。
描述:隨著業務越拆越小,應用系統整體復雜程度呈指數級上升,由於所有應用要和所有數據庫系統連接,最終導致數據庫連接資源不足,拒絕服務。
Q:分布式服務應用會面臨哪些問題?
(1) 當服務越來越多時,服務URL配置管理變得非常困難,F5硬件負載均衡器的單點壓力也越來越大。
(2) 當進一步發展,服務間依賴關系變得錯蹤復雜,甚至分不清哪個應用要在哪個應用之前啟動,架構師都不能完整的描述應用的架構關系。
(3) 接著,服務的調用量越來越大,服務的容量問題就暴露出來,這個服務需要多少機器支撐?什麼時候該加機器?
(4) 服務多了,溝通成本也開始上升,調某個服務失敗該找誰?服務的參數都有什麼約定?
(5) 一個服務有多個業務消費者,如何確保服務質量?
(6) 隨著服務的不停升級,總有些意想不到的事發生,比如cache寫錯了導致內存溢出,故障不可避免,每次核心服務一掛,影響一大片,人心慌慌,如何控制故障的影響面?服務是否可以功能降級?或者資源劣化?
這個好像是大型網站技術架構 核心原理與案例分析開篇的內容,不過作者總結得不錯,我就轉載一下吧。
還有一種就是上面也有提到的業務拆分。現在我們需要做一個產品線,我們只需要一個數據層,一個通用業務邏輯層,前面還有各種應用和界面層,不需要對外部系統(外部公司的系統)提供服務的情況以前我們一般會選擇用EJB等來構建分布式應用,但是現在我們可以使用dobbo、thrift、avro、hessian這類RPC框架來構建分布式應用實現不同應用和數據來源的交互。這種結構模式下我們需要對其他公司提供服務,可以專門寫一個應用對外部系統提供rest服務。一般大多數互聯網服務背後都要訪問十幾個甚至幾百個內部服務,它們之間的通信方式一般都是RPC:就像訪問一個遠程方法那樣,輸入參數後等待返回結果。這對於構建復雜系統是最容易理解的方式。
如下圖的模型,文件系統,緩存那些沒有畫出來,大家理解就行。
不管哪種架構我們都需要做好模塊化(盡量做到模塊復用)。
不要為了架構而架構導致過度設計。
不管何種架構都是為了更好滿足業務需求,架構應該跟隨業務的發展而發展。
當前的架構如果可以滿足當前的業務發展,就可以考慮下一步的擴展了,不用一下子考慮3步4步甚至更多。
以上如果有誤,還望大家不吝賜教!