程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> JAVA編程 >> 關於JAVA >> weblogic92連接池的連接數異常問題

weblogic92連接池的連接數異常問題

編輯:關於JAVA

有客戶說,他們通過connection pool監控發現weblogic92連接池中當前連接數(current capacity)小於初始連接數(initial capacity)。從現象上來說,給客戶的直覺是:連接池初始化有問題,沒有幫助他們初始化他們需要的那麼多連接。但他同時發現,幾個 connection pool中,其他pool沒有問題。拿到問題,我也懷疑這可能是weblogic的一個bug,但隨後從客戶發送過來的日志中發現出問題的 connection被disable過。調查後發現問題的確和這個pool被disable過有關,那麼為什麼pool被disable後,會出現這樣的問題呢?

首先我們看看這個pool為什麼會被disable? 手工強制suspend連接池、數據庫關閉、網絡不穩定等因素都可能成為connection pool被disable的誘因。從客戶的日志中,我能看到大量的如下異常,

1:java.net.SocketException: 管道已斷開 (errno:32)

2:weblogic.common.resourcepool.ResourceDisabledException: Pool JDBC Data Source-0 is disabled, cannot allocate resources to applications.

根據上面的異常,首先跟客戶確認是否存在過數據庫關閉、強制disable connection的操作,這些都被客戶否定了,那麼最大可能的原因就是網絡不穩定,網絡是好時壞的話,很容易造成weblogic連接池中到 database server的連接中斷,從而導致connection pool被disable。

那麼為什麼連接中斷會引起connection pool被disable呢?這裡要談到兩個參數:CountOfTestFailuresTillFlush、 CountOfRefreshFailuresTillDisable。這兩個參數在weblogic連接池實現中由於控制是否、何時flush或 disable連接池,兩個都是指連續幾次失敗操作(test、refresh)後去flush或disable connection pool。注意:這是說的是連續,而不是間斷,每次成功操作(test、refresh)後,這兩個值都會被reset成0。默認情況下這兩個值均為2,即連續失敗3(2+1)次後,connection pool會被flush或disable。兩者的區別在於,flush用於清空connection pool中的所有連接(通常都是中斷的connection),當pool狀態仍保持在running狀態,而對於後者,connection pool將會變成suspend。前者對於客戶端而言,還可以從pool中reserve connection,reserve時,weblogic會嘗試重現創建連接,如果創建連接成功,那麼客戶端就可以拿到可用的連接。而對於一個處於 suspend狀態,客戶端reserve connection的請求會直接被拒絕,收到的異常如下:

weblogic.common.resourcepool.ResourceDisabledException: Pool JDBC Data Source-0 is disabled, cannot allocate resources to applications

一個被disable的connection pool我們需要手工resume嗎?比如數據庫因為某些原因而突發關閉,數據庫恢復後,我們是否需要手工去resume這個pool?不需要,weblogic內部實現了連接池的自我健康檢查功能,對於disable的connection pool,weblogic會每隔5秒鐘(DEFAULT_SCAN_UNIT)去做一次連接嘗試(嘗試創建一個物理連接,如果連接成功,那麼這個連接會被直接放入連接池中,我們的問題就處在這兒),我們通過下面的復現過程來看看具體原因:

1:配置一個datasource,connection的連接數具體配置如下:

2:weblogic啟動後,我們可以看到current capacity為15,此時connection pool剛被初始化,weblogic會根據initial capacity去創建相應數量的連接。此時如果我們關閉數據庫,然後通過測試程序去獲取連接,你會看到我們無法拿到連接(注意我們要選上 TestOnReserve),重復三次,再次去監控connection pool。因為三次test失敗後,connection pool會被disable(狀態為suspend),如下:

3:重啟database。由於weblogic內部實現了connection pool的自檢功能,對於disabled的connection pool,weblogic每隔5秒鐘去做一次連接嘗試,如果連接創建成功,新建連接會被放入連接池,同時resume連接池。通過監控我們可以看到,連接池狀態變成running,同時current capacity變成1,

4:啟動多線程測試程序,模擬2個用戶並發。第一個用戶可以從connection pool中成功拿到連接,而第二個用戶因為連接池的current capacity為1,無法直接從pool中拿到連接,這是連接池需要做擴展,而擴展的個數就是我們設定的capacity increment(20)。再來監控connection pool,我們就會看到連接池的current capacity為21,如下:

那麼我們能不能通過參數配置不讓connection pool不作disable呢?我們前面所提到的兩個參數:CountOfTestFailuresTillFlush、 CountOfRefreshFailuresTillDisable,可以實現這樣的要求:

1   <internal-properties>
 2           <property>
 3             <name>CountOfTestFailuresTillFlush</name>
 4             <value>10</value>
 5           </property>
 6           <property>
 7             <name>CountOfRefreshFailuresTillDisable</name>
 8             <value>20</value>
 9           </property>
10   </internal-properties>

internal-properties用於定義一些weblogic internal的參數,這些參數無法在console上做配置。除了上面的這兩個參數,我們還可以通過internal-properties配置如下幾個參數:

TestConnectionsOnCreate
    TestConnectionsOnRelease
    HighestNumUnavailable
    SecurityCacheTimeoutSeconds

通過上述分析,我們可以看到這個問題不是weblogic的bug,而是因為網絡問題導致connection pool被disable,要徹底解決這個問題,可以通過網絡分析工具查出網絡問題,進而解決我們看到的這種現象。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved