程式師世界 >> 數據庫知識 >> SyBase數據庫 >> SyBase教程 >> Sybase數據庫的碎片整理

Sybase數據庫的碎片整理

編輯：SyBase教程

對於像Sybase這樣的大型DBMS系統而言，作為OLTP(聯機事務處理)應用的基石，它需要能每天24小時，每年365天不間斷運行。由於其應用程序每天對數據庫進行大量的插入、更新、刪除等操作，在數據庫的物理存儲介質上產生了大量存儲碎片，從而影響了存儲的效率以及數據庫應用運行的速度。是否可以像Windows操作系統的“碎片整理”程序一樣，整理這些碎片，從而優化數據庫存儲，提高數據庫的運行速度呢？答案是肯定的。本文將介紹Sybase數據庫的碎片類型以及碎片整理方法。 碎片類型 由於Sybase是通過OAM頁、分配單元和擴展頁來管理數據的，所以對OLTP應用的Database Server會十分頻繁地進行數據刪除、插入和更新等操作，時間一長就會出現以下幾種情況： 1. 頁碎片 即本來可以存放在一個頁上的數據卻分散地存儲在多個頁上。如果這些頁存儲在不同的擴展單元上，Database Server就要訪問多個擴展單元，因此降低了系統性能。 2. 擴展單元碎片 在堆表中，當刪除數據鏈中間的記錄行時，會出現空頁。隨著空頁的累積，擴展單元的利用率也會下降，從而出現擴展單元碎片。帶cluster index的table也有可能出現擴展單元碎片。當有擴展單元碎片存在，會出現以下問題： ● 對表進行處理時，常常出現死鎖； ● 利用較大的I/O操作或增加I/O緩沖區的大小也無法改變較慢的I/O速度； ● 行操作的爭用。 3. 擴展單元遍歷 帶有cluster index的table會由於插入記錄而導致頁分裂，但當刪除記錄後，頁會獲得釋放，從而形成跨幾個擴展單元和分配單元的數據，而要訪問該數據就必須遍歷幾個擴展單元和分配單元。這將導致訪問/查詢記錄的時間大大延長，開始時數據庫的性能雖然較高，但使用一段時間後性能就會下降等問題。實際上，數據在存儲空間上排列得越緊密有序，Database Server訪問的速度就越快，消除碎片有助於提高系統的性能和更有效地利用數據存儲空間。 碎片優化方法 處理碎片有多種方法，如重新定義table的填充因子，根據table的定義刪除並重新創建索引、重建表等。本文給出的方法是通過BCP實用程序將用戶數據庫的數據以文本形式導出，然後將用戶數據庫徹底清空、截斷，再將文本數據導入到數據庫，從而達到消除碎片的目的，具有通用性。下面以Sun Solaris 7操作系統下的Sybase Adaptive Server Enterprise 11.5為例，說明整理數據庫數據的具體方法。 1. 備份數據庫 為防止在數據庫碎片整理過程中出現不可預見的問題，有必要先備份數據庫。 2. 創建bcp out腳本並導出數據 ● 創建包含下列SQL語句的文件： cre_bcp_out.sql select “bcp” + name + “out ./” + name + “_out.txt -Udboname -Pdbopwd -Ssys_name -c” from sysobjects where type = ‘U’ order by name go ● isql -Udboname -Pdbopwd -Ssystemname < cre_bcp_out. sql > b_out ● 編輯輸出文件，去掉文件第一行和最後兩行無關的字符：vi b_out ● 執行腳本，將數據庫的數據導出到文本文件：sh b_out 3. 創建truncate table腳本並截斷數據庫 ● 創建包含下列SQL語句的文件： cre_trunc_out.sql select “truncate table” + name from sysobjects where type = ‘U’ order by name go ● isql -Udboname -Pdbopwd -Ssystemname < cre_ trunc_out. sql > trunc_out. sql ● 編輯輸出文件，去掉文件第一行和最後兩行無關的字符，並在最後一行加入 go構成完整的SQL語句：vi trunc_out ● 執行以下語句，清空數據庫的數據： isql -Udboname -Pdbopwd < trunc_out. sql 4. 創建bcp in腳本並導入數據 ● 創建包含下列SQL語句的文件： cre_bcp_in. sql select “bcp” + name + “in ./” + name + “_out.txt -Udboname -Pdbopwd -Ssys_name -c”from sysobjects where type = ‘U’ order by name go ● isql -Udboname -Pdbopwd -Ssystemname < cre_ bcp_in. sql > b_in ● 編輯輸出文件，去掉文件第一行和最後兩行無關的字符：vi b_in ● 從文本中導入數據：sh b_in 5. 更新數據庫狀態 Sybase不自動維護索引的統計信息，當用truncate table截斷數據庫時，索引並沒有改變，所以必須用update statistics來確保索引的統計信息對應當前表數據的統計。 ● 創建包含下列SQL語句的文件： cre_upd_st. sql select “update statistics” + name from sysobjects where type = “U” order by name go ● isql -Udboname -Pdbopasswd -Ssystemname < cre_upd_st. sql > upd_st. sql ● 編輯輸出文件，去掉文件第一行和最後兩行無關的字符，在最後一行加入 go構成完整的SQL語句： vi upd_st. sql ● 更新數據庫狀態： isql -Udboname -Pdbopasswd -Ssystemname < upd_st. sql 至此，基本上完成了數據庫用戶表的碎片整理工作。 小結 在整理過程中，有以下兩點需要注意: 1. Tempdb的大小 當Sybase執行bcp in腳本時，會占用導入數據2倍的tempdb空間，因此在執行前要仔細估計最大的table的大小，保證有足夠的tempdb空間。當空間不夠時，要考慮用分割table或刪除陳舊數據的方法縮小table的大小，或者考慮增加tempdb的大小。 2. 數據庫配置選項的設置 當數據庫執行bcp in腳本時會產生大量的log，為保證bcp in進程不致因為log溢出而中斷，應該設置database的選項“truncate log on chkpt”為“true”。雖然Sybase數據庫是自優化的，但只要數據庫是動態的，數據庫碎片現象就會存在。在OLTP應用的場合，隨著數據的不斷增大，系統變得越來越緩慢，並且經常出現死鎖時，應該檢查數據庫的碎片，並且采用以上方法進行優化。實際上，應該定期做數據庫的碎片整理，保證數據庫的物理存儲經常處於最優狀態，相對於增加硬件而言，這是一種更好的保持數據庫性能的低成本的途徑。