關鍵詞 Oracle 數據庫 性能優化 策略
引言
Oracle是目前使用最為廣泛的大型數據庫管理系統,提高Oracle數據庫系統的運行效率,是整個計算機信息系統高效運轉的前提和保證。影響Oracle數據庫應用系統性能的因素很多,既有軟件方面的因素,也包括數據運行的硬件環境、網絡環境、數據庫管理和維護方面的因素等。數據庫系統設計開發階段是Oracle應用優化的最佳階段,也是主動優化階段,能達到以最小成本獲得最大性能增益的目的。通過對其邏輯存儲結構和物理存儲結構設計進行優化,使之在滿足需求條件下,時空開銷性能最佳,可以解決數據庫系統運行過程中性能的漸進性下降或性能突降等問題,以保證系統運行的優良性能。
Oracle數據庫的邏輯結構和物理結構
Oracle 數據庫的邏輯結構是由一些數據庫對象組成,如數據庫表空間、表、索引、段、視圖、存儲過程、觸發器等。數據庫的邏輯存儲結構(表空間等)決定了數據庫的物理空間是如何被使用的,數據庫對象如表、索引等分布在各個表空間中。
Oracle 數據庫的物理結構從操作系統一級查看,是由一個個的文件組成,從物理上可劃分為:數據文件、日志文件、控制文件和參數文件。數據文件中存放了所有的數據信息;日志文件存放數據庫運行期間產生的日志信息,它被重復覆蓋使用,若不采用歸檔方式的話,已被覆蓋的日志信息將無法恢復;控制文件記錄了整個數據庫的關鍵結構信息,它若被破壞,整個數據庫將無法工作和恢復;參數文件中設置了很多Oracle 數據庫的配置參數,當數據庫啟動時,會讀取這些信息。
邏輯結構的優化
邏輯結構優化用通俗的話來說就是通過增加、減少或調整邏輯結構來提高應用的效率,下面通過對基本表的設計及索引、聚簇的討論來分析Oracle邏輯結構的優化。
1、基本表擴展
數據庫性能包括存儲空間需求量的大小和查詢響應時間的長短兩個方面。為了優化數據庫性能,需要對數據庫中的表進行規范化。一般來說,邏輯數據庫設計滿足第三范式的表結構容易維護且基本滿足實際應用的要求。所以,實際應用中一般都按照第三范式的標准進行規范化,從而保證了數據庫的一致性和完整性,設計人員往往會設計過多的表間關聯,以盡可能地降低數據冗余。但在實際應用中這種做法有時不利於系統運行性能的優化:如過程從多表獲取數據時引發大量的連接操作,在需要部分數據時要掃描整個表等,這都消耗了磁盤的I/O 和CPU 時間。
為解決這一問題,在設計表時應同時考慮對某些表進行反規范化,方法有以下幾種:一是分割表。分割表可分為水平分割表和垂直分割表兩種:水平分割是按照行將一個表分割為多個表,這可以提高每個表的查詢速度,但查詢、更新時要選擇不同的表,統計時要匯總多個表,因此應用程序會更復雜。垂直分割是對於一個列很多的表,若某些列的訪問頻率遠遠高於其它列,就可以將主鍵和這些列作為一個表,將主鍵和其它列作為另外一個表。通過減少列的寬度,增加了每個數據頁的行數,一次I/O就可以掃描更多的行,從而提高了訪問每一個表的速度。但是由於造成了多表連接,所以應該在同時查詢或更新不同分割表中的列的情況比較少的情況下使用。二是保留冗余列。當兩個或多個表在查詢中經常需要連接時,可以在其中一個表上增加若干冗余的列,以避免表之間的連接過於頻繁,一般在冗余列的數據不經常變動的情況下使用。三是增加派生列。派生列是由表中的其它多個列的計算所得,增加派生列可以減少統計運算,在數據匯總時可以大大縮短運算時間。
因此,在數據庫的設計中,數據應當按兩種類別進行組織:頻繁訪問的數據和頻繁修改的數據。對於頻繁訪問但是不頻繁修改的數據,內部設計應當物理不規范化。對於頻繁修改但並不頻繁訪問的數據,內部設計應當物理規范化。有時還需將規范化的表作為邏輯數據庫設計的基礎,然後再根據整個應用系統的需要,物理地非規范化數據。規范與反規范都是建立在實際的操作基礎之上的約束,脫離了實際兩者都沒有意義。只有把兩者合理地結合在一起,才能相互補充,發揮各自的優點。
2、索引和聚簇
創建索引是提高檢索效率最有效的方法之一,索引把表中的邏輯值映射到安全的RowID,能快速定位數據的物理地址,可以大大加快數據庫的查詢速度,一個建有合理索引的數據庫應用系統可能比一個沒有建立索引的數據庫應用系統效率高幾十倍,但並不是索引越多越好,在那些經常需要修改的數據列上建立索引,將導致索引B*樹的不斷重組,造成系統性能的下降和存儲空間的浪費。對於一個大型表建立的索引,有時並不能改善數據查詢速度,反而會影響整個數據庫的性能。這主要是和SGA的數據管理方式有關,Oracle在進行數據塊高速緩存管理時,索引數據比普通數據具有更高的駐留權限,在進行空間競爭時,Oracle會先移出普通數據,對建有索引的大型表進行數據查詢時,索引數據可能會用完所有的數據塊緩存空間,Oracle不得不頻繁地進行磁盤讀寫來獲取數據,所以,在對一個大型表進行分區之後,可以根據相應的分區建立分區索引。
Oracle提供了另一種方法來提高查詢速度,就是聚簇(Cluster)。所謂聚簇,簡單地說就是把幾個表放在一起,按一定公共屬性混合存放。聚簇根據共同碼值將多個表的數據存儲在同一個Oracle塊中,這時檢索一組Oracle塊就同時得到兩個表的數據,這樣就可以減少需要存儲的Oracle塊,從而提高應用程序的性能。
對於邏輯結構的優化,還應將表數據和索引數據分開表空間存儲,分別使用獨立的表空間。因為如果將表數據和索引數據放在一起,表數據的I/O操作和索引的I/O操作將產生影響系統性能的I/O競爭,降低系統的響應效率。將表數據和索引數據存放在不同的表空間中,並在物理層面將這兩個表空間的數據文件放在不同的物理磁盤上,就可以避免這種競爭了。
物理結構的優化
數據庫的數據最終是存儲在物理磁盤上的,對數據進行訪問就是對這些物理磁盤進行讀寫,因此對於這些物理存儲的優化是系統優化的一個重要部分。對於物理存儲結構優化,主要是合理地分配邏輯結構的物理存儲地址,這樣雖不能減少對物理存儲的讀寫次數,但卻可以使這些讀寫盡量並行,減少磁盤讀寫競爭,從而提高效率,也可以通過對物理存儲進行精密的計算減少不必要的物理存儲結構擴充,從而提高系統利用率。
1、磁盤讀寫並行優化
對於數據庫的物理讀寫,Oracle系統本身會進行盡可能的並行優化,例如在一個最簡單的表檢索操作中,如果表結構和檢索域上的索引不在一個物理結構上,那麼在檢索的過程中,對索引的檢索和對表的檢索就是並行進行的。
2、操作並行優化
操作並行的優化是基於操作語句的統計結果,首先是統計各個表的訪問頻率,表之間的連接頻率,根據這些數據按如下原則分配表空間和物理磁盤,減少系統進程和用戶進程的磁盤I/O競爭;把需要連接的表格在表空間/物理磁盤上分開;把高頻訪問的表格在表空間/物理磁盤上分開;把經常需要進行檢索的表格的表結構和索引在表空間/物理磁盤上分開。
3、減少存儲結構擴展
如果應用系統的數據庫比較脆弱,並在不斷地增長或縮小,這樣的系統在非動態變化周期內效率合理,但是當在動態變化周期內的時候,性能卻很差,這是由於Oracle的動態擴展造成的。在動態擴張的過程中,Oracle必須根據存儲的要求,在創建行、行變化獲取缺省值時,擴展和分配新的存儲空間,而且表格的擴展往往並不是事情的終結,還可能導致數據文件、表空間的增長,這些擴展會導致在線系統反應緩慢。對於這樣的系統,最好的辦法就是在建立的時候預先分配足夠的大小和合適的增長幅度。在一個對象建立的時候要根據應用充分地計算他們的大小,然後再根據這些數據來定義對象Initial、Next和Minextents的值,使數據庫在物理存儲上和動態增長次數上達到一個比較好的平衡點,使這些對象既不經常發生增長,也不過多地占用數據庫。
結論
優化Oracle 數據庫對提高計算機系統的可用性和效率,具有非常重要的意義, 特別是在Oracle數據庫設計開發階段,對邏輯結構和物理結構進行有效的優化設計,創建一個規劃布局合理的數據庫,可以獲得最小的系統開銷,能從根本上大大提高應用系統的整體性能,對於以後的數據庫性能調整和利用都有很大的益處。