在過去的十年中,Oracle已經成為世界上最專業的數據庫之一。對於IT專家來說,就是要確保利用Oracle的強大特性來提高他們公司的生產力。最有效的方法之一是通過Oracle調優。它有大量的調整參數和技術來改進你的Oracle數據庫的性能。 Oracle調優是一個復雜的主題。關於調優可以寫整整一本書,不過,為了改善Oracle數據庫的性能,有一些基本的概念是每個Oracle DBA都應該遵從的。
在這篇簡介中,我們將簡要地介紹以下的Oracle主題:
外部調整:我們應該記住Oracle並不是單獨運行的。因此我們將查看一下通過調整Oracle服務器以得到高的性能。
Rowre-sequencing以減少磁盤I/O:我們應該懂得Oracle調優最重要的目標是減少I/O。
Oracle SQL調整:Oracle SQL調整是Oracle調整中最重要的領域之一,只要通過一些簡單的SQL調優規則就可以大幅度地提升SQL語句的性能,這是一點都不奇怪的。
調整Oracle排序:排序對於Oracle性能也是有很大影響的。
調整Oracle的競爭:表和索引的參數設置對於UPDATE和INSERT的性能有很大的影響。
我們首先從調整Oracle外部的環境開始。如果內存和CPU的資源不足的話,任何的Oracle調整都是沒有幫助的。
外部的性能問題
Oracle並不是單獨運行的。Oracle數據庫的性能和外部的環境有很大的關系。這些外部的條件包括有:
◆CPU--CPU資源的不足令查詢變慢。當查詢超過了Oracle服務器的CPU性能時,你的數據庫性能就受到CPU的限制。
◆內存--可用於Oralce的內存數量也會影響SQL的性能,特別是在數據緩沖和內存排序方面。
◆網絡--大量的Net8通信令SQL的性能變慢。
許多新手都錯誤的認為應該首先調整Oracle數據庫,而不是先確認外部資源是否足夠。實際上,如果外部環境出現瓶頸,再多的Oracle調整都是沒有幫助的。
在檢查Oracle的外部環境時,有兩個方面是需要注意的:
1、當運行隊列的數目超過服務器的CPU數量時,服務器的性能就會受到CPU的限制。補救的方法是為服務器增加額外的CPU或者關閉需要很多處理資源的組件,例如Oracle Parallel Query 。
2、內存分頁。當內存分頁時,內存容量已經不足,而內存頁是與磁盤上的交換區進行交互的。補救的方法是增加更多的內存,減少Oracle SGA的大小,或者關閉Oracle的多線程服務器。
可以使用各種標准的服務器工具來得到服務器的統計數據,例如vmstat,glance,top和sar。DBA的目標是確保數據庫服務器擁有足夠的CPU和內存資源來處理Oracle的請求。
以下讓我們來看一下Oracle的row-resequencing是如何能夠極大地減少磁盤I/O的。
Row-resequencing(行的重新排序) 就象我們上面提到的,有經驗的Oracle DBA都知道I/O是響應時間的最大組成部分。其中磁盤I/O特別厲害,因為當Oracle由磁盤上的一個數據文件得到一個數據塊時,讀的進程就必須等待物理I/O操作完成。磁盤操作要比數據緩沖慢10,000倍。因此,如果可以令I/O最小化,或者減少由於磁盤上的文件競爭而帶來的瓶頸,就可以大大地改善Oracle數據庫的性能。
如果系統響應很慢,通過減少磁盤I/O就可以有一個很快的改善。如果在一個事務中通過按一定的范圍搜索primary-key索引來訪問表,那麼重新以CTAS的方法組織表將是你減少I/O的首要策略。通過在物理上將行排序為和primary-key索引一樣的順序,就可以加快獲得數據的速度。
就象磁盤的負載平衡一樣,行的重新排序也是很簡單的,而且也很快。通過與其它的DBA管理技巧一起使用,就可以在高I/O的系統中大大地減少響應的時間。
在高容量的在線事務處理環境中(online transaction processing,OLTP),數據是由一個primary索引得到的,重新排序表格的行就可以令連續塊的順序和它們的primary索引一樣,這樣就可以在索引驅動的表格查詢中,減少物理I/O並且改善響應時間。這個技巧僅在應用選擇多行的時候有用,或者在使用索引范圍搜索和應用發出多個查詢來得到連續的key時有效。對於隨機的唯一primary-key(主鍵)的訪問將不會由行重新排序中得到好處。
讓我們看一下它是如何工作的。考慮以下的一個SQL的查詢,它使用一個索引來得到100行:
selectsalaryfromemployeewherelast_name like 'B%';
這個查詢將會使用last_name_index,搜索其中的每一行來得到目標行。這個查詢將會至少使用100次物理磁盤的讀取,因為employee的行存放在不同的數據塊中。
不過,如果表中的行已經重新排序為和last_name_index的一樣,同樣的查詢又會怎樣處理呢?我們可以看到這個查詢只需要三次的磁盤I/O就讀完全部100個員工的資料(一次用作索引的讀取,兩次用作數據塊的讀取),減少了97次的塊讀取。
重新排序帶來的性能改善的程度在於在你開始的時候行的亂序性如何,以及你需要由序列中訪問多少行。至於一個表中的行與索引的排序鍵的匹配程度,可以查看數據字典中的dba_indexes和dba_tables視圖得到。
在dba_indexes的視圖中,查看clustering_factor列。如果clustering_factor的值和表中的塊數目大致一樣,那麼你的表和索引的順序是一樣的。不過,如果clustering_factor的值接近表中的行數目,那就表明表格中的行和索引的順序是不一樣的。
行重新排序的作用是不可以小看的。在需要進行大范圍的索引搜索的大表中,行重新排序可以令查詢的性能提高三倍。
一旦你已經決定重新排序表中的行,你可以使用以下的工具之一來重新組織表格。
◆使用Oracle的Create Table As Select (CTAS)語法來拷貝表格
◆Oracle9i自帶的表格重新組織工具
以下,我們來看以下SQL語句的調優。
SQL調優
Oracle的SQL調優是一個復雜的主題,甚至是需要整本書來介紹Oracle SQL調優的細微差別。不過有一些基本的規則是每個Oracle DBA都需要跟從的,這些規則可以改善他們系統的性能。SQL調優的目標是簡單的:
◆消除不必要的大表全表搜索:不必要的全表搜索導致大量不必要的I/O,從而拖慢整個數據庫的性能。調優專家首先會根據查詢返回的行數目來評價SQL。在一個有序的表中,如果查詢返回少於40%的行,或者在一個無序的表中,返回少於7%的行,那麼這個查詢都可以調整為使用一個索引來代替全表搜索。對於不必要的全表搜索來說,最常見的調優方法是增加索引。可以在表中加入標准的B樹索引,也可以加入bitmap和基於函數的索引。要決定是否消除一個全表搜索,你可以仔細檢查索引搜索的I/O開銷和全表搜索的開銷,它們的開銷和數據塊的讀取和可能的並行執行有關,並將兩者作對比。在一些情況下,一些不必要的全表搜索的消除可以通過強制使用一個index來達到,只需要在SQL語句中加入一個索引的提示就可以了。
◆在全表搜索是一個最快的訪問方法時,將小表的全表搜索放到緩存中,調優專家應該確保有一個專門的數據緩沖用作行緩沖。在Oracle7中,你可以使用alter table xxx cache語句,在Oracle8或以上,小表可以被強制為放到KEEP池中緩沖。
◆確保最優的索引使用:對於改善查詢的速度,這是特別重要的。有時Oracle可以選擇多個索引來進行查詢,調優專家必須檢查每個索引並且確保Oracle使用正確的索引。它還包括bitmap和基於函數的索引的使用。
◆確保最優的JOIN操作:有些查詢使用NESTED LOOP join快一些,有些則是HASH join快一些,另外一些則是sort-merge join更快。
這些規則看來簡單,不過它們占SQL調優任務的90%,並且它們也無需完全懂得Oracle SQL的內部運作。以下我們來簡單概覽以下Oracle SQL的優化。
我們首先簡要查看Oracle的排序,並且看一看排序操作是如何影響性能的。
調整Oracle的排序操作 排序是SQL語法中一個小的方面,但很重要,在Oracle的調整中,它常常被忽略。當使用create index、ORDER BY或者GROUP BY的語句時,Oracle數據庫將會自動執行排序的操作。通常,在以下的情況下Oracle會進行排序的操作:
使用Order by的SQL語句
使用Group by的SQL語句在創建索引的時候進行table join時,由於現有索引的不足而導致SQL優化器調用MERGE SORT。
當與Oracle建立起一個session時,在內存中就會為該session分配一個私有的排序區域。如果該連接是一個專用的連接(dedicated connection),那麼就會根據init.ora中sort_area_size參數的大小在內存中分配一個Program Global Area (PGA)。如果連接是通過多線程服務器建立的,那麼排序的空間就在large_pool中分配。不幸的是,對於所有的session,用做排序的內存量都必須是一樣的,我們不能為需要更大排序的操作分配額外的排序區域。因此,設計者必須作出一個平衡,在分配足夠的排序區域以避免發生大的排序任務時出現磁盤排序(disk sorts)的同時,對於那些並不需要進行很大排序的任務,就會出現一些浪費。當然,當排序的空間需求超出了sort_area_size的大小時,這時將會在TEMP表空間中分頁進行磁盤排序。磁盤排序要比內存排序大概慢14,000倍。
上面我們已經提到,私有排序區域的大小是有init.ora中的sort_area_size參數決定的。每個排序所占用的大小由init.ora中的sort_area_retained_size參數決定。當排序不能在分配的空間中完成時,就會使用磁盤排序的方式,即在Oracle實例中的臨時表空間中進行。
磁盤排序的開銷是很大的,有幾個方面的原因。首先,和內存排序相比較,它們特別慢;而且磁盤排序會消耗臨時表空間中的資源。Oracle還必須分配緩沖池塊來保持臨時表空間中的塊。無論什麼時候,內存排序都比磁盤排序好,磁盤排序將會令任務變慢,並且會影響Oracle實例的當前任務的執行。還有,過多的磁盤排序將會令free buffer waits的值變高,從而令其它任務的數據塊由緩沖中移走。
接著,讓我們看一下Oracle的競爭,並且看一下表的存儲參數的設置是如何影響SQL UPDATE和INSERT語句的性能的。
調整Oracle的競爭
Oracle的其中一個優點時它可以管理每個表空間中的自由空間。Oracle負責處理表和索引的空間管理,這樣就可以讓我們無需懂得Oracle的表和索引的內部運作。不過,對於有經驗的Oracle調優專家來說,他需要懂得Oracle是如何管理表的extent和空閒的數據塊。對於調整擁有高的insert或者update的系統來說,這是非常重要的。
要精通對象的調整,你需要懂得freelists和freelist組的行為,它們和pctfree及pctused參數的值有關。這些知識對於企業資源計劃(ERP)的應用是特別重要的,因為在這些應用中,不正確的表設置通常是DML語句執行慢的原因。
對於初學者來說,最常見的錯誤是認為默認的Oracle參數對於所有的對象都是最佳的。除非磁盤的消耗不是一個問題,否則在設置表的pctfree和pctused參數時,就必須考慮平均的行長和數據庫的塊大小,這樣空的塊才會被有效地放到freelists中。當這些設置不正確時,那些得到的freelists也是“dead”塊,因為它們沒有足夠的空間來存儲一行,這樣將會導致明顯的處理延遲。
Freelists對於有效地重新使用Oracle表空間中的空間是很重要的,它和pctfree及pctused這兩個存儲參數的設置直接相關。
通過將pctused設置為一個高的值,這時數據庫就會盡快地重新使用塊。不過,高性能和有效地重新使用表的塊是對立的。在調整Oracle的表格和索引時,需要認真考慮究竟需要高性能還是有效的空間重用,並且據此來設置表的參數。以下我們來看一下這些freelists是如何影響Oracle的性能的。
當有一個請求需要插入一行到表格中時,Oracle就會到freelist中尋找一個有足夠的空間來容納一行的塊。你也許知道,freelist串是放在表格或者索引的第一個塊中,這個塊也被稱為段頭(segment header)。pctfree和pctused參數的唯一目的就是為了控制塊如何在freelists中進出。雖然freelist link和unlink是簡單的Oracle功能,不過設置freelist link(pctused)和unlink(pctfree)對Oracle的性能確實有影響。
由DBA的基本知識知道,pctfree參數是控制freelist un-links的(即將塊由freelists中移除)。設置pctfree=10意味著每個塊都保留10%的空間用作行擴展。pctused參數是控制freelist re-links的。設置pctused=40意味著只有在塊的使用低於40%時才會回到表格的freelists中。
許多新手對於一個塊重新回到freelists後的處理都有些誤解。其實,一旦由於一個刪除的操作而令塊被重新加入到freelist中,它將會一直保留在freelist中即使空間的使用超過了60%,只有在到達pctfree時才會將數據塊由freelist中移走。
表格和索引存儲參數設置的要求總結 以下的一些規則是用來設置freelists,freelistgroups,pctfree和pctused存儲參數的。你也知道,pctused和pctfree的值是可以很容易地通過alter table命令修改的,一個好的DBA應該知道如何設置這些參數的最佳值。
有效地使用空間和高性能之間是有矛盾的,而表格的存儲參數就是控制這個方面的矛盾:
◆對於需要有效地重新使用空間,可以設置一個高的pctused值,不過副作用是需要額外的I/O。一個高的pctused值意味著相對滿的塊都會放到freelist中。因此,這些塊在再次滿之前只可以接受幾行記錄,從而導致更多的I/O。
◆追求高性能的話,可以將pctused設置為一個低的值,這意味著Oracle不會將數據塊放到freelists中直到它幾乎是空的。
那麼塊將可以在滿之前接收更多的行,因此可以減少插入操作的I/O。要記住Oracle擴展新塊的性能要比重新使用現有的塊高。對於Oracle來說,擴展一個表比管理freelists消耗更少的資源。
讓我們來回顧一下設置對象存儲參數的一些常見規則:
◆經常將pctused設置為可以接收一條新行。對於不能接受一行的free blocks對於我們來說是沒有用的。如果這樣做,將會令Oracle的性能變慢,因為Oracle將在擴展表來得到一個空的塊之前,企圖讀取5個“dead”的free block 。
◆表格中chained rows的出現意味著pctfree太低或者是db_block_size太少。在很多情況下,RAW和LONG RAW列都很巨大,以至超過了Oracle的最大塊的大小,這時chained rows是不可以避免的。
◆如果一個表有同時插入的SQL語句,那麼它需要有同時刪除的語句。運行單一個一個清除的工作將會把全部的空閒塊放到一個freelist中,而沒有其它包含有任何空閒塊的freelists出現。
◆freelist參數應該設置為表格同時更新的最大值。例如,如果在任何時候,某個表最多有20個用戶執行插入的操作,那麼該表的參數應該設置為freelists=20。
應記住的是freelist groups參數的值只是對於Oracle Parallel Server和Real Application Clusters才是有用的。對於這類Oracle,freelist groups應該設置為訪問該表格的Oracle Parallel Server實例的數目。