程式師世界 >> 數據庫知識 >> Oracle數據庫 >> Oracle數據庫基礎 >> 基於Oracle數據庫上的SQL語句優化分析淺談Oracle ERP上線准備的五條重要經驗

基於Oracle數據庫上的SQL語句優化分析淺談Oracle ERP上線准備的五條重要經驗

編輯：Oracle數據庫基礎

操作符優化

　　IN 操作符

　　用IN寫出來的SQL的優點是比較容易寫及清晰易懂，這比較適合現代軟件開發的風格。

　　但是用IN的SQL性能總是比較低的，從Oracle執行的步驟來分析用IN的SQL與不用IN的SQL有以下區別：

　　Oracle試圖將其轉換成多個表的連接，如果轉換不成功則先執行IN裡面的子查詢，再查詢外層的表記錄，如果轉換成功則直接采用多個表的連接方式查詢。由此可見用IN的SQL至少多了一個轉換的過程。一般的SQL都可以轉換成功，但對於含有分組統計等方面的SQL就不能轉換了。

　　推薦方案：在業務密集的SQL當中盡量不采用IN操作符。

　　NOT IN操作符

　　此操作是強列推薦不使用的，因為它不能應用表的索引。

　　推薦方案：用NOT EXISTS 或(外連接+判斷為空)方案代替

　　操作符(不等於)

　　不等於操作符是永遠不會用到索引的，因此對它的處理只會產生全表掃描。

　　推薦方案：用其它相同功能的操作運算代替，

　　如 a0 改為 a>0 or a a’’ 改為 a>’’

　　IS NULL 或IS NOT NULL操作(判斷字段是否為空)

　　判斷字段是否為空一般是不會應用索引的，因為B樹索引是不索引空值的。

　　推薦方案：

　　用其它相同功能的操作運算代替，如 a is not null 改為 a>0 或a>’’等。

　　不允許字段為空，而用一個缺省值代替空值，如業擴申請中狀態字段不允許為空，缺省為申請。

　　建立位圖索引(有分區的表不能建，位圖索引比較難控制，如字段值太多索引會使性能下降，多人更新操作會增加數據塊鎖的現象)

　　> 及操作符(大於或小於操作符)

　　大於或小於操作符一般情況下是不用調整的，因為它有索引就會采用索引查找，但有的情況下可以對它進行優化，如一個表有100萬記錄，一個數值型字段A，30萬記錄的A=0，30萬記錄的A=1，39萬記錄的A=2，1萬記錄的A=3。那麼執行A>2與A>=3的效果就有很大的區別了，因為A>2時ORACLE會先找出為2的記錄索引再進行比較，而A>=3時Oracle則直接找到=3的記錄索引。
LIKE操作符

　　LIKE操作符可以應用通配符查詢，裡面的通配符組合可能達到幾乎是任意的查詢，但是如果用得不好則會產生性能上的問題，如LIKE ‘%5400%’ 這種查詢不會引用索引，而LIKE ‘X5400%’則會引用范圍索引。一個實際例子：用YW_YHJBQK表中營業編號後面的戶標識號可來查詢營業編號 YY_BH LIKE ‘%5400%’ 這個條件會產生全表掃描，如果改成YY_BH LIKE ’X5400%’ OR YY_BH LIKE ’B5400%’ 則會利用YY_BH的索引進行兩個范圍的查詢，性能肯定大大提高。

　　UNION操作符

　　UNION在進行表鏈接後會篩選掉重復的記錄，所以在表鏈接後會對所產生的結果集進行排序運算，刪除重復的記錄再返回結果。實際大部分應用中是不會產生重復的記錄，最常見的是過程表與歷史表UNION。

　　如：

　　select * from gc_dfys
　　union select * from ls_jg_dfys

　　這個SQL在運行時先取出兩個表的結果，再用排序空間進行排序刪除重復的記錄，最後返回結果集，如果表數據量大的話可能會導致用磁盤進行排序。推薦方案：采用UNION ALL操作符替代UNION，因為UNION ALL操作只是簡單的將兩個結果合並後就返回。

　　select * from gc_dfys union all
　　select * from ls_jg_dfys

　　SQL書寫的影響同一功能同一性能不同寫法SQL的影響

　　如一個SQL在A程序員寫的為 Select * from zl_yhjbqk

　　B程序員寫的為 Select * from dlyx.zl_yhjbqk(帶表所有者的前綴)

　　C程序員寫的為 Select * from DLYX.ZLYHJBQK(大寫表名)

　　D程序員寫的為 Select * from DLYX.ZLYHJBQK(中間多了空格)

　　以上四個SQL在ORACLE分析整理之後產生的結果及執行的時間是一樣的，但是從ORACLE共享內存SGA的原理，可以得出ORACLE對每個SQL 都會對其進行一次分析，並且占用共享內存，如果將SQL的字符串及格式寫得完全相同則ORACLE只會分析一次，共享內存也只會留下一次的分析結果，這不僅可以減少分析SQL的時間，而且可以減少共享內存重復的信息，Oracle也可以准確統計SQL的執行頻率。

　　WHERE後面的條件順序影響

　　WHERE子句後面的條件順序對大數據量表的查詢會產生直接的影響，

　　如

　　Select * from zl_yhjbqk where dy_dj = ‘1KV以下’ and xh_bz=1
　　Select * from zl_yhjbqk where xh_bz=1 and dy_dj = ‘1KV以下’

　　以上兩個SQL中dy_dj(電壓等級)及xh_bz(銷戶標志)兩個字段都沒進行索引，所以執行的時候都是全表掃描，第一條SQL的dy_dj = ‘1KV以下’條件在記錄集內比率為99%，而xh_bz=1的比率只為0.5%，在進行第一條SQL的時候99%條記錄都進行dy_dj及xh_bz的比較，而在進行第二條SQL的時候0.5%條記錄都進行dy_dj及xh_bz的比較，以此可以得出第二條SQL的CPU占用率明顯比第一條低。
　查詢表順序的影響

　　在FROM後面的表中的列表順序會對SQL執行性能影響，在沒有索引及ORACLE沒有對表進行統計分析的情況下ORACLE會按表出現的順序進行鏈接，由此因為表的順序不對會產生十分耗服務器資源的數據交叉。(注：如果對表進行了統計分析，Oracle會自動先進小表的鏈接，再進行大表的鏈接)

　　SQL語句索引的利用

　　對操作符的優化(見上節) 對條件字段的一些優化

　　采用函數處理的字段不能利用索引，如： substr(hbs_bh,1,4)=’5400’，優化處理：hbs_bh like ‘5400%’

　　trunc(sk_rq)=trunc(sysdate)，優化處理：

　　sk_rq>=trunc(sysdate) and sk_rq
　　sysdate+1)

　　進行了顯式或隱式的運算的字段不能進行索引，如：

　　ss_df+20>50，優化處理：ss_df>30 ‘X’||hbs_bh>’X5400021452’，優化處理：hbs_bh>’5400021542’

　　sk_rq+5=sysdate，優化處理：sk_rq=sysdate-5 hbs_bh=5401002554，優化處理：hbs_bh=’ 5401002554’，注：此條件對hbs_bh 進行隱式的to_number轉換，因為hbs_bh字段是字符型。條件內包括了多個本表的字段運算時不能進行索引，如： ys_df>cx_df，無法進行優化

　　qc_bh||kh_bh=’5400250000’，優化處理：qc_bh=’5400’ and kh_bh=’250000’

　　應用Oracle的HINT(提示)處理

　　提示處理是在Oracle產生的SQL分析執行路徑不滿意的情況下要用到的。它可以對SQL進行以下方面的提示

　　目標方面的提示：

　　COST(按成本優化) RULE(按規則優化)

　　CHOOSE(缺省)(Oracle自動選擇成本或規則進行優化) ALL_ROWS(所有的行盡快返回)

　　FIRST_ROWS(第一行數據盡快返回)

　　執行方法的提示：

　　USE_NL(使用NESTED LOOPS方式聯合) USE_MERGE(使用MERGE JOIN方式聯合)

　　USE_HASH(使用HASH JOIN方式聯合)

　　索引提示：

　　INDEX(TABLE INDEX)(使用提示的表索引進行查詢)

　　其它高級提示(如並行處理等等)

　　ORACLE的提示功能是比較強的功能，也是比較復雜的應用，並且提示只是給ORACLE執行的一個建議，有時如果出於成本方面的考慮ORACLE也可能不會按提示進行。根據實踐應用，一般不建議開發人員應用ORACLE提示，因為各個數據庫及服務器性能情況不一樣，很可能一個地方性能提升了，但另一個地方卻下降了，Oracle在SQL執行分析方面已經比較成熟，如果分析執行的路徑不對首先應在數據庫結構(主要是索引)、服務器當前性能(共享內存、磁盤文件碎片)、數據庫對象(表、索引)統計信息是否正確這幾方面分析。