2014-08-22
一、摘要
Oracle Database 10g 提供了一個顯著改進的工具:自動工作負載信息庫 (AWR:Automatic Workload Repository)。
Oracle 建議用戶用這個取代 Statspack。
1. AWR 實質上是一個 Oracle 的內置工具,它采集與性能相關的統計數據,並從那些統計數據中導出性能量度,以跟蹤潛在的問題。
快照由一個稱為 MMON 的新的後台進程及其從進程自動采集數據。
$ ps -ef|grep mmon
oracle 12861 1 0 Oct09 ? 00:02:08 ora_mmon_survey
2. 10g中一個新視圖v$session_wait_history這個視圖保存了每個活動session在v$session_wait中最近10次的等待事件。
但這對於一段時期內的數據性能狀況的監測是遠遠不夠的,為了解決這個問題,在10g中還新添加了一個視圖:v$active_session_history,這就是ASH,ASH缺省每一秒收集一下v$session中活動會話的情況,記錄會話等待的事件,不活動的會話不會被采樣 ,間隔時間由 _ash_sampling_interval 參數確定 ,由於記錄session的活動信息是很費時間和空間的,ASH采用的策略是:保存處於等待狀態的活動session的信息,每秒從v$session_wait中采樣一次,並將采樣信息保存在內存中(ASH的采樣數據是保存在內存中)
3. ASH采樣
ASH的采樣數據是保存在內存中,而分配給ASH的內存空間是有限的,當所分配空間占滿後,舊的記錄就會被覆蓋掉;而且數據庫重啟後,所有的這些ASH信息都會消失。
這樣,對於長期檢測oracle的性能是不可能的,在Oracle10g中,提供了永久保留ASH信息的方法,這就是AWR, 由於全部保存ASH中的信息是非常耗費時間和空間的,
所以AWR采用的策略是:MMON進程每小時對ASH 進行采樣一次,並將信息保存到磁盤中,如內存不足,ASH BUFFER滿的話MMNL進程就會主動寫出,並保留7天,7天後舊的記錄才會被覆蓋。這些采樣信息被保存在表
SELECT pool, name, bytes/1024/1024 FROM v$sgastat where name like '%ASH %';
其實,AWR記錄的信息不僅是ASH,還可以收集到數據庫運行的各方面統計信息和等待信息,用以診斷分析。AWR的采樣方式是,以固定的時間間隔為其所有重要的統計信息和負載信息執行一次采樣,並將采樣信息保存在AWR中。可以這樣說:ASH中的信息被保存到了AWR中的視圖wrh$_active_session_history中。ASH是AWR的真子集。
AWR 用幾個表來存儲采集的性能統計數據,所有的表都存儲在 SYSAUX 表空間中的 SYS 模式下,並且以 WRM$_*(5個) 和 WRH$_*(94個)的格式名。
WRM$_*這種類型存儲元數據信息(如檢查的數據庫和采集的快照), WRH$_*這種類型保存實際采集的統計數據。
H代表“歷史數據 (historical)”,而 M 代表“元數據 (metadata)”。
在這些表上構建了幾種帶前綴 DBA_HIST_ 的視圖(dba_hist_snapshot,dba_hist_baseline等),這些視圖可以用來編寫您自己的性能診斷工具。
為了節省空間,系統默認采集的數據在 7 天後自動清除。快照頻率和保留時間都可以由用戶修改:
4. 生成awr報告($ORACLE_HOME/rdbms/admin/):
awrrpt.sql :生成指定快照區間的統計報表;
awrrpti.sql :生成指定數據庫實例,並且指定快照區間的統計報表;
awrsqlrpt.sql :生成指定快照區間,指定SQL語句(實際指定的是該語句的SQLID)的統計報表;
awrsqrpi.sql :生成指定數據庫實例,指定快照區間的指定SQL語句的統計報表;
awrddrpt.sql :指定兩個不同的時間周期,生成這兩個周期的統計對比報表;
二. AWR 操作
2.1. 查看當前的AWR保存策略
SQL> select * from dba_hist_wr_control;
3.2. 調整AWR配置
AWR配置都是通過dbms_workload_repository包進行配置。
2.2.1 調整AWR產生snapshot的頻率和保留策略,如將收集間隔時間改為30 分鐘一次。並且保留5天時間(單位都是分鐘):
SQL> exec dbms_workload_repository.modify_snapshot_settings(interval=>30, retention=>5*24*60);
2.2.2 關閉AWR,把interval設為0則關閉自動捕捉快照
SQL> exec dbms_workload_repository.modify_snapshot_settings(interval=>0);
2.2.3 手工創建一個快照
SQL> exec dbms_workload_repository.create_snapshot();
2.2.4 查看快照
SQL> select * from sys.wrh$_active_session_history
2.2.5 手工刪除指定范圍的快照
SQL> exec dbms_workload_repository.drop_snapshot_range(low_snap_id => 973, high_snap_id => 999, dbid => 262089084);
2.2.6 創建baseline,保存這些數據用於將來分析和比較
SQL> exec dbms_workload_repository.create_baseline(start_snap_id => 1003, end_snap_id => 1013, 'apply_interest_1');
2.2.7 刪除baseline
SQL> exec dbms_workload_repository.drop_baseline(baseline_name => 'apply_interest_1', cascade => FALSE);
2.2.8 將AWR數據導出並遷移到其它數據庫以便於以後分析
SQL> exec DBMS_SWRF_INTERNAL.AWR_EXTRACT(dmpfile => 'awr_data.dmp', mpdir => 'DIR_BDUMP', bid => 1003, eid => 1013);
2.2.9 遷移AWR數據文件到其他數據庫
SQL> exec DBMS_SWRF_INTERNAL.AWR_LOAD(SCHNAME => 'AWR_TEST', dmpfile => 'awr_data.dmp', dmpdir => 'DIR_BDUMP');
把AWR數據轉移到SYS模式中:
SQL> exec DBMS_SWRF_INTERNAL.MOVE_TO_AWR (SCHNAME => 'TEST');
三、案例 - 創建快照信息並導出
案例: 手工創建兩個snapshot,並導入這兩個節點之間的快照
1. 配置AWR配置信息,調整AWR產生snapshot的頻率和保留策略
AWR配置都是通過dbms_workload_repository包進行配置,如將收集間隔時間改為30 分鐘一次,並且保留31天時間(單位都是分鐘):
SQL> exec dbms_workload_repository.modify_snapshot_settings (interval=>30, retention=>31*24*60);
2. 關閉AWR:
把interval設為0則關閉自動捕捉快照:
SQL> exec dbms_workload_repository.modify_snapshot_settings(interval=>0);
3. 手工創建一個快照:
SQL> exec dbms_workload_repository.create_snapshot();
如果數據庫的某些參數或應用程序做了調整,可以手工即時的創建一個快照更有利於數據的統計分析。
4. 查看快照:
SQL> select * from sys.wrh$_active_session_history;
5. 手工刪除指定范圍的快照
SQL> exec dbms_workload_repository.drop_snapshot_range(low_snap_id => 4, high_snap_id => 5, dbid => 1368620684);
6. 生成awr報告($ORACLE_HOME/rdbms/admin):
awrrpt.sql:生成指定快照區間的統計報表;
awrrpti.sql:生成指定數據庫實例,並且指定快照區間的統計報表;
awrsqlrpt.sql:生成指定快照區間,指定SQL語句(實際指定的是該語句的SQLID)的統計報表;
awrsqrpi.sql:生成指定數據庫實例,指定快照區間的指定SQL語句的統計報表;
awrddrpt.sql:指定兩個不同的時間周期,生成這兩個周期的統計對比報表;
四. AWR 報告分析
案例:
4.1 SQL ordered by Elapsed Time
記錄了執行總和時間的TOP SQL(請注意是監控范圍內該SQL的執行時間總和,而不是單次SQL執行時間 Elapsed Time = CPU Time + Wait Time)。
Elapsed Time(S): SQL語句執行用總時長,此排序就是按照這個字段進行的。注意該時間不是單個SQL跑的時間,而是監控范圍內SQL執行次數的總和時間。單位時間為秒。Elapsed Time = CPU Time + Wait Time
CPU Time(s): 為SQL語句執行時CPU占用時間總時長,此時間會小於等於Elapsed Time時間。單位時間為秒。
Executions: SQL語句在監控范圍內的執行次數總計。
Elap per Exec(s): 執行一次SQL的平均時間。單位時間為秒。
% Total DB Time: 為SQL的Elapsed Time時間占數據庫總時間的百分比。
SQL ID: SQL語句的ID編號,點擊之後就能導航到下邊的SQL詳細列表中,點擊IE的返回可以回到當前SQL ID的地方。
SQL Module: 顯示該SQL是用什麼方式連接到數據庫執行的,如果是用SQL*Plus或者PL/SQL鏈接上來的那基本上都是有人在調試程序。一般用前台應用鏈接過來執行的sql該位置為空。
SQL Text: 簡單的sql提示,詳細的需要點擊SQL ID。
4.2 SQL ordered by CPU Time
記錄了執行占CPU時間總和時間最長的TOP SQL(請注意是監控范圍內該SQL的執行占CPU時間總和,而不是單次SQL執行時間)。
4.3 SQL ordered by Gets
記錄了執行占總buffer gets(邏輯IO)的TOP SQL(請注意是監控范圍內該SQL的執行占Gets總和,而不是單次SQL執行所占的Gets)。
4.4 SQL ordered by Reads:
記錄了執行占總磁盤物理讀(物理IO)的TOP SQL(請注意是監控范圍內該SQL的執行占磁盤物理讀總和,而不是單次SQL執行所占的磁盤物理讀)。
4.5 SQL ordered by Executions:
記錄了按照SQL的執行次數排序的TOP SQL。該排序可以看出監控范圍內的SQL執行次數。
4.6 SQL ordered by Parse Calls:
記錄了SQL的軟解析次數的TOP SQL。說到軟解析(soft prase)和硬解析(hard prase),就不能不說一下Oracle對sql的處理過程。
4.7 SQL ordered by Sharable Memory:
記錄了SQL占用library cache的大小的TOP SQL。Sharable Mem (b):占用library cache的大小,單位是byte。
4.8 SQL ordered by Version Count:
記錄了SQL的打開子游標的TOP SQL。
4.9 SQL ordered by Cluster Wait Time:
記錄了集群的等待時間的TOP SQL
********************作者: 鮑新建********************
oracle數據庫管理,簡稱oracle DBA,大多做oracle培訓的都有oracle DBA培訓,專業做oracle數據庫管理培訓的CUUG很有名。
最簡單的方法,awr報表
SQL> @admin\awrrpt.sql
輸入 report_type 的值: <可選html或text,enter默認為html.>
輸入 num_days 的值: 1
輸入 begin_snap 的值: 4965
輸入 end_snap 的值: 4966
輸入 report_name 的值: <輸入要保存的文件名,enter采用默認文件名>
Report written to awrrpt_4965_4966.html
SQL> exit
生成報表後就可以看到了。