前段時間數據庫健康檢查發現SQL Server服務器的idle時間變少,IO還是比較空閒,估計是遇到了高CPU占用的語句了。
介紹一下背景,我們公司負責運維N多的應有系統,負責提供良好的軟、硬件環境,至於應用的開發質量,我們就無能為力了
解決這個問題,我的思路是:
- 找出CPU占用最大的語句。
- 分析查詢計劃。
- 優化。
1、找出語句
使用SQL Server自帶的性能報表(不是報表服務),找出CPU占用最大的語句。如圖1所示
圖1 性能報表
我選取了“性能-按總CPU時間排在前面的查詢”,得出以下兩張報表,如圖2所示:
圖2 性能-按總CPU時間排在前面的查詢
在報表中不能直接把語句Copy出來,非得讓我另存為Excel才能Copy語句;而且經常標示不了是語句屬於哪個數據庫,不爽 :( 。
費了我九牛二虎之力才找出該條語句在哪個數據庫執行,然後馬上備份數據庫,在另一個非生產數據庫上面還原,創造實驗環境。
廢話少說,我把語句Copy出來,順便整理了一下格式。如下:
select *
from network_listen
where
node_code in
(
select distinct node_code
from vIEw_Log_Network_circsByUnit
where status='1'
)
or
node_code=
(
select top 1 nodeCode
from TransmissionUnit_LocalInfo
)
and
node_code<>
(
select parentNodeCode
from TransmissionUnit_RouterInfo
where nodeCode=
(
select top 1 nodeCode
from TransmissionUnit_LocalInfo
)
)
2、分析語句
執行計劃如下:
圖太大了,將就著看吧 :( .
圖3 查詢計劃全圖
圖4 查詢計劃1
圖5 查詢計劃2
圖6 查詢計劃3
從整個查詢計劃來看,主要開銷都花在了圖5的那個部分——兩個“聚集索引掃描”。
查看一下這兩個數“聚集索引掃描”,搞什麼飛機呢?
奇怪了,查詢語句裡面沒有Log_Nwtwork_circs 這個表啊,再仔細分析一下這個執行計劃,嫌疑最大的就是vIEw_Log_Network_circsByUnit這個視圖了。
查看一下這個試圖的定義:
CREATE VIEW [dbo].[vIEw_Log_Network_circsByUnit]
AS
SELECT B.*
FROM (
SELECT node_code, MAX(end_time) AS end_time
FROM Log_Network_circs
GROUP BY node_code
) A
LEFT OUTER JOIN
dbo.Log_Network_circs B
ON
A.node_code = B.node_code
AND
A.end_time = B.end_time
看著有點暈是吧,那麼看看下圖
3、優化
SQL寫得好不好,咱不說,反正我是不能改SQL的,而且應該可以判斷出整個查詢最耗時的地方就是用在搞這張試圖了。
那就只能針對這個試圖調優啦。仔細觀察這個試圖,實際上就涉及到一個表 Log_Network_circs,下面是該表的表結構:
CREATE TABLE [dbo].[Log_Network_circs](
[log_id] [varchar](30) NOT NULL,
[node_code] [varchar](100) NULL,
[node_name] [varchar](100) NULL,
[server_name] [varchar](100) NULL,
[start_time] [datetime] NULL,
[end_time] [datetime] NULL,
[status] [varchar](30) NULL,
CONSTRAINT [PK_LOG_NETWORK_CIRCS] PRIMARY KEY CLUSTERED
(
[log_id] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
) ON [PRIMARY]
數據量有489957條記錄,不算太大。
根據 3、經常與其他表進行連接的表,在連接字段上應該建立索引;
感覺上得在 node_code 和 end_time 這兩字段上建立一個復合索引,大概定義如下:
CREATE INDEX [idx__Log_Network]
ON Log_Network_circs
(
node_code ASC,
end_time ASC
)
保險起見,我把需要調優的語句copy到一個文件裡,然後打開“數據庫引擎優化顧問”,設置好數據庫,得出以下調優結果:
CREATE STATISTICS [_dta_stat_559341057_6_2] ON [dbo].[Log_Network_circs]([end_time], [node_code])
CREATE NONCLUSTERED INDEX [_dta_index_Log_Network_circs_24_559341057__K2_K6] ON [dbo].[Log_Network_circs]
(
[node_code] ASC,
[end_time] ASC
)WITH (SORT_IN_TEMPDB = OFF, IGNORE_DUP_KEY = OFF, DROP_EXISTING = OFF, ONLINE = OFF) ON [PRIMARY]
嗯,結果差不多,具體參數再說。
按照“數據庫引擎優化顧問”給出的建議,建立 STATISTICS 和 INDEX 。
再看看優化後的執行計劃
明顯查詢 vIEw_Log_Network_circsByUnit 這個視圖的執行計劃不一樣了。
不看廣告,看療效,使用統計功能。執行以下語句:
SET STATISTICS IO on;
SET STATISTICS TIME on;
(2 行受影響)
表 'Log_Network_circs'。掃描計數 2,邏輯讀取 13558 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
表 'TransmissionUnit_RouterInfo'。掃描計數 0,邏輯讀取 2 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
表 'TransmissionUnit_LocalInfo'。掃描計數 3,邏輯讀取 6 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
表 'network_listen'。掃描計數 1,邏輯讀取 2 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
SQL Server 執行