程式師世界 >> 數據庫知識 >> SqlServer數據庫 >> 關於SqlServer >> 印象很深的一次SQL Server調優經歷

印象很深的一次SQL Server調優經歷

編輯：關於SqlServer

前段時間數據庫健康檢查發現SQL Server服務器的idle時間變少，IO還是比較空閒，估計是遇到了高CPU占用的語句了。

介紹一下背景，我們公司負責運維N多的應有系統，負責提供良好的軟、硬件環境，至於應用的開發質量，我們就無能為力了

解決這個問題，我的思路是：

找出CPU占用最大的語句。
分析查詢計劃。
優化。

1、找出語句

使用SQL Server自帶的性能報表（不是報表服務），找出CPU占用最大的語句。如圖1所示

圖1 性能報表

我選取了“性能-按總CPU時間排在前面的查詢”，得出以下兩張報表，如圖2所示：

圖2 性能-按總CPU時間排在前面的查詢

在報表中不能直接把語句Copy出來，非得讓我另存為Excel才能Copy語句；而且經常標示不了是語句屬於哪個數據庫，不爽 :( 。

費了我九牛二虎之力才找出該條語句在哪個數據庫執行，然後馬上備份數據庫，在另一個非生產數據庫上面還原，創造實驗環境。

廢話少說，我把語句Copy出來，順便整理了一下格式。如下：

select *
from network_listen
where
node_code in
    (

     select distinct node_code
     from vIEw_Log_Network_circsByUnit
     where status='1'
    )
or
node_code=
    (
     select top 1 nodeCode
     from TransmissionUnit_LocalInfo
    )
and
node_code<>
    (
     select parentNodeCode
     from TransmissionUnit_RouterInfo
     where nodeCode=
            (
             select top 1 nodeCode
             from TransmissionUnit_LocalInfo
            )
    )

2、分析語句

執行計劃如下：

圖太大了，將就著看吧 :( .

圖3 查詢計劃全圖

圖4 查詢計劃1

圖5 查詢計劃2

圖6 查詢計劃3

從整個查詢計劃來看，主要開銷都花在了圖5的那個部分——兩個“聚集索引掃描”。

查看一下這兩個數“聚集索引掃描”，搞什麼飛機呢？

奇怪了，查詢語句裡面沒有Log_Nwtwork_circs 這個表啊，再仔細分析一下這個執行計劃，嫌疑最大的就是vIEw_Log_Network_circsByUnit這個視圖了。

查看一下這個試圖的定義：

CREATE VIEW [dbo].[vIEw_Log_Network_circsByUnit]
AS
SELECT B.*
FROM (
    SELECT node_code, MAX(end_time) AS end_time
        FROM Log_Network_circs
        GROUP BY node_code
     ) A
LEFT OUTER JOIN
      dbo.Log_Network_circs B
ON
    A.node_code = B.node_code
    AND
          A.end_time = B.end_time

看著有點暈是吧，那麼看看下圖

3、優化
SQL寫得好不好，咱不說，反正我是不能改SQL的，而且應該可以判斷出整個查詢最耗時的地方就是用在搞這張試圖了。

那就只能針對這個試圖調優啦。仔細觀察這個試圖，實際上就涉及到一個表 Log_Network_circs，下面是該表的表結構：

CREATE TABLE [dbo].[Log_Network_circs](
    [log_id] [varchar](30) NOT NULL,
    [node_code] [varchar](100) NULL,
    [node_name] [varchar](100) NULL,
    [server_name] [varchar](100) NULL,
    [start_time] [datetime] NULL,
    [end_time] [datetime] NULL,
    [status] [varchar](30) NULL,
CONSTRAINT [PK_LOG_NETWORK_CIRCS] PRIMARY KEY CLUSTERED
(
    [log_id] ASC
)WITH (PAD_INDEX  = OFF, STATISTICS_NORECOMPUTE  = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS  = ON, ALLOW_PAGE_LOCKS  = ON) ON [PRIMARY]
) ON [PRIMARY]

數據量有489957條記錄，不算太大。

根據 3、經常與其他表進行連接的表，在連接字段上應該建立索引；

感覺上得在 node_code 和 end_time 這兩字段上建立一個復合索引，大概定義如下：

CREATE INDEX [idx__Log_Network]
ON Log_Network_circs
(
node_code ASC,
end_time ASC
)

保險起見，我把需要調優的語句copy到一個文件裡，然後打開“數據庫引擎優化顧問”，設置好數據庫，得出以下調優結果：

CREATE STATISTICS [_dta_stat_559341057_6_2] ON [dbo].[Log_Network_circs]([end_time], [node_code])

CREATE NONCLUSTERED INDEX [_dta_index_Log_Network_circs_24_559341057__K2_K6] ON [dbo].[Log_Network_circs]
(
[node_code] ASC,
[end_time] ASC
)WITH (SORT_IN_TEMPDB = OFF, IGNORE_DUP_KEY = OFF, DROP_EXISTING = OFF, ONLINE = OFF) ON [PRIMARY]

嗯，結果差不多，具體參數再說。

按照“數據庫引擎優化顧問”給出的建議，建立 STATISTICS 和 INDEX 。

再看看優化後的執行計劃

明顯查詢 vIEw_Log_Network_circsByUnit 這個視圖的執行計劃不一樣了。

不看廣告，看療效，使用統計功能。執行以下語句：

SET STATISTICS IO on;
SET STATISTICS TIME on;

(2 行受影響)
表 'Log_Network_circs'。掃描計數 2，邏輯讀取 13558 次，物理讀取 0 次，預讀 0 次，lob 邏輯讀取 0 次，lob 物理讀取 0 次，lob 預讀 0 次。
表 'TransmissionUnit_RouterInfo'。掃描計數 0，邏輯讀取 2 次，物理讀取 0 次，預讀 0 次，lob 邏輯讀取 0 次，lob 物理讀取 0 次，lob 預讀 0 次。
表 'TransmissionUnit_LocalInfo'。掃描計數 3，邏輯讀取 6 次，物理讀取 0 次，預讀 0 次，lob 邏輯讀取 0 次，lob 物理讀取 0 次，lob 預讀 0 次。
表 'network_listen'。掃描計數 1，邏輯讀取 2 次，物理讀取 0 次，預讀 0 次，lob 邏輯讀取 0 次，lob 物理讀取 0 次，lob 預讀 0 次。

SQL Server 執行