程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> SqlServer數據庫 >> 關於SqlServer >> 一次SQLServer2000修復實踐的說明

一次SQLServer2000修復實踐的說明

編輯:關於SqlServer
我所講的一個故事的背景是這樣的,在某一個POS的項目中使用SQL SERVER 2000做前台數據庫,IBM 的DB2做後台數據庫。前台數據庫的環境是這樣的操作系統是Windows 2000 SERVER(10 USERS),數據庫是SQL Server 2000(E)+SP3,Application是POS的收銀系統(是一種實時的交易系統)。硬件的配置是:P4 XRON 2.4G*2,36G HDD*5 做的RAID5 ,1G MEMORY,HP DDS4 磁帶機,數據庫的容量一般保持在5G左右。
  
  因為數據比較的重要,並且數據容量也不大,我們要求的備份策略是每天在磁帶機做POS_DB的全備份(一個星期7天一個循環),在晚上還在硬盤上做全部備份(MASTER,MSDB,POS_DB).這樣保持雙重的保險。
  
  1.故障爆發:
  2003-12-26 13:00
  
  客戶報告所有的POS死機和SERVER運行速度非常的慢。經過重新啟動服務器(啟動到檢查RAID卡時開始報警)我們發現在WINDEOWS 2000 SERVER的“系統日志”中有這樣的信息:
  
  Error: 823, Severity: 24, State: 2
  I/O error (torn page) detected during read at offset 0x0000001bf96000 in file D :DATAPOS_DB.mdf'.
  SQLSERVER的“錯誤日志”中有這樣的信息:
  2003-12-10 03:34:22.23 spid56 Error: 823, Severity: 24, State: 2
  2003-12-10 03:34:22.23 spid56 I/O error (torn page) detected during read at offset 0x00000074964000 in file 'D:DATAPOS_DB.mdf'..
  
  來自msdn的解釋:
  I/O logical check failure: If a read Windows API call or a write Windows API call for a database file is successful, but specific logical checks on the data are not successful (a torn page, for example), an 823 error is raised. The following error message is an example of an 823 error for an I/O logical check failure:
  2003-09-05 16:51:18.90 spid17 Error: 823, Severity: 24, State: 2
  2003-09-05 16:51:18.90 spid17 I/O error (torn page) detected during read at offset 0x00000094004000 in file 'F:SQLDatamydb.MDF'..
  To resolve this problem, first run the DBCC CHECKDB statement on the database that is associated with the file in the error message. If the DBCC CHECKDB statement reports errors, correct those errors before you troubleshoot this problem. If the problem persists even after the DBCC CHECKDB errors have been corrected, or if the DBCC CHECKDB statement does not report any errors, revIEw the Microsoft Windows NT system event log for any system errors or disk-related errors. You can also contact your hardware vendor to run any appropriate diagnostics.
  
  I/O邏輯檢查失敗:如果有一個Windows程序在讀取和寫數據庫文件時是成功的,但是在詳細的數據邏輯檢查時沒有成功(比如:不完整的頁),SQLSERVER會返回MSG 823的錯誤。下面就是一個I/O邏輯檢查失敗MSG 823的實例:
  
  2003-09-05 16:51:18.90 spid17 Error: 823, Severity: 24,

State: 2
  2003-09-05 16:51:18.90 spid17 I/O error (torn page) detected during read at offset 0x00000094004000 in file 'F:SQLDatamydb.MDF'..
  
  要解決這樣的問題,首先要在該數據庫中執行DBCC CHECKDB(錯誤信息提示的數據庫文件)。如果DBCC CHECKDB報錯,在你修復錯誤之前糾正這些錯誤。如果這些錯誤信息一直保留到執行DBCC CHECKDB運行之後,或者DBCC CHECKDB沒有報告任何錯誤,檢查Windows NT系統的的事件查看器的和系統錯誤或磁盤錯誤相關的信息。你也可以聯系硬件廠商運行正確的診斷工具。
  
  壞了,數據庫文件有問題,在檢查OS的事件查看器,我們發現在一個星期之前就有錯誤信息(只是OFFSET的偏移地址不同)。
  
  趕緊檢查HDD,果然發現在RAID5的第一快HDD亮了紅燈(灰塵太多,很難於看清)
  
  執行 DBCC CHECKDB('POS_DB')檢查發現:
  
  Server: Msg 8909, Level 16, State 1, Line 1
  Table error: Object ID 26342838, index ID 35207, page ID (1:50978). The PageId in the page header =(32230:-2048732002).
  
  Server: Msg 8939, Level 16, State 1, Line 1
  Table error: Object ID 859150106, index ID 255, page (1:238770). Test (IS_ON (BUF_IOERR, bp->bstat) && bp->berrcode) failed. Values are 2057 and -1.
  
  Server: Msg 8928, Level 16, State 1, Line 1
  Object ID 861246123, index ID 0: Page (1:57291) could not be processed. See other errors for details.
  
  Server: Msg 2511, Level 16, State 1, Line 1
  Table error: Object ID 862626116, Index ID 0. Keys out of order on page (1:269310), slots 0 and 1.啊哈,果然有很多的表都有錯誤關聯(請記錄每一個錯誤表的OBJECT ID)。
  
  從MSDN查到:
  錯誤號Msg 823:表示SQLSERVER在讀取數據和寫數據時檢測到硬件設備有問題或者系統有問題。
  
  TORN PAGE:的意思是不完整的頁
  
  0x0000001bf96000:這是從數據文件開始處到TORN PAGE 的字節數。
  
  錯誤號Msg 8939 :大家可以看看:http://support.microsoft.com/default.ASPx?kbid=320434
  FIX:在運行 CHECKDB 時,具有 TABLOCK 提示的大容量插入(bulk insert, bcp 等)可能導致錯誤 8929 和 8965。
  
  錯誤號MSG 8928:是和8939相關聯的信息,
  
  錯誤號M


您正在看的SQLserver教程是:一次SQLServer2000修復實踐的說明。SG 8965:是和8939相關聯的信息,
  
  大家可以到下面的地址找到相關的信息:
  
  http://support.microsoft.com/default.ASPx?scid=kb;en-us;826433
  PRB: Additional SQL Server Diagnostics Added to Detect Unreported I/O Problems
  http://support.microsoft.com/default.ASPx?scid=kb;en-us;828339
  PRB: Error message 823 may indicate hardware problems or system problems
  http://support.microsoft.com/default.ASPx?scid=kb;en-us;308795
  FIX: CheckDB May Not Fix Error 8909 or Error 8905
  
  故障確診:RAID有一塊HDD壞,

造成數據庫文件破壞
  
  2.更換HDD
  2003-12-28 23:00
  
  現在就體現了RAID5的好處,壞了一塊HDD,系統可以照常運行,不過系統的日志和SQLSERVER的日志還是有MSG823的報錯信息。
  
  按照RAID 卡的REBUILD的步驟將新的HDD綁定到原始的RAID5中,順利完成。
  
  用DBCC檢查數據庫的完整性
  
  DBCC CHECKDB('POS_DB') WITH ALL_ERRORMSGS
  
  發現還是有和更換HDD之前一樣的ERROR信息,看來數據庫文件還是有問題。
  
  --有一個奇怪問題1,既然是5塊HDD的RAID5,為何有一塊HDD壞會影響數據庫文件的損壞,不解?
  
  3.恢復數據庫
  2003-12-29 00:30
  
  沒有辦法,用備份的數據集恢復數據庫(看來備份是多麼的重要)
  
  USE MASTER
  GO
  RESTORE DATABASE POS_DB FROM DISK='D:DATABASEBACKUPPOS_DB_BACKUP.DAT'
  
  重新啟動MS SQL SERCVER服務。
  
  NET STOP MSSQLSERVER / NET START MSSQLSERVER
  
  用DBCC檢查數據庫的完整性
  
  DBCC CHECKDB('POS_DB') WITH ALL_ERRORMSGS
  
  和恢復之前的錯誤信息一致,沒有改變。
  
  --奇怪問題之2,SQLSERVER BACKUP 之前並不驗證數據庫的完整性,數據庫的全備份竟然是有問題的。氣憤!!
  
  看來只能通過工具修復數據庫了(--在修改之前記錄錯誤表的記錄數,以便修復數據庫後進行比較)。
  
  在查詢分析器中運行:
  ALTER DATABASE POS_DB SET SINGL_USER
  GO
  DBCC CHECKDB('POS_DB',repair_allow_data_loss) WITH TABLOCK
  GO
  ALTER DATABASE POS_DB SET MULTI_USER
  GO
  
  CHECKDB 有3個參數:
  
  REPAIR_ALLOW_DATA_LOSS
  
  執行由 REPAIR_REBUILD 完成的所有修復,包括對行和頁進行分配和取消分配以改正分配錯誤、結構行或頁的錯誤,以及刪除已損壞的文本對象。這些修復可能會導致一些數據丟失。修復操作可以在用戶事務下完成以允許用戶回滾所做的更改。如果回滾修復,則數據庫仍會含有錯誤,應該從備份進行恢復。如果由於所提供修復等級的緣故遺漏某個錯誤的修復,則將遺漏任何取決於該修復的修復。修復完成後,備份數據庫。
  
  REPAIR_FAST 進行小的、不耗時的修復操作,如修復非聚集索引中的附加鍵。這些修復可以很快完成,並且不會有丟失數據的危險。
  
  REPAIR_REBUILD 執行由 REPAIR_FAST 完成的所有修復,包括需要較長時間的修復(如重建索引)。執行這些修復時不會有丟失數據的危險。
  
  第一次運行,我們會發現:
  DBCC results for 'TABLE_NAME'.
  There are 1 rows in 1 pages for object 'TABLE_NAME'.
  The error has been repaired.
  CHECKDB found 0 allocation errors and 1 consistency errors in table '(Object ID 26342838)' (object ID 26342838).
  CHECKDB fixed 0 allocation errors and 1 consistency errors in table '(Object ID 26342838)' (object ID 26342838).
  
  這樣的信息有很多,並

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved