程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> SqlServer數據庫 >> 關於SqlServer >> SQL Server 2008在商務智能上的三個優化

SQL Server 2008在商務智能上的三個優化

編輯:關於SqlServer

  在SQL Server 2008數據庫中,對這商務智能方面的功能做了很大的優化。筆者結合相關的案例來談談這些優化,希望對各位數據庫工程師有所幫助。

  優化一:支持多個挖掘模型的交叉驗證。

  在數據挖掘中有一個基礎兩個核心。基礎就是數據,而核心則是挖掘模型與數據挖掘算法。在商務智能中,只有通過這三方面的共同作用,才能夠得出正確的結果。在以前的版本中,由於采用的挖掘模型不同,最後產生的結果會相差很大,有時候甚至風馬牛不相及。如在SQL Server 數據中,提供了聚類分析模型、決策樹模型、邏輯回歸模型、順序分析和聚類分析模型等等數據挖掘模型。即使這些模型采用的數據與計算方法相同,最後得出的結果很有可能都是不同的。為了提高數據挖掘的准確性,在2008中對此進行了優化。主要是提供了多個數據挖掘模型交叉驗證的方法,來提高結果與決策的准確性。

  多個數據挖掘模型之間的交叉驗證是用於評估數據挖掘模型准確性的常用方法之一。在這交叉驗證中,數據庫工程師可以將挖掘結果分為若干個子集。然後利用這些子集的數據生成對應的子集模型。最後通過衡量每個分區的模型的准確性來判斷某個數據挖掘模型是否准確。通過對最後返回的統計信息的分析,可以判斷這個挖掘模型的可靠程度,或者說用戶所采用的數據挖掘模型是否適用。而且在交叉驗證中,用戶還可以選擇幾個相同結構的模型進行對比,以發現相同結構不同模型之間結果的差異。有時候最終的結果可能沒有多大的價值,但是中間的分析過程或者結果之間的差異往往會給企業帶來意外的收獲。如在實際工作中,可以查找差異的原因,從而找到影響某個結果或者決策的關鍵因素。

  在SQL Server 2008數據庫版本中,用戶可以在兩個地方調用這個交叉驗證。一是在數據挖掘設計器向導中,可以在“挖掘准確性圖表”視圖中調用交叉驗證;二是通過數據分析存儲過程來對挖掘結構分區,調用交叉驗證。最後數據庫可以根據用戶的需要,生成相關的交叉驗證報表。在這個報表中,會反映各種可能性以及對應的均方根誤差。如果采用聚合模型的話,還會有聚合模型的所有度量值的平均偏差和標准偏差等相關的統計信息。

  不過這裡需要注意的是,即使采用再復雜的交叉驗證模型,也不能夠保證最後結構與事實相符。這也是到目前為止商務智能的一個局限性。最後通過數據挖掘所得到的結果,還是要跟用戶的相關工作經驗進行結合進行判斷、甄別決策的准確性。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved