程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> SqlServer數據庫 >> 關於SqlServer >> SQL Server 2005 Data Mining簡介(zt)

SQL Server 2005 Data Mining簡介(zt)

編輯:關於SqlServer

簡介  企業均在嘗試分析其數據時都面臨若干問題。通常,並不缺乏數據。事實上,很多企業感覺到他們被數據淹沒了;他們沒有辦法完全利用所有的數據,將其變成信息。為了處理這方面的問題,開發了數據倉庫技術,以讓企業從異構的數據源獲取大量數據,並將其變成實用信息。
    恰當實現的數據倉庫是具有驚人強大功能的解決方案。公司可以對信息進行分析,並將其加以利用,以進行明智的決策。通過使用數據倉庫,可以為您提供以下問題的答案:
•哪些產品最受 15-20 歲的女性歡迎?
•特定消費者的訂單前置時間和按時交付的百分比與所有消費者的平均值相比如何?
•病房花在每個病人身上的成本和時間是多少?
•在簽約階段停滯時間超過十天的項目所占的百分比為多少?
•如果某個特定的實驗室在某類特定的藥品上投入了較多的資金,臨床試驗結果是否顯示病人健康狀況好於其他實驗室?
除了這些通常可通過使用分析應用程序得出答案的問題之外,數據倉庫還支持各種數據交付格式。分析應用程序設計為供分析人員使用,分析人員會對數據進行細分,研究較低級別的細節。報告應用程序會創建書面報告或聯機報告,這些報告供功能要求略低的用戶使用,提供靜態內容,或提供有限的深入挖掘功能。對於業務決策者而言,計分卡是非常強大的功能,可以提供公司關鍵性能指標的概況,使決策者知道其身處何處。
    盡管數據倉庫強大而適用,但其自身有一個局限:它實質上反映的是過去的情況。由於數據倉庫經常在夜間或按周加載和處理,因此其表示一個時間快照。實時或近似實時的數據倉庫可能實現,且會變得更常見,在最佳的情況下,其數據將仍然表示當前數據和歷史數據。業務決策者和分析人員需要研究此數據,為了發現因果關系,數據倉庫需要進行一定量的分析。
    不是讓人提出假設,然後據此去找相關數據,而是讓數據倉庫確定關系、預測未來時間、發現劣質數據,並允許采用以前從來不可能的方式對數據進行分析,這是不是更為有幫助呢?這可以通過使用數據挖掘而實現。通過使用數據挖掘,可以得出諸如以下這樣的問題的答案:
•客戶將購買什麼產品?哪些產品將一起銷售?
•公司如何預測哪些消費者可能會流失?
•市場狀況如何,將會如何發展?
•企業如何對其網站使用模式進行最佳的分析?
•組織如何確定營銷活動是否成功?
•企業如何防止劣質數據進入系統?
•什麼是分析非結構化數據(如無格式文本)的最好技術?
    Microsoft 在 Microsoft® SQL Server™ 2005 中引入了大量新的數據挖掘功能,允許企業給出這些問題和其他問題的答案。本文將詳細討論數據挖掘可以解決的各種問題,並介紹 SQL Server 2005 處理這些問題的方式。本文中包括對典型數據挖掘問題的概述,並對 SQL Server 2005 中可用於解決這些問題的工具和模型進行了介紹。

數據挖掘的承諾
    數據挖掘承諾將使企業決策者和分析人員更為輕松。除了僅預測未來性能外,數據挖掘將幫助標識數據中可能會被忽略的關系,根據各種環境計算特定產品售出的幾率或特定消費者可能到別處進行購買的幾率,諸如此類。
    Microsoft 數據挖掘工具不僅僅提供傳統數據挖掘功能。以前的數據挖掘功能對數據進行分析,尋找各個元素間以前未知的關系,是典型的“運行後即完成”過程。換句話說,公司運行數據挖掘工具,然後就查看結果。Microsoft 數據挖掘工具不僅僅是完成特定作業的工具,它們還將執行其相關工作,並立即反過來將結果應用到過程中。這意味著數據挖掘模型可能根據特定的標准對消費者進行分組,而分析人員隨後就能立即根據這些新的客戶分組情況細分數據。
    將數據挖掘模型的結果立即提供到分析過程的這個能力表示組織現在可以立即確定如何最佳地對數據進行分析。目前,大部分組織都按照地域對消費者進行劃分,僅包括有限的類似於人口統計的信息,如收入或教育程度等。數據挖掘可能會認為特定的消費者劃分方式比任何地理界定更為有意義,例如,喜歡經典音樂和玩拖拉機游戲的高收入人群可能更喜歡特定的產品,而不會受其教育程度或地域的影響。一旦建立這個消費群後,就可以在分析階段使用其對數據進行分析。使用不甚明顯的分組方式分析數據是數據挖掘的最大好處之一。
    可以使用數據挖掘模型的輸出對數據進行分析,這是一個非常強大的功能,但也可以在集成階段使用這些數據。換句話說,在組織將來自整個企業的數據進行合並的過程中,數據挖掘可以根據其他數據確定數據是否有意義。可以在商業智能項目集成期間發現不規則數據,而這意味著所得到的數據倉庫更為清楚,對其進行分析將會更加准確和有意義。
    數據收集應用程序進一步擴展了數據挖掘,可以應用用於在數據源消除劣質數據的規則。這意味著在數據輸入時,將根據現有數據總體對其進行檢查,以確定其可靠性。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved