程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> SqlServer數據庫 >> 關於SqlServer >> 數據庫的數據挖掘概述(二)

數據庫的數據挖掘概述(二)

編輯:關於SqlServer
 數據挖掘工具是怎樣准確地告訴你那些隱藏在數據庫深處的重要信息的呢?它們又是如何作出預測的?答案就是建模。建模實際上就是在你知道結果的情況下建立起一種模型,並且把這種模型應用到你所不知道的那種情況中。比如說,如果你想要在大海上去尋找一艘古老的西班牙沉船,也許你首先想到的就是去找找過去發現這些寶藏的時間和地點有哪些。那麼,經過調查你發現這些沉船大部分都是在百慕大海區被發現,並且那個海區有著某種特征的洋流,以及那個時代的航線也有一定的特征可尋。在這眾多的類似特征中,你將它們抽象並概括為一個普適的模型。利用這個模型,你就很有希望在具有大量相同特征的另外一個地點發現一件不為人知的寶藏。

當然,在數據挖掘技術甚至計算機出現以前,這種建模抽象的方法就已經廣泛地被人們所使用。在計算機中的建模和以前的建模方法並無很大不同,主要的差異在於計算機能處理的信息量比起以前來更加龐大。計算機中能夠存儲已知了結果的大量不同情況,然後由數據挖掘工具從這些大量的信息裡面披沙揀金,將能夠產生模型的信息提取出來。一當模型建立好了之後,就可以應用在那些情形相似但結果尚未知的判斷中了。比如,現在假設你是一個電信公司的營銷主任,公司想發展一些新的長途電話用戶,那麼你是不是會漫無目的地到街上去散發廣告呢?——就象漫無目的地在海上去尋寶一樣。其實,比起漫無目的地去進行宣傳來,利用你以前的商業經驗來有目的地去拉攏客戶會產生高得多的效率。

作為一個營銷主任,你對客戶的很多信息都可以了解得一清二楚:年齡、性別、信用記錄以及長途電話使用狀況。從好的一方面來看,掌握了這些客戶的信息其實就是掌握了很多潛在的用戶的同樣的信息。問題在於你還不一定了解他們的長途電話使用情況(因為他們的長途電話也許是通過的另一個電信公司)。現在你的主要精力就集中在用戶中誰有比較多的長途電話上。通過下面這個表格,我們可以從數據庫裡面抽象某些變量,建立起一個可以對此進行分類營銷的模型。
  客戶 潛力
一般信息
(e.g. demographic data) 已知 已知
私有信息
(e.g. customer transactions) 已知 待定

表二、數據挖掘應用於分類營銷

根據我們創建的從一般信息到私有信息的計算模型,我們可以得出表二右下方表格中的信息。比如,一個電信公司的簡化模型可以是:年薪6萬美圓以上的98%的客戶,每個月長話費80美圓以上。根據這個模型,我們就能應用這些數據來推斷出公司現在尚不能明確的私有信息,這樣,新客戶群體就可以大體確定出來了。小型市場的試銷數據對於這樣的模型來說顯得極為有用。因為小范圍內試銷數據的挖掘,能夠為全部市場的分類銷售打下一個良好的基礎。表三則描述了另外一樣數據挖掘的普遍應用:預測。
  過去 現在 將來
靜態信息和當前計劃 已知 已知 已知
動態信息 已知 已知 待定

表三、數據挖掘應用於預測

數據挖掘的體系結構

現有很多數據挖掘工具是獨立於數據倉庫以外的,它們需要獨立地輸入輸出數據,以及進行相對獨立的數據分析。為了最大限度地發揮數據挖掘工具的潛力,它們必須象很多商業分析軟件一樣,緊密地和數據倉庫集成起來。這樣,在人們對參數和分析深度進行變化的時候,高集成度就能大大地簡化數據挖掘過程。下圖顯示了一個大型數據庫中的高級分析過程。




集成後的數據挖掘體系

應用數據挖掘技術,較為理想的起點就是從一個數據倉庫開始,這個數據倉庫裡面應保存著所有客戶的合同信息,並且還應有相應的市場競爭對手的相關數據。這樣的數據庫可以是各種市場上的數據庫:Sybase、Oracle、Redbrick、和其他等等,並且可以針對其中的數據進行速度上和靈活性上的優化。

聯機分析系統OLAP服務器可以使一個十分復雜的最終用戶商業模型應用於數據倉庫中。數據庫的多維結構可以讓用戶從不同角度,——比如產品分類,地域分類,或者其他關鍵角度——來分析和觀察他們的生意運營狀況。數據挖掘服務器在這種情況下必須和聯機分析服務器,以及數據倉庫緊密地集成起來,這樣就可以直接跟蹤數據和並輔助用戶快速作出商業決策,並且用戶還可以在更新數據的時候不斷發現更好的行為模式,並將其運用於未來的決策當中。

數據挖掘系統的出現代表著常規決策支持系統的基礎結構的轉變。不象查詢和報表語言僅僅是將數據查詢結果反饋給最終用戶那樣,數據挖掘高級分析服務器把用戶的商業模型直接應用於其數據倉庫之上,並且反饋給用戶一個相關信息的分析結果。這個結果是一個經過分析和抽象的動態視圖層,通常會根據用戶的不同需求而變化。基於這個視圖,各種報表工具和可視化工具就可以將分析結果展現在用戶面前,以幫助用戶計劃將采取怎樣的行動。
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved