如何定位目標用戶,在任何一個業務單元中都是一個很重要的話題,尤其在預算有限的情況下,如何獲得活動的最大收益,目標用戶的定位都是很重要的手段。
本文將介紹如何通過SQL Server分析服務(SSAS)中的數據挖掘功能根據歷史記錄信息來定位目標用戶。
微軟的SQL Server為數據平台提供了一套完整的解決方案,他不只是一個數據引擎,也提供了很多數據工具和服務,借助其中的分析服務,結合業務系統中的海量歷史數據信息,SQL SERVER就可以幫助我們發現其中的模式和規律,從而對目標數據做預測分析。
在實際中,不同的挖掘模型適用於不同的問題場景,同一個問題模式下可能有多個模型都適合解決這個問題,這樣對於問題的解決來說就多了很多可對比性,從而我們可以根據每個模型預測的准確程度選擇一個最優的模型。
在本文的目標用戶定位的問題上,采用三種挖掘模型進行比較,分別是決策樹,貝葉斯和聚類算法。
本文使用的SQL SERVER版本是2012,示例數據庫是Adventure Works的數據倉庫,關於如何獲取以及部署這個示例數據倉庫,可以參考我的這篇隨筆:
http://www.cnblogs.com/aspnetx/archive/2013/01/30/2883831.html
首先,建立數據挖掘項目,打開SQL DATA TOOLS,也就是Visual Studio 2010的那個Shell。
新建一個多維和數據挖掘的分析服務項目。
項目建立完畢後,新建數據源連接。
選擇部署好的Adventure Works DW連接。