這節我們主要講講我的游戲交易數據分析項目的ETL(數據抽取、加載、轉換)具體是怎麼做的。
先來講下源系統吧,因為我們的交易主站的服務器不是架在公司的,因此不能直接從源系統直接抽取 數據了。事實上我們已經存在一個簡單的數據分析系統了,只不過這個是以前人家做的,沒有采用 sqlserver2005的BI平台來做,而是直接寫winform程序來弄的。原來的數據抽取是主站那邊提供導出的 excel文件過來,然後到我們這邊,導入到我們的分析庫中去。
好了,為了簡便,事實上我只是在做一個demo,為以後項目做准備,所以我們抽取數據直接是從上面 說的已經存在分析庫中抽的,因為數據結構比較相近,所以ETL過程還是比較簡單的。
先看看游戲維度表吧:
首先,我們來新建一個Integration Services項目。
接著,新建一個ImportDimGamePackage.dtsx的SSIS包。
拖放一個數據流任務到控制流面板上(如圖)
雙擊數據流任務,來到數據流面板
接著我們拖動OLEDB源到數據流面板上,並且雙擊編輯它,新建一個連接和選擇要抽取數據的源數據 表。