提示:數據挖掘是從大型數據集中發現可行信息的過程。數據挖掘使用數學分析來派生存在於數據中的模式和趨勢。通常,由於這些模式的關系過於復雜或涉及數據過多,因此使用傳統數據浏覽無法發現這些模式。 這些模式和趨勢可以被收集在一起並定義為數據挖掘模型。挖掘模型可以應
數據挖掘是從大型數據集中發現可行信息的過程。數據挖掘使用數學分析來派生存在於數據中的模式和趨勢。通常,由於這些模式的關系過於復雜或涉及數據過多,因此使用傳統數據浏覽無法發現這些模式。
這些模式和趨勢可以被收集在一起並定義為“數據挖掘模型”。挖掘模型可以應用於特定的業務方案,例如:
◆ 預測銷售額
◆ 向特定客戶發送郵件
◆ 確定可能需要搭售的產品
◆ 查找客戶將產品放入購物車的順序序列
生成挖掘模型是大型過程的一部分,此過程包括從提出相關數據問題並創建模型以解答這些問題到將模型部署到工作環境的所有事情。此過程可以使用下列六個基本步驟進行定義:
◆ 定義問題
◆ 准備數據
◆ 浏覽數據
◆ 生成模型
◆ 浏覽和驗證模型
◆ 部署和更新模型
以下關系圖說明過程中每個步驟之間的關系,以及 Microsoft SQL Server 2008 中可用於完成每個步驟的技術。