項目背景
寧夏電信作為寧夏目前最大的電信運行商,需要與寧 夏移動、寧夏網通、寧夏聯通、寧夏鐵通等運營商進行激 烈的市場競爭,這勢必對寧夏電信工作內容、工作方式、經營管理以及客戶服務提升提出嚴峻的挑戰。
在寧夏電信目前經營過程中,已經出現了客戶大量流 失和業務收入不明原因下降的現象。寧夏電信的管理層和 決策層,在現有業務系統提供的條件下,更多的只能是通 過相關的報表看到這些現象發生的結果,然後再根據相關 的數據,從一定程度上找到部分現象產生的原因,再采取 相應的措施。但這些行為都是事後的一些補救行為,對於 這些現象的發生並不能有一個事先的預知,以至於無法及 時采取相應的預防措施。同時,現有業務系統的數據處理 速度和響應時間較慢,不能保證管理層和決策層能及時地得到結果。
根據調查機構的數據顯示,“用戶保持率”增加 5%, 就有望為運營商帶來 85% 的利潤增長;並且,發展一個新客戶比保持一個老客戶的費用要高 7 倍,由此可見用戶流失或話務量流失都將對運營商的經營產生深遠的影響。通過建立客戶級的數據倉庫,應用數據挖掘技術,可以研究流失客戶的客戶特征、對流失進行預測、並對流失的後果進行評估。客戶流失分析是以客戶的歷史通話行為數據、客戶的基礎信息、客戶擁有的產品信息為基礎,通過適當的數據挖掘手段,綜合考慮流失的特點和與之相關的多種因素,從中發現與流失密切相關的特征,在此基礎上建立可以在一定時間范圍內預測用戶流失傾向的預測模型,為相關業務部門提供有流失傾向的用戶名單和這些用戶的行為特征,以便相關部門制定恰當的營銷策略,采取針對性措施,開展客戶挽留工作。
如何進行客戶流失分析?
面對海量的業務數據,如何處理寧夏電信所關心的客 戶流失問題,是寧夏電信在目前的生產過程中急需解決的 問題。為了避免由客戶流失造成的損失,必須找出那些有流失危險和最有價值的客戶,並相應開展保留和獲取客戶的活動。對於客戶流失的現象,我們可以分為以下情況:
1.公司內客戶轉移:在電信企業表現為客戶轉移至本電信公司的不同網絡或不同業務。例如,電信公司增加新業務,或者資費調整引發的業務轉移,例如從普通的固定電話轉至 IP 電話。這種情況下,雖然就某個業務單獨統計來看存在客戶流失,但對公司整體而言客戶沒有流失。當然公司內客戶轉移也會影響公司的收入。
2. 客戶被動流失:表現為電信運營商由於客戶欺詐或惡意欠費等行為而主動終止客戶使用網絡和業務。這是由於電信運營商在客戶開發的過程中忽視了客戶質量造成的。
3. 客戶主動流失分為兩種情況:一種是客戶不再使用任何一家電信運營商的電信業務;另一種是客戶選擇了另一家運營商,即所謂的“客戶跳網”,這一種情況的原因則是客戶認為公司不能提供他所期待的價值,即公司為客戶提供的服務價值低於另一家電信運營商。這可能是客戶對電信公司的業務和服務不滿意,也可能是客戶僅僅想嘗試一下別家公司提供而本公司未提供的新業務。這種客戶流失形式往往是研究的主要內容。
通過數據挖掘技術,可以研究客戶流失中客戶特征分析、流失預測、流失後果評估等問題。研究電信客戶流失的時候會考慮到以下的一些問題:
1.現有的客戶哪些客戶即將流失?
2.現有客戶他們的流失概率如何?
3.哪些因素造成了客戶的流失?
4.客戶流失對客戶自身會造成什麼影響?
5.客戶流失對電信公司的影響如何?
6.不同類別之間客戶的流失情況有什麼差別?
7.如果某個客戶將要流失,他會在多長時間內流失?以上的問題可以通過設計合適的數據挖掘流程來解決。研究哪些客戶即將流失時,將其定位為一個分類問題,即將現有客戶分為流失和不流失兩類。選擇適量的歷史上流失客戶和未流失客戶的屬性數據組成訓練數據集,利用神經網絡、決策樹、logistic 回歸等分類建立客戶流失的分類模型。同時會給出分類結果的概率值,這個值可以看作是客戶的流失概率。用建立的分類模型預測可以對現有用戶進行流失預測,並給出流失概率。
同時,激烈的競爭使市場上產品的更新換代周期越來 越短,技術的發展也使得市場上可替代產品的出現越來越 快,因此,面對客戶越來越個性化、多樣化的消費需求,寧夏電信需要提供更加豐富的產品和服務來滿足客戶的需求。市場策略應對速度是保持競爭力的重要手段,而市場應對策略的制定需要真實、及時、准確的市場經營信息的支持。
寧夏電信數據挖掘項目建設思路
首先,需要確定項目建設的路線和方針。這方面寧夏電信有著一整套的思路,為了有效地應對將來劇烈的市場變化,數據的集中是很關鍵的,集中的數據提供全省業務整體的視圖,是全局決策的基礎,因此“寧夏電信數據挖掘項目”同樣也按全省集中模式進行建設。省集中模式是指“一級平台,兩級應用”。“一級平台”即在省一級建立統一的軟硬件平台,對全省的業務的數據進行集中統一管理;“兩級應用”即對系統應用而言,建立省中心和各地分公司兩級應用模式。各地分公司的用戶,通過內部辦公網,按其權限,對自己分公司的相關客戶信息進行分析和提取。由於數據挖掘的分析主題眾多,因此“寧夏電信數據挖掘項目”應遵循總體規劃,分步實施,循序漸進展開的項目建設原則。本項目計劃分兩期進行實施,第一期主要是建立數據集市系統,為數據挖掘應用奠定數據基礎,同時構建數據挖掘平台,以解決客戶流失問題為目標,積累數據挖掘的經驗。項目第二期將把數據挖掘向更廣泛的領域全面展開,如客戶分群、交叉銷售、針對性營銷等等。
其次,需要確定采用的技術路線。寧夏電信在對諸多數據倉庫產品進行考察之後,考慮到Sybase產品的先進技術特性和在數據倉庫行業的豐富經驗,如: 廣東電信運營分析系統、大鵬證券數據倉庫項目、全國鐵路客票系統、招商銀行數據倉庫項目、興業證券數據倉庫系統、四川移動數據業務營銷支持系統等,最終選擇了Sybase提供的整體完整的解決方案。
Sybase解決方案
系統體系結構
通過對“寧夏電信數據挖掘系統”的需求分析,Sybase 建議采用集中式數據倉庫建立的方式。數據倉庫系統主要從計費系統、渠道系統和 10000 號系統提取數據,經過整理轉換後,供數據挖掘和分析系統使用。
數據倉庫的實施是一個相當復雜的過程,主要數據倉庫的設計建模、數據轉換與集成、數據存儲與管理、數據倉庫的維護和管理。Sybase 提供了覆蓋整個數據倉庫建立周期的完整解決方案和產品集,下圖為 Sybase 為寧夏電信數局挖掘項目建議的完整系統體系結構。
產品清單
在一期項目中,使用了 Sybase 整體解決方案中的部分產品:
◆Sybase IQ數據倉庫服務器
◆Clementine數據挖掘工具
◆SPSS數據分析工具
方案特點
1.保證系統高效、穩定、可靠運轉:
Sybase 公司作為數據庫和數據倉庫的軟件提供廠家,一直將系統的高效,穩定和可靠性作為最主要的任務。
數據的存儲要保證數據的安全性、完整性、一致性,同時還要具有復雜的分析查詢的高效性。Sybase的數據倉庫服務器 Sybase IQ 是一個關系型數據庫,為高性能決策支持和數據倉庫的建立而進行了優化。IQ中的關鍵技術是數據按列存儲、Bit-Wise 查詢索引、數據壓縮和 Multiplex 技術。這些先進的技術使基於 Sybase IQ 構建的應用系統擁有卓越的查詢性能與最低的總擁有成本。
2.維護方便, 操作便捷:
本系統用戶界面友好、美觀實用,是中文圖形用戶界 面,方便簡單、易於操作並包含必要的系統連機幫助。系統具有參數維護、維表維護功能,可以實現自身的維護管理。
同時,Clementine 提供了一個可視化的快速建立模型的環境,被譽為業界第一的數據挖掘工具。使用它,企業可以將數據分析和建模技術與特定的商業問題結合起來,找出其他傳統數據挖掘工具可能找不出的答案。
Clementine 使用一些有效、易用的按鈕組件,用戶只需用鼠標將這些組件連接起來建立一個“數據流”。可視化的界面使得數據挖掘更加直觀交互,從而可以將用戶的商業知識在每一步中更好的利用。
Clementine 為結果展示提供了豐富的圖形,包括直方圖、分布圖、條形圖、線型圖、點圖、網狀圖等,用戶可以將結果轉換成 3D 圖形,對數據從多方位進行理解。同時,Clementine 還提供了數據挖掘結果評估圖形。
3.靈活的分析建模:
Sybase 公司非常熟悉中國電信的電信業務,充分考慮了寧夏電信數據模型的復雜性,可以靈活滿足各種分析型業務的需求,可以進行適合用戶需求的主題域劃分和合理的數據分割與粒度定義,以及對不同粒度數據的合理存儲周期。在設計數據倉庫基礎數據模型時,更充分體現寧夏電信企業內部業務規則以及數據之間的關系,使分析使用更具有靈活性。
SPSS Clementine提供的主要建模技術包括,⑴數據庫建模技術;⑵預測和分類技術,如神經網絡模型,包括 BP 神經網絡、RBFN 神經網絡和 Kohonen 神經網絡等,決策樹技術包括,C5.0、CHAID、exhaustive CHAID、QUEST 和 C&RT 等,線性回歸和 Logistic 回歸等;⑶自動識別異常記錄技術;⑷聚類技術,如 Kohonen 聚類、K-means 聚類和 TwoStep 聚類等;⑸關聯技術,如 GRI、Apriori、Sequence 和 CARMA 算法等;⑹數據簡約技術,如因子分析和主成分分析等;⑺組合模型技術;⑻輸入 PMML 生產模型技術;⑼利用 Clementine 的 CEMI 技術擴充算法。
4.具有良好的開放性和擴展性:
系統采用開放的體系設計和基礎軟件平台,整體考慮 了從系統結構、功能設計、數據容量、直到軟平台的開放 性和可擴展性。
系統應用有良好的可拓展能力,如果增加新的統計分 析模型,系統可以平滑升級,而不需要對現有系統的軟件 設計做重大改動。
5.保證系統安全運作:
Sybase在系統軟選型時充分考慮了系統的可靠性與安全性,以保證系統能連續穩定工作、具有高的可靠性與低故障率。整個系統具備良好的備份機制及備份策略,保證在出現單物理點故障時,系統基本功能不受到影響。所有訪問決策支持系統的用戶,必須經過系統用戶權限認證方可使用。每月對中間層數據進行增量備份,對明細數據進行全備份。
系統主要功能
通過對“發現問題→找到解決方案→跟蹤解決方案 →總結經驗教訓”的全程跟蹤和分析,解決如何針對有流失傾向的客戶進行有效挽留的問題。
本系統主要由兩部分組成:
1.業務分析子系統:
對業務發展的現狀進行分析,並對業務發展的未來趨勢進行預測,找到業務的增長和下降的趨勢和原因,為業務的發展提供幫助。由數據倉庫的各個分析主題來提供數據支持。
2.流失特征挖掘、流失預警分析子系統:
這是本系統最主要的部分。通過建立流失客戶行為的 數據挖掘模型,發現流失客戶使用業務的各種特征和規律。通過匹配這些特征規則,對在網客戶進行流失的預警,提供客戶經理具有流失傾向的客戶的清單,由客戶經理去考慮制定有關的客戶挽留措施,從而有效地提升客戶保持率。
應用效果
總之,Sybase 的整體解決方案有效地支撐了寧夏電信數據挖掘項目一期工程的建設。系統實際運行後,所提供的客戶流失信息准確率高達 93%,命中率和覆蓋率也達到了 85% 以上。通過對系統提供的有流失傾向的客戶制定有針對性的挽留措施,使客戶的保持率比以前的傳統方式提高了 8 倍以上,從而有效地提升了客戶保持率。
Sybase 的整體解決方案有效地支撐了寧夏電信數據挖掘項目一期工程的建設。通過對系統提供的有流失傾向的客戶制定有針對性的挽留措施,使客戶的保持率比以前的傳統方式提高了8倍以上,從而有效地提升了客戶保持率。