在使用數據倉庫和商業智能(BI)方面,公有企業始終落後於私有企業。究其原因,一定程度上是因為公有組織在實現這些項目時所面對的挑戰要比私有企業更加艱巨,或者至少是不同的。
首先,籌集用於改善 IT 的資金並非易事,並且一些公有部門甚至有預算不足的情況。其次,公有機構經在共享數據方面經常會遇到阻礙。第三,由於領導層的調動,公有組織的 IT 戰略經常會發生變化。
對於在透明度和性能方面有新需求的部門,基於數據倉庫的分析軟件的吸引力是不可抗拒的,特別是近期的一些法規要求公有機構更好地管理和跟蹤資金的使用和效率。隨著公有機構采用這些技術,它們發現一些新的解決方案可以解決一些長期挑戰。
數據報表法規敲響 BI 警鐘
關於公有部門中的數據倉庫和 BI 的任何討論通常都要從資金開始,並且常常都缺乏資金。在此背景下,美國國會於 2009 年 2 月通過的 American Recovery and Reinvestment Act (ARRA) 承諾發放 7878 億美元,刺激就業和經濟。29 家聯邦代理被授權發放這些資金。國家和地方政府將收到超過 5410 億美元的支助,包括直接花費和稅費扣除;跟蹤政府開銷的市場研究公司 INPUT 稱,其中有 2040 億美元可用於自由支配。ARRA 中大約有 1000 億美元將流向公立院校,包括分配給當地學校的 410 億美元。
位於阿拉巴馬州的 Mobile County Public School System (MCPSS) 就是其中之一。美國最大的 MCPSS 校區有 63,000 名學生,這每年將生成 120 萬條出席記錄和 350 萬條學分記錄。所有這些數據都保存在位於不同地理位置的三個不同的數據庫的(人力資源、學校和學生信息,以及聯邦計劃)。收集正確的信息來創建及時的報表困難並且耗時。例如,聯邦計劃需要使用將考試分數、學生出席和教師資格,但所有這些信息分別存儲在不同的數據庫中。
MCPSS 的 CIO David Akridge 表示:“為了創建分析工具,我們在建立這些報表、合並數據源以建立查詢上耗費了巨資。我們需要整合多個數據集,將它們添加到 Ecel 電子表格或類似的工具中。如果他們要修改某些內容,我們只能從重新建立它們。”
Akridge 將刺激資金計劃看作一個機會。他說服學校董事會建立一個數據倉庫來幫助校區更快更高效地合並相關信息。經過董事會的批准之後,並對有競爭力的產品進行了全面審查,校區最終聘請 IBM 及其本地業務合作伙伴開發了一個基於 IBM 分析和 IT 技術的數據倉庫。截至 2009 年 8 月,該校區已經啟動了新系統並已推廣到教師和管理員。
MCPSS 並不是獨一無二的。美國的各種公有機構,從學生到國家及地方政府,都在使用刺激計劃分配的資金來采用數據倉庫和 BI。IBM 全球政府和教育行業執行 Robert Dolan 說:“商業智能和性能管理在公有機構中一直都很強大,而刺激計劃只是進一步對它進行了增強。我們還看到其他許多政府組織的興趣,而它們之前並不認為自己需要這項技術。它的興起的有目共睹的。”
事實上,ARRA 指定了 BI 在政府中的使用,因為它就這些資金的責任和透明性作出了嚴格的要求。收到資金的組織需要發布關於這筆資金的核算、分配和結果數據。法律還指定創建一個 Recovery.gov 網絡,用於向公眾提供刺激計劃資金的詳細使用信息。
共享數據的限制
但是公有部門在實現數據倉庫和 BI 項目時面對著獨特的挑戰。例如,當某家公司希望共享數據時,它通常可以選擇對標准化特定的數據庫平台並在它的業務部門之間隨意共享數據。這有點太過於簡單化了,而現實中通常涉及各種內部策略和技術挑戰,但私有部門的數據共享方式,至少從理論上來說,則相關較為簡單。
在公有部門中,這項工作則要復雜許多。我們首先來看對共享數據的法律限制。Crowe Horwath LLP 的高級經理 Geoff DePrIEst 說,性能業務部門的甚至國家代理機構在將報表發送給政府時都對數據分發有不同的規則和法律限制。例如,如果某代理機構從美國勞工部獲得了資金,而另一家代理從美國住房和城市發展部獲得了資金,那麼它們需要遵從不同的法規。
即使沒有法律限制,有效的數據共享也經常會受到阻礙,這是因為各種代理結構都采用不同結構處理相同的數據。而這也是私有部門不得不面對的阻礙。例如,DePrIEst 在為印度政府工作,勞工部會按人來規劃其數據,而家庭社會服務部則按事項來規劃數據。
U.S. Census Bureau 是一家克服了數據共享挑戰的代理機構。2007 年,Census Bureau 准許 IBM 提供數據表格和分發服務,以支持 2010 Census 和其他重要調查。Census Bureau 的 Data Access and Dissemination System (DADS) 部門負責通過 5 項主要調查發布數據,包括將在 2010 時展開的 10 年一度的調查。但是,這 5 項調查各自都收集不同的數據,並且它們使用不同的數據庫系統作為數據的支持。
DADS 項目經理 Jeff Sisson 說:“一家可以使用 SAS,另一家可以生成數據庫表,並且我們有時可以只獲得無格式文件。”鑒於此,IT 員工花費了大量時間為系統編寫自定義數據。在 IBM 的幫助之下,DADS 正在建立一個數據載入系統,它具有足夠的靈活性,可以處理各種數據格式。通過使用標准技術並圍繞元數據來設計系統,DADS 有望提高效率和節省後端成本。
此外,IBM 還在著手開發 American FactFinder (www.factfinder.census.gov),這個 Census Bureau 網站將負責發布公共使用數據,以便於公眾在網站上搜索和操作相關數據。
例如,在最版本的 American FactFinder 上,如果市民希望查看美國的所有已婚家庭,則首先需要指定搜索哪個主要調查。Sisson 說:“就這個新的分發系統而言,我們將邁出巨大的一步。我們將改變搜索和導航的主要范例。”
在該網站中,修改後的搜索功能將由話題驅動,而不是調查驅動。Sisson 還說:“如果我要查找關於已婚家庭的信息,只需要輸入它作為搜索條件就可以看到關於已婚家庭的一切信息,無論這些數據來自哪個調查。這對於 Joe Public 來說是一個極為強大的工具。”
該系統還將整合更加復雜的搜索和導航工具,以及增強的映射和圖表功能。其目標是適應技能水平不同的各種用戶。
新的 American FactFinder 網站將於 2011 年 1 月開放。並且根據法律規定, 2010 年的普查數據將添加到該系統中。
新選舉,新老板
公有部門面對的另一項挑戰是領導層的頻繁交接(幾乎是肯定的)。例如,在國家政府中,每隔四年的選舉周期,領導者的位置就會發生一些變化。DePrIEst 說:“您不能假定下一屆領導者仍然希望采用相同的方式共享和利用數據。”
同樣的事情也發生的學校中。Akridge 說,MCPSS 四年以來一直在嘗試啟動數據倉庫項目。它在 2006 年就提出了需求方案說明書(RFP),那時 IBM 在競標中獲勝。然後,該校區上任的新 CIO 又決定換作另一家公司。該項目並未取得成功。同時,Akridge 被任命為 CIO,他在看到機會後又做出了再次嘗試。
他說:“我們在這件事上做了如此多的工作。我們花了很長時間,但結果卻令人失望。IBM Cognos and DecisionEd 在四周內就完成其他公司幫助我們在一年內完成的工作。借助 IBM 技術提供的寶貴的價值洞察力,我們離自己的目標又近了一步,即為大學生提供 21 世紀所需要的技能。”
隨著電子報表需求以及市民對透明度和訪問性的需求的增強(而不用提數據收集應用程序和系統的增長),倉庫、性能管理和 BI 技術將有可能成為公有部門數據管理問題的核心因素。組織可以使用這些技術來跟蹤和管理資金,或者展示與政府法規的遵從性,但最終它可以使用這些系統做出可改善生產力、降低成本和交付優質服務的長期決策。