Greenplum(GPDB)開源啦!~
Greenplum 數據庫(GPDB)是一個無共享的大規模並行處理數據庫,主要用來處理大規模的數據分析任務,包括數據倉庫、商務智能(OLAP)和數據挖掘等。GPDB專為海量數據分析而生,使用最先進的基於成本的查詢優化器,是目前最為先進的開源數據庫之一,能對PB級數據進行快速高效的查詢、分析。
基於 PostgresQL 的商業版本數據庫GreenPlum正式開源,其源代碼現存放在GitHub: https://github.com/greenplum-db/gpdb,廣大數據庫愛好者可以更方便地參考一些SQL高級查詢和分析功能的實現方式了。
Greenplum 數據庫服務器軟件是一個高級全功能的開源數據倉庫管理軟件。它提供對PB級數據的強大和高效的分析功能。特別是在大數據分析這一塊,Greenplum數據庫配備了世界上最先進的基於計算成本的查詢優化器,以實現對大數據較高查詢和分析性能。
Greenplum開源項目現使用Apache 2的版權協議。在此Greenplum公司也對社區貢獻者和其他愛好者對其產品所作出的貢獻表示感謝。對Greenplus的社區來說,任何一種形式的貢獻對產品都是很有意義的,Greenplum也感謝和鼓勵各種形式的貢獻。
“開源大規模並行數據倉庫”
有關Greenplum Database介紹
- Greenplum基於PostgreSQL 開發,同時增加了很多重要的有關數據倉庫操作的創新開發:
- 大規模並行處理架構:Greenplum的數據庫對所有數據和查詢都自動提供了並行化處理的能力;
- PB級負載處理能力:通過使用MPP技術,在高負載下可保持高性能,每機架每小時可處理高達10T的數據。
- 創新的查詢優化器:Greenplum是在行業內第一個對大數據負載使用基於成本優先原理來設計查詢優化器,可以實現在交互模式或是批量處理模式下,對PB級大數據不降低查詢性能和數據處理吞吐量的前提下進行分析處理。
- 多態的數據存儲和執行: 表或分區的存儲、執行以及壓縮設置等都可以靈活地根據存取方式進行配置。在對行級或是列級存儲或是處理時,用戶可以根據自己需要進行選擇。
- 高級機器學習功能: 引入Apache MADLib 庫後,通過用戶定制的功能,在Greenplum數據庫中擴充了內部分析功能。
相關鏈接:
1.Greenplum的源碼和文檔以及相關信息:http://greenplum.org/
2.Greenplum的源碼:https://github.com/greenplum-db
3.無私貢獻的Pivotal公司的網址:https://pivotal.io/big-data/pivotal-greenplum