要選擇正確的集合,我們首先要了解一些數據結構的知識。所謂數據結構,就是相互之間存在一種或多種特定關系的數據元素的集合。結合下圖,我們看一下對集合的分類。
集合分類
在上圖中,可以看到,集合總體上分為線性集合和非線性集合。線性集合指元素具有唯一的前驅和後驅的數據結構類型。非線性集合是指具有多個前驅或後驅的數據結構類型,如:樹、圖。在FCL中,非線性集合實現的比較少,所以我們將會更多的討論線性集合。
注意:由於類型安全、轉型效率等方面的原因,本建議將只討論泛型集合。
線性集合按存儲方式,又分為直接存儲和順序存儲。所謂直接存儲是指:該類型的集合數據元素可以直接通過下標(也即index)來訪問,在C#中有三種形式:Array(包括數組和List<T>),string,struct。直接存儲結構的優點是:向數據結構中添加元素是很高效的,只要直接放在數據末尾的第一個空位上就可以了。它的缺點是:向集合插入元素將會變得低效,它需要給插入的元素騰出位置並順序移動後面的元素。
string和structs雖然是直接存儲結構,但它們與一般的集合定義有很大的不同,所以也不在本建議討論之中。在直接存儲的數據結構中,需要區分的是數組和List<T>的選擇。再次強調一下:如果集合的數目固定並且不涉及到轉型,使用數組效率高,否則就使用List<T>。
順序存儲結構,也即線性表。線性表的大小可動態的擴大和縮小,它在一片連續的區域中存儲數據元素。線性表不能按照索引進行查找,它通過對地址的引用來搜索元素,為了找到某個元素,它必須遍歷所有元素,直到找到對應的元素為止。所以線性表的優點是插入和刪除數據效率高,而缺點是查找的效率相對來說低一些。
線性表又可以分為隊列、棧以及索引群集,在C#中,分別表現為:Queue<T>,Stack<T>,索引群集又進一步泛化為字典類型Dictionary< TKey, TValue >和雙向鏈表LinkedList<T>。
隊列Queue<T>遵循的是先入先出模式,它在集合末尾添加元素,在集合起始刪除元素,如圖:
隊列操作
根據隊列的特點,可以用來處理並發命令等場景:將所有客戶端的命令先入隊,由專門的工作線程來執行隊列的命令。在分布式中的消息隊列就是一個典型的隊列應用實例。
棧Stack<T>遵循的是後入先出模式,它在集合末尾添加元素,同時也在集合末尾刪除元素,如圖2-3:
棧操作
字典Dictionary<TKey, TValue>存儲的是鍵值對,值在基於鍵的散列碼的基礎上進行存儲。字典類對象由包含集合元素的存儲桶組成,每一存儲桶與基於該元素的鍵的哈希值關聯。如果需要根據鍵進行值的查找,使用Dictionary<TKey, TValue>將會使搜索和檢索更會快捷。
雙向鏈表LinkedList<T>是一個類型為LinkedListNode的元素對象的集合。當我們在集合中覺得插入和刪除數據很慢的時候,我們可以考慮使用鏈表。如果我們使用LinkedList<T>,我們會發現此類型並沒有其它集合普遍具有的Add方法,取而代之的是AddAfter、AddBefore、AddFirst、AddLast等方法。雙向鏈表中的每個節點都向前指向Previous節點,向後指向Next節點。
以上討論了線性集合,在FCL中,非線性集合實現的不多。非線性集合分為層次集合和組集合。層次集合,如樹,在FCL中就沒有實現。組集合,又分為集和圖。集在FCL中實現為HashSet<T>,而圖在FCL中也沒有對應實現。集的概念在本意上是指存放在集合中的元素是無序的且不能重復的。下圖演示了集的用途:
集操作
除了上面我們提到的集合類型,還有其他幾個要掌握的集合類型,它們是在實際應用中發展出來的對以上基礎類型的擴展:SortedList<T>,SortedDictionary<TKey, TValue>,SortedSet<T>。它們所擴展的對應類為List<T>,Dictionary<TKey,TValue>,HashSet<T>,作用是將原本無序排列的元素,變為有序排列。
除了排序上的需求增加了上面3個集合類,在命名空間System.Collections.Concurrent下,還涉及幾個多線程集合類。它們主要是:ConcurrentBag<T>對應List<T>,ConcurrentDictionary<TKey, TValue>對應Dictionary<TKey, TValue>,ConcurrentQueue<T>對應Queue<T>,ConcurrentStack<T>對應Stack<T>。如果我們的集合被用於多線程應用中,可以使用這幾個集合類型。關於集合的線程安全性,可以進一步查看MSDN。
本建議到此為止已經介紹了FCL中的大部分泛型集合類,為了對它們有更好的了解,最後我們給出一個主要集合類的類圖。實際工作中,應該根據需要選擇合適的集合類。
FCL集合類圖