第一:在.net1.1時,我還有很多和我一樣的程序員,都會常用到ArrayList,當時要想對這種集合元素進行查找,大多會采用for循環來完成,當然也可以采用BinarySearch 方法。但自從有了.net2.0以及.net3.5後,ArrayList就已經很少使用了,大家都認為List<T>在性能上要優越於 ArrayList。既然有了List<T>,有了LINQ,對於LIST<T>集合的查詢就不再單一。我這裡列舉三種方法:它們共同完成一件事,在一個Person的集合中,查找編號大於50000的元素。
Person類定義如下:
public class Person
{
public string firstName
{ get; set; }
public string lastName
{ get; set; }
public int ID
{ get; set; }
}
先構造一個Person的泛型集合。當然一般情況下不會有這樣的大集合,但為了比較不同方法的搜索性能,這是有必要的。
代碼
List<Person> list = new List<Person>();
for (int i = 0; i < 100001; i++)
{
Person p = new Person();
p.firstName = i.ToString() + "firstName";
p.lastName = i.ToString() + "lastName";
p.ID = i;
list.Add(p);
}
1:List<T>提供的FindAll方式。
代碼
public class FindPerson
{
public string firstName;
public FindPerson(string _firstName)
{ this.firstName = _firstName; }
public bool PersonPredicate(Person p)
{
return p.ID >= 50000;
}
}
Stopwatch sw = new Stopwatch();
sw.Start();
List<Person> persons = list.FindAll(new Predicate<Person>(fp.PersonPredicate));
sw.Stop();
Response.Write("Find方法搜索用時" + sw.ElapsedMilliseconds.ToString() + "<br/>");
2:傳統的for循環。
代碼
sw.Start();
List<Person> newPersons = new List<Person>();
for (int j = 0; j < list.Count; j++)
{
if (list[j].ID >= 50000)
{
newPersons.Add(list[j]);
}
}
sw.Stop();
Response.Write("for循環搜索用時" + sw.ElapsedMilliseconds.ToString() + "<br/>");
3:LINQ方式查詢。
代碼
sw = new Stopwatch();
sw.Start();
var pn = (from m in list
where m.ID >=50000
select m).ToList <Person >();
sw.Stop();
Response.Write("linq搜索用時" + sw.ElapsedMilliseconds.ToString() + "<br/>");
輸出結果:雖然用時差不多,但還是傳統的for循環性能最佳,盡管寫法上並無新意。FindAll我覺的有一點比較好的就是,如果針對List<Person>有很多種查詢方式,(當然實際情況中Person類不會這麼簡單),把查詢方式封閉在FindPerson類中比較好,這樣在外部調用查詢時會非常簡單。如果是其它的方式,也可以封裝,但明顯在代碼結構上要稍差。Linq方式的查詢,在靈活性上我覺的比起前兩種要差一些。
Find方法搜索用時5
for循環搜索用時4
linq搜索用時6
第二:再來看對List<T>的排序,這裡比較List<T>提供的Sort方法和Linq方式的orderby。
1:Sort。這裡先寫一個自定義的比較類PersonComparer
public class PersonComparer : IComparer<Person>
{
public int Compare(Person x, Person y)
{
return x.ID.CompareTo(y.ID);
}
}
排序代碼:
代碼
sw = new Stopwatch();
sw.Start();
list.Sort(new PersonComparer());
sw.Stop();
Response.Write("Sort排序用時" + sw.ElapsedMilliseconds.ToString() + "<br/>");
2:Linq方式。
代碼
sw = new Stopwatch();
sw.Start();
var pn = (from m in list
orderby m.ID descending
select m).ToList<Person>();
sw.Stop();
Response.Write("linq排序用時" + sw.ElapsedMilliseconds.ToString() + "<br/>");
輸出結果:在排序上linq還是占有比較大的優勢。
Sort排序用時670
linq排序用時195
總結:對於泛型集合的操作,並不能一味的說某種方式有絕對的優勢,需要根據對應的情景來選擇不同的處理方式。有時候最常見的最簡單的也許是性能最好的。新技術當然有它的優點, Linq提供的排序在性能上就有明顯的優勢,但在查詢方面也是最差的,盡管差距不大。
未解問題:
至於為什麼for循環在查詢時性能最好,LINQ在排序上為什麼性能好,本人並不知道其中原因,如有知道的朋友,請指教。