子查詢
子查詢是一個包含了另外一個查詢的Lambda表達式的查詢. 以下的例子使用了一個子查詢來針對籃球明星的last name排序:
1: string[] players = { "Tim Ducan", "Lebrom James", "Kobe Byrant" };
2: IEnumerable<string> q = players.OrderBy (m => m.Split().Last());
在這其中, Last是一個子查詢, q則代表了一個外部查詢.
在子查詢中, 你可以在Lambda表達式的右邊使用任何可行的C#表達語法. 子查詢只是一個簡單的C#表達式, 這意味著所有適用於子查詢的規則都可以推導到Lambda表達式上.
以下的查詢取得一個字符數組中所有滿足長度等於最小長度的字符序列:
1: string[] names = { "James","Jack","Landy","C.Y","Jay" };
2: IEnumerable<string> q = names
3: .Where (n => n.Length ==
4: names.OrderBy (n2 => n2.Length)
5: .Select (n2 => n2.Length).First( )
6: );
7: foreach(var s in q)
8: {
9: Console.WriteLine(s); //C.Y , Jay
10: }
對於子查詢, 可以引用到外部的Lambda參數或者是迭代變量(在復合查詢中). 例如上述的例子中, 如果OrderBy使用的表達式改為(n => n.Length)而不是用n2的話將會得到一個錯誤信息:
A local variable named ‘n’ cannot be declared in this scope because it would give a different meaning to ‘n’, which is already used in a ‘parent or current’ scope to denote something else.
針對這個例子, 我們可以看到對應的復合查詢寫法:
1: IEnumerable<string> q =
2: from n in names
3: where n.Length ==
4: (from n2 in names
5: orderby n2.Length
6: select n2.Length).First( )
7: select n;
外部迭代變量n在子查詢范圍內是可見的, 因此我們不能將它重用為子查詢內部的迭代變量.
子查詢會在對應的Lambda表達式被執行的時候來執行, 其執行取決於外部查詢, 也可以說是由外到裡來處理的. 本地查詢完全遵循這個模型, 但是解釋型查詢(例如LINQ to SQL)則僅僅是概念上遵循而已.
之前的查詢我們還可以使用一種更加簡潔的寫法:
1: IEnumerable<string> q =
2: from n in names
3: where n.Length ==
4: names.OrderBy (n2 => n2.Length).First().Length
5: select n;
如果使用Min聚合函數, 還可以進一步簡化:
1: IEnumerable<string> q =
2: from n in names
3: where n.Length == names.Min (n2 => n2.Length)
4: select n;
實際上, 由於n2.Length在外部查詢循環的時候每次都會重新計算, 這在某些情況下可能會引起效率問題, 避免這個問題, 我們可以將子查詢分離出來:
1: int len = names.Min (n => n.Length);
2:
3: IEnumerable<string> query = from n in names
4: where n.Length == len
5: select n;
子查詢和延遲執行
在子查詢中的返回單一元素或者聚合類操作符, 例如first或者Count, 並不會強制外部查詢立即執行, 也就說外部查詢依然擁有延遲執行的能力. 這是因為子查詢是被間接調用的 – 如果是本地查詢則是通過代理(delegate), 如果是解釋性查詢則是通過表達樹(expression tree).
一個有趣的現象是當你的子查詢中包含一個Select表達式的時候, 如果是本地查詢, 你實際上是將其發散成一序列的查詢 – 並且每一個都擁有延遲執行的能力. 這個影響是透明的, 因為它可以顯著提高效率. 待續!