在說LINQ之前必須先說說幾個重要的C#語言特性
一:與LINQ有關的語言特性
1.隐式類型
(1)源起
在隐式類型出現之前,
我們在聲明一個變量的時候,
總是要為一個變量指定他的類型
甚至在foreach一個集合的時候,
也要為周遊的集合的元素,指定變量的類型
隐式類型的出現,
程式員就不用再做這個工作了。
(2)使用方法
來看下面的代碼:
上面的每行代碼,與每行代碼後面的注釋,起到的作用是完全一樣的
也就是說,在聲明一個變量(并且同時給它指派)的時候,完全不用指定變量的類型,隻要一個var就解決問題了
(3)你擔心這樣寫會降低性能嗎?
我可以負責任的告訴你,這樣寫不會影響性能!
上面的代碼和注釋裡的代碼,編譯後産生的IL代碼(中間語言代碼)是完全一樣的
(編譯器根據變量的值,推導出變量的類型,才産生的IL代碼)
(4)這個關鍵字的好處:
你不用在聲明一個變量并給這個變量指派的時候,寫兩次變量類型
(這一點真的為開發者節省了很多時間)
在foreach一個集合的時候,可以使用var關鍵字來代替書寫循環變量的類型
(5)注意事項
你不能用var關鍵字聲明一個變量而不給它指派
因為編譯器無法推導出你這個變量是什麼類型的。
2.匿名類型
(1)源起
建立一個對象,一定要先定義這個對象的類型嗎?
不一定的!
來看看這段代碼
(2)使用
new關鍵字之後就直接為對象定義了屬性,并且為這些屬性指派
而且,對象建立出來之後,在建立對象的方法中,還可以暢通無阻的通路對象的屬性
當把一個對象的屬性拷貝到匿名對象中時,可以不用顯示的指定屬性的名字,這時原始屬性的名字會被“拷貝”到匿名對象中
(3)注意
如果你監視變量obj,你會發現,obj的類型是Anonymous Type類型的
不要試圖在建立匿名對象的方法外面去通路對象的屬性!
(4)優點
這個特性在網站開發中,序列化和反序列化JSON對象時很有用
3.自動屬性
為一個類型定義屬性,我們一般都寫如下的代碼:


但很多時候,這些私有變量對我們一點用處也沒有,比如對象關系映射中的實體類。
自C#3.0引入了自動實作的屬性,
以上代碼可以寫成如下形式:
(2)使用
這個特性也和var關鍵字一樣,是編譯器幫我們做了工作,不會影響性能的
4.初始化器
我們建立一個對象并給對象的屬性指派,代碼一般寫成下面的樣子
自C#3.0引入了對象初始化器,
代碼可以寫成如下的樣子
(2)使用
如果一個對象是有參數的構造函數
那麼代碼看起來就像這樣
集合初始化器的樣例代碼如下:
(3)優點
我個人認為:這個特性不是那麼amazing,
這跟我的編碼習慣有關,集合初始化器也就罷了,
真的不習慣用對象初始化器初始化一個對象!
5.委托
(1)使用
我們先來看一個簡單的委托代碼


這段代碼中
<1>首先定義了一個委托類型
delegate Boolean moreOrlessDelgate(int item);
你看到了,委托和類是一個級别的,确實是這樣:委托是一種類型
和class标志的類型不一樣,這種類型代表某一類方法。
這一句代碼的意思是:moreOrlessDelgate這個類型代表傳回值為布爾類型,輸入參數為整形的方法
<2>有類型就會有類型的執行個體
這兩句就是建立moreOrlessDelgate類型執行個體的代碼,
它們的輸入參數是兩個方法
<3>有了類型的執行個體,就會有操作執行個體的代碼
我們把前面兩個執行個體傳遞給了Print方法
這個方法的第二個參數就是moreOrlessDelgate類型的
在Print方法内用如下代碼,調用委托類型執行個體所指向的方法
dl(item)
6.泛型
(1)為什麼要有泛型
假設你是一個方法的設計者,
這個方法有一個傳入參數,有一個傳回值。
但你并不知道這個參數和傳回值是什麼類型的,
如果沒有泛型,你可能把參數和傳回值的類型都設定為Object了
那時,你心裡肯定在想:反正一切都是對象,一切的基類都是Object
沒錯!你是對的!
這個方法的消費者,會把他的對象傳進來(有可能會做一次裝箱操作)
并且得到一個Object的傳回值,他再把這個傳回值強制類型轉化為他需要的類型
除了裝箱和類型轉化時的性能損耗外,代碼工作的很好!
那麼這些新能損耗能避免掉嗎?
有泛型之後就可以了!
<1>使用簡單的泛型
先來看下面的代碼:


在上面這段代碼中我們聲明了一個存儲int類型的List容器
并循環列印出了容器裡的值
注意:如果這裡使用Hashtable、Queue或者Stack等非泛型的容器
就會導緻裝箱操作,損耗性能。因為這些容器隻能存儲Object類型的資料
<2>泛型類型
List<T>、Dictionary<TKey, TValue>等泛型類型都是.net類庫定義好并提供給我們使用的
但在實際開發中,我們也經常需要定義自己的泛型類型
來看下面的代碼:


這段代碼的消費者如下:
輸出的結果為0
這就是一個自定義的靜态泛型類型,
此類型中的靜态方法InitInstance對傳入的參數做了一個判斷
如果條件成立,則對傳入參數進行操作之後并把它傳回
如果條件不成立,則傳回一個空值
注意:
[1]
傳入參數必須為指定的類型,
因為我們在使用這個泛型類型的時候,已經規定好它能接收什麼類型的參數
但在設計這個泛型的時候,我們并不知道使用者将傳遞什麼類型的參數進來
[2]
如果你想傳回T類型的空值,那麼請用default(T)這種形式
因為你不知道T是值類型還是引用類型,是以别擅自用null
<3>泛型限制
很多時候我們不希望使用者太過自由
我們希望他們在使用我們設計的泛型類型時
不要很随意的傳入任何類型
對于泛型類型的設計者來說,要求使用者傳入指定的類型是很有必要的
因為我們隻有知道他傳入了什麼東西,才友善對這個東西做操作
讓我們來給上面設計的泛型類型加一個泛型限制
代碼如下:
這樣在使用SomethingFactory的時候就隻能傳入MyObj類型或MyObj的派生類型啦
還可以寫成這樣
where T:MyObj,new()
來限制傳入的類型必須有一個構造函數。
(3)泛型的好處
<1>算法的重用
想想看:list類型的排序算法,對所有類型的list集合都是有用的
<2>類型安全
<3>提升性能
沒有類型轉化了,一方面保證類型安全,另一方面保證性能提升
<4>可讀性更好
這一點就不解釋了
7.泛型委托
委托需要定義delgate類型
使用起來頗多不便
而且委托本就代表某一類方法
開發人員經常使用的委托基本可以歸為三類,
哪三類呢?
請看下面:
<1>Predicate泛型委托
把上面例子中d1和d2指派的兩行代碼改為如下:
把Print方法的方法簽名改為如下:
然後再運作方法,控制台輸出的結果和原來的結果是一模一樣的。
那麼Predicate到底是什麼呢?
來看看他的定義:


看到這個定義,我們大緻明白了。
.net為我們定義了一個委托,
這個委托表示的方法需要傳入一個T類型的參數,并且需要傳回一個bool類型的傳回值
有了它,我們就不用再定義moreOrlessDelgate委托了,
而且,我們定義的moreOrlessDelgate隻能搞int類型的參數,
Predicate卻不一樣,它可以搞任意類型的參數
但它規定的還是太死了,它必須有一個傳回值,而且必須是布爾類型的,同時,它必須有一個輸入參數
除了Predicate泛型委托,.net還為我們定義了Action和Func兩個泛型委托
<2>Action泛型委托
Action泛型委托限制的就不那麼死了,
他代表了一類方法:
可以有0個到16個輸入參數,
輸入參數的類型是不确定的,
但不能有傳回值,
來看個例子:
注意:尖括号中int和string為方法的輸入參數


<3>Func泛型委托
為了彌補Action泛型委托,不能傳回值的不足
.net提供了Func泛型委托,
相同的是它也是最多0到16個輸入參數,參數類型由使用者确定
不同的是它規定要有一個傳回值,傳回值的類型也由使用者确定
如下示例:
注意:string類型(最後一個泛型類型)是方法的傳回值類型
8.匿名方法
在上面的例子中
為了得到序列中較大的值
我們定義了一個More方法
然而這個方法,沒有太多邏輯(實際程式設計過程中,如果邏輯較多,确實應該獨立一個方法出來)
那麼能不能把More方法中的邏輯,直接寫出來呢?
C#2.0之後就可以了,
請看下面的代碼:
(2)使用

//可以通路目前上下文中的變量
Console.WriteLine(arr.Count);
if (item > 3)

我們傳遞了一個代碼塊給Predicate的構造函數
其實這個代碼塊就是More函數的邏輯
(3)好處
<1>代碼可讀性更好
<2>可以通路目前上下文中的變量
這個用處非常大,
如果我們仍舊用原來的More函數
想要通路arr變量,勢必要把arr寫成類級别的私有變量了
用匿名函數的話,就不用這麼做了。
9.Lambda表達式
.net的設計者發現在使用匿名方法時,
仍舊有一些多餘的字母或單詞的編碼工作
比如delegate關鍵字
于是進一步簡化了匿名方法的寫法
匿名方法的代碼如下:
delegate(int a) { Console.WriteLine(a); }
使用lambda表達式的代碼如下:
a => Console.WriteLine(a)
這裡解釋一下這個lambda表達式
<1>
a是輸入參數,編譯器可以自動推斷出它是什麼類型的,
如果沒有輸入參數,可以寫成這樣:
() => Console.WriteLine("ddd")
<2>
=>是lambda操作符
<3>
Console.WriteLine(a)是要執行的語句。
如果是多條語句的話,可以用{}包起來。
如果需要傳回值的話,可以直接寫return語句
10.擴充方法
如果想給一個類型增加行為,一定要通過繼承的方式實作嗎?
來看看這段代碼:
消費這段代碼的代碼如下:
我想你看到擴充方法的威力了。
本來string類型沒有PrintString方法
但通過我們上面的代碼,就給string類型"擴充"了一個PrintString方法
(1)先決條件
<1>擴充方法必須在一個非嵌套、非泛型的靜态類中定義
<2>擴充方法必須是一個靜态方法
<3>擴充方法至少要有一個參數
<4>第一個參數必須附加this關鍵字作為字首
<5>第一個參數不能有其他修飾符(比如ref或者out)
<6>第一個參數不能是指針類型
(2)注意事項
<1>跟前面提到的幾個特性一樣,擴充方法隻會增加編譯器的工作,不會影響性能(用繼承的方式為一個類型增加特性反而會影響性能)
<2>如果原來的類中有一個方法,跟你的擴充方法一樣(至少用起來是一樣),那麼你的擴充方法獎不會被調用,編譯器也不會提示你
<3>擴充方法太強大了,會影響架構、模式、可讀性等等等等....
11.疊代器
· (1)使用
我們每次針對集合類型編寫foreach代碼塊,都是在使用疊代器
這些集合類型都實作了IEnumerable接口
都有一個GetEnumerator方法
但對于數組類型就不是這樣
編譯器把針對數組類型的foreach代碼塊
替換成了for代碼塊。
來看看List的類型簽名:
IEnumerable接口,隻定義了一個方法就是:
(2)疊代器的優點:
假設我們需要周遊一個龐大的集合
隻要集合中的某一個元素滿足條件
就完成了任務
你認為需要把這個龐大的集合全部加載到記憶體中來嗎?
當然不用(C#3.0之後就不用了)!
來看看這段代碼:


消費這個函數的代碼如下:


輸出結果為:
大家可以看到:
當疊代器傳回2之後,foreach就退出了
并沒有輸出“疊代器傳回了3”
也就是說下面的工作沒有做。
(3)yield 關鍵字
MSDN中的解釋如下:
在疊代器塊中用于向枚舉數對象提供值或發出疊代結束信号。
也就是說,我們可以在生成疊代器的時候,來确定什麼時候終結疊代邏輯
上面的代碼可以改成如下形式:


(4)注意事項
<1>做foreach循環時多考慮線程安全性
在foreach時不要試圖對被周遊的集合進行remove和add等操作
任何集合,即使被标記為線程安全的,在foreach的時候,增加項和移除項的操作都會導緻異常
(我在這裡犯過錯)
<2>IEnumerable接口是LINQ特性的核心接口
隻有實作了IEnumerable接口的集合
才能執行相關的LINQ操作,比如select,where等
這些操作,我們接下來會講到。
二:LINQ
1.查詢操作符
.net的設計者在類庫中定義了一系列的擴充方法
來友善使用者操作集合對象
這些擴充方法構成了LINQ的查詢操作符
這一系列的擴充方法,比如:
Where,Max,Select,Sum,Any,Average,All,Concat等
都是針對IEnumerable的對象進行擴充的
也就是說,隻要實作了IEnumerable接口,就可以使用這些擴充方法
這段代碼中,用到了兩個擴充方法。
Where擴充方法,需要傳入一個Func<int,bool>類型的泛型委托
這個泛型委托,需要一個int類型的輸入參數和一個布爾類型的傳回值
我們直接把a => { return a > 3; }這個lambda表達式傳遞給了Where方法
a就是int類型的輸入參數,傳回a是否大于3的結果。
Sum擴充方法計算了Where擴充方法傳回的集合的和。
上面的代碼中
arr.Where(a => { return a > 3; }).Sum();
這一句完全可以寫成如下代碼:
(from v in arr where v > 3 select v).Sum();
而且兩句代碼的執行細節是完全一樣的
大家可以看到,第二句代碼更符合語義,更容易讀懂
第二句代碼中的where,就是我們要說的查詢操作符。
(4)标準查詢操作符說明
<1>過濾
Where
用法:arr.Where(a => { return a > 3; })
說明:找到集合中滿足指定條件的元素
OfType
用法:arr.OfType<int>()
說明:根據指定類型,篩選集合中的元素
<2>投影
Select
用法:arr.Select<int, string>(a => a.ToString());
說明:将集合中的每個元素投影的新集合中。上例中:新集合是一個IEnumerable<String>的集合
SelectMany
用法:arr.SelectMany<int, string>(a => { return new List<string>() { "a", a.ToString() }; });
說明:将序列的每個元素投影到一個序列中,最終把所有的序列合并
<3>還有很多查詢操作符,請翻MSDN,以後有時間我将另起一篇文章把這些操作符寫全。
2.查詢表達式
上面我們已經提到,使用查詢操作符表示的擴張方法來操作集合
雖然已經很友善了,但在可讀性和代碼的語義來考慮,仍有不足
于是就産生了查詢表達式的寫法。
雖然這很像SQL語句,但他們卻有着本質的不同。
(2)用法
from v in arr where v > 3 select v
這就是一個非常簡單的查詢表達式
(3)說明:
先看一段僞代碼:
<1>第一行的解釋:
type是可選的,
id是集合中的一項,
source是一個集合,
如果集合中的類型與type指定的類型不同則導緻強制轉化
<2>第二行的解釋:
一個查詢表達式中可以有0個或多個join子句,
這裡的source可以不等于第一句中的source
expr可以是一個表達式
[into subGroup] subGroup是一個中間變量,
它繼承自IGrouping,代表一個分組,也就是說“一對多”裡的“多”
可以通過這個變量得到這一組包含的對象個數,以及這一組對象的鍵
比如:


<3>第三行的解釋:
一個查詢表達式中可以有1個或多個from子句
一個查詢表達式中可以有0個或多個let子句,let子句可以建立一個臨時變量
一個查詢表達式中可以有0個或多個where子句,where子句可以指定查詢條件
<4>第四行的解釋:
一個查詢表達式可以有0個或多個排序方式
每個排序方式以逗号分割
<5>第五行的解釋:
一個查詢表達式必須以select或者group by結束
select後跟要檢索的内容
group by 是對檢索的内容進行分組
<6>第六行的解釋:
最後一個into子句起到的作用是
将前面語句的結果作為後面語句操作的資料源

