天天看點

Java開發筆記(七十二)Java8新增的流式處理1、獲得容器的流對象2、設定流的各項篩選和加工指令3、規劃處理結果的展示形式

通過前面幾篇文章的學習,大家應能掌握幾種容器類型的常見用法,對于簡單的增删改和周遊操作,各容器執行個體都提供了相應的處理方法,對于實際開發中頻繁使用的清單List,還能利用Arrays工具的asList方法給清單對象做初始化指派,另外提供了專門的Collections工具進行排序、求最大元素、求最小元素等操作。那麼涉及到更加複雜的資料處理,遊蕩如何有針對性地篩選和進一步加功能?

依次周遊目标容器,對所有元素逐個加以分析判斷,并酌情将具體資料調整至滿意的狀态,這種千篇一律的業務流程固然能夠解決問題,可惜由此帶來的副作用是顯而易見的,包括但不限于:代碼冗長、分支衆多、邏輯繁瑣、不易重用等等。為了改進相關業務邏輯的程式設計方式,幫助開發者形成良好的編碼風格,Java的每次版本更新都試圖給出有效的解決方案,其中影響深遠的當數Java8推出的兩項新特性:新增的泛型接口與流式處理。關于前一個泛型接口特性,用于容器操作的泛型接口主要有三個,分别是斷言接口、消費接口和函數接口,有關的應用案例可參見之前的泛型接口文章,這裡不再贅述。真正具有革命性意義的才是本文的主角——流式處理。

所謂流,隐含着流水線的意思,也就是由開發者事先設定一批處理指令,說明清楚每條指令的前因後果,然後啟動流水線作業,即可得到最終的處理結果。流式處理的精髓在于一氣呵成,隻要萬事俱備,決不拖泥帶水。開展流式處理主要包括三個步驟:獲得容器的流對象、設定流的各項篩選和加工指令,以及規劃處理結果的展示形式。下面就分别予以詳細介紹。

1、獲得容器的流對象

Java8給每種容器都準備了兩條流水線,一條是串行流,另一條是并行流。串行流顧名思義各項任務是前後串在一起的,隻有處理完前一項任務,才能繼續執行後一項任務。調用容器執行個體的stream方法即可獲得該容器的串行流對象,而調用容器執行個體的parallelStream方法可獲得該容器的并行流對象。

流對象的擷取操作同時也是流式處理的開始指令,每次進行流式處理之前,都必須先擷取目前容器的流對象,要麼擷取串行流,要麼擷取并行流。

2、設定流的各項篩選和加工指令

不管是串行流還是并行流,它們承載的都是容器内部的原始資料,這些原材料要經過各道加工工序,之後才會得到具備初步形态的半成品。加工資料期間所調用的流方法說明如下:

filter:按照指定條件過濾。即篩選出符合條件的那部分資料。

sorted:根據指定字段對所有記錄排序。可選擇升序或者降序。

map:映射成指定的資料類型。

limit:隻取前面若幹條資料。

distinct:去掉重複記錄。保證每條記錄都是唯一的。

以上的加工方法屬于流式處理的中間指令,每次流水線作業都允許設定一條或者多條中間指令。

3、規劃處理結果的展示形式

前一步的各項加工處理完畢,還要弄個包裝才能輸出最終的成品,也就是這條流水線生産出來的資料到底長什麼模樣。結果資料的記錄包裝有三種形式,分别對應如下的三個方法:

count:統計結果資料的數量。

forEach:依次周遊結果資料,并逐條進行個性化處理。

collect:搜集和整理結果資料,并傳回指定格式的清單記錄。

上面的三個包裝方法屬于流式處理的結束指令,每次流水線作業必須配備有且僅有其中的一條結束指令。

接下來列舉幾個實際應用的業務場景,看看采取流式處理時該如何編碼。首先準備一個原始的蘋果清單,後續将對這個蘋果清單發動流水作業。原始清單的擷取代碼示例如下:

// 擷取預設的蘋果清單
private static ArrayList<Apple> getAppleList() {
	ArrayList<Apple> appleList = new ArrayList<Apple>();
		appleList.add(new Apple("紅蘋果", "RED", 150d, 10d));
		appleList.add(new Apple("大蘋果", "green", 250d, 10d));
		appleList.add(new Apple("紅蘋果", "red", 300d, 10d));
		appleList.add(new Apple("大蘋果", "yellow", 200d, 10d));
		appleList.add(new Apple("紅蘋果", "green", 100d, 10d));
		appleList.add(new Apple("大蘋果", "Red", 250d, 10d));
	return appleList;
}
           

然後需要統計紅蘋果總數的話,可通過下列的流式代碼開展統計操作:

// 統計紅蘋果的總數
long redCount = getAppleList().stream() // 串行處理
		.filter(Apple::isRedApple) // 過濾條件。專門挑選紅蘋果
		.count(); // 統計記錄個數
System.out.println("紅蘋果總數=" + redCount);
           

注意到上述代碼的filter方法内部出現了方法引用,的确流式處理的主要方法都預留了函數式接口的調用,是以經常會在流式代碼中看到五花八門的方法引用與Lambda表達式。比如下面的結果周遊代碼就在forEach方法中填充了Lambda表達式:

// 對每個紅蘋果依次進行處理
getAppleList().stream() // 串行處理
		.filter(Apple::isRedApple) // 過濾條件。專門挑選紅蘋果
		.forEach(s -> System.out.println("目前顔色為"+s.getColor())); // 逐條開展操作
           

當然流水作業更常見的輸出另一串清單資料,此時流式處理的結束指令就得采用collect方法。下面便是從原始清單中挑出紅蘋果清單的流式代碼:

// 挑出紅蘋果清單
List<Apple> redAppleList = getAppleList().stream() // 串行處理
		//.parallelStream() // 并行處理
		.filter(Apple::isRedApple) // 過濾條件。專門挑選紅蘋果
		.sorted(Comparator.comparing(Apple::getWeight)) // 按蘋果重量升序排列
		//.sorted(Comparator.comparing(Apple::getWeight).reversed()) // 按蘋果重量降序排列
		.limit(3) // 隻取前幾條資料
		.distinct() // 去掉重複記錄
		.collect(Collectors.toList()); // 傳回一串清單
System.out.println("紅蘋果清單=" + redAppleList.toString());
           

結果清單可能不需要完整的蘋果資訊,隻需列出蘋果名稱字段,那麼得調用map方法把完整的蘋果資訊映射為單個的名稱字段。此時的篩選代碼變成下面這樣:

// 挑出去重後的蘋果名稱清單
List<String> allNameList = getAppleList().stream() // 串行處理
		.map(Apple::getName) // 映射成新的資料類型
		.distinct() // 去掉重複記錄
		.collect(Collectors.toList()); // 傳回一串清單
System.out.println("蘋果名稱去重後的清單=" + allNameList.toString());
           

除了普通的清單,collect方法還能傳回分組清單,也就是把結果資料按照某種條件進行分組,再統計每個分組的成員數目。仍以蘋果清單為例,紅蘋果可通過名稱或者産地分組,分組的同時計算每個小組裡各有多少粒蘋果。于是形成了以下的分組計數代碼:

// 按照名稱統計紅蘋果的分組個數
Map<String, Long> redStatisticCount = getAppleList().stream() // 串行處理
		.filter(Apple::isRedApple) // 過濾條件。專門挑選紅蘋果
		.collect(Collectors.groupingBy(Apple::getName, Collectors.counting())); // 傳回分組計數
System.out.println("紅蘋果分組計數=" + redStatisticCount.toString());
           

分組計數僅僅是簡單統計各組的成員數量,有時還想單獨計算某個字段的統計值,比如每個小組裡的蘋果總價各是多少?這時collect方法必須同時完成兩項任務,第一項要根據某種條件分組,第二項要對各組的蘋果價格求和,如此改造之後的分組求和代碼如下所示:

// 按照名稱統計紅蘋果的分組總價
Map<String, Double> redPriceSum = getAppleList().stream() // 串行處理
		.filter(Apple::isRedApple) // 過濾條件。專門挑選紅蘋果
		.collect(Collectors.groupingBy(Apple::getName, Collectors.summingDouble(Apple::getPrice))); // 傳回分組并對某字段求和
System.out.println("紅蘋果分組總價=" + redPriceSum.toString());
           

觀察以上的具體案例,發現流式處理的代碼相當連貫,每個步驟該做什麼事情都一清二楚,中間沒有許多繁複的流程控制,唯有一條條分工明确的處理指令,同時充分發揮了方法引用及Lambda表達式的便利性,使得原本令人頭痛的容器加工變成了有章可循的流水線作業,進而極大地提高了開發者的編碼效率。

更多Java技術文章參見《Java開發筆記(序)章節目錄》