通過前面幾篇文章的學習，大家應能掌握幾種容器類型的常見用法，對于簡單的增删改和周遊操作，各容器執行個體都提供了相應的處理方法，對于實際開發中頻繁使用的清單List，還能利用Arrays工具的asList方法給清單對象做初始化指派，另外提供了專門的Collections工具進行排序、求最大元素、求最小元素等操作。那麼涉及到更加複雜的資料處理，遊蕩如何有針對性地篩選和進一步加功能？

依次周遊目标容器，對所有元素逐個加以分析判斷，并酌情将具體資料調整至滿意的狀态，這種千篇一律的業務流程固然能夠解決問題，可惜由此帶來的副作用是顯而易見的，包括但不限于：代碼冗長、分支衆多、邏輯繁瑣、不易重用等等。為了改進相關業務邏輯的程式設計方式，幫助開發者形成良好的編碼風格，Java的每次版本更新都試圖給出有效的解決方案，其中影響深遠的當數Java8推出的兩項新特性：新增的泛型接口與流式處理。關于前一個泛型接口特性，用于容器操作的泛型接口主要有三個，分别是斷言接口、消費接口和函數接口，有關的應用案例可參見之前的泛型接口文章，這裡不再贅述。真正具有革命性意義的才是本文的主角——流式處理。

所謂流，隐含着流水線的意思，也就是由開發者事先設定一批處理指令，說明清楚每條指令的前因後果，然後啟動流水線作業，即可得到最終的處理結果。流式處理的精髓在于一氣呵成，隻要萬事俱備，決不拖泥帶水。開展流式處理主要包括三個步驟：獲得容器的流對象、設定流的各項篩選和加工指令，以及規劃處理結果的展示形式。下面就分别予以詳細介紹。

1、獲得容器的流對象

Java8給每種容器都準備了兩條流水線，一條是串行流，另一條是并行流。串行流顧名思義各項任務是前後串在一起的，隻有處理完前一項任務，才能繼續執行後一項任務。調用容器執行個體的stream方法即可獲得該容器的串行流對象，而調用容器執行個體的parallelStream方法可獲得該容器的并行流對象。

流對象的擷取操作同時也是流式處理的開始指令，每次進行流式處理之前，都必須先擷取目前容器的流對象，要麼擷取串行流，要麼擷取并行流。

2、設定流的各項篩選和加工指令

不管是串行流還是并行流，它們承載的都是容器内部的原始資料，這些原材料要經過各道加工工序，之後才會得到具備初步形态的半成品。加工資料期間所調用的流方法說明如下：

filter：按照指定條件過濾。即篩選出符合條件的那部分資料。

sorted：根據指定字段對所有記錄排序。可選擇升序或者降序。

map：映射成指定的資料類型。

limit：隻取前面若幹條資料。

distinct：去掉重複記錄。保證每條記錄都是唯一的。

以上的加工方法屬于流式處理的中間指令，每次流水線作業都允許設定一條或者多條中間指令。

3、規劃處理結果的展示形式

前一步的各項加工處理完畢，還要弄個包裝才能輸出最終的成品，也就是這條流水線生産出來的資料到底長什麼模樣。結果資料的記錄包裝有三種形式，分别對應如下的三個方法：

count：統計結果資料的數量。

forEach：依次周遊結果資料，并逐條進行個性化處理。

collect：搜集和整理結果資料，并傳回指定格式的清單記錄。

上面的三個包裝方法屬于流式處理的結束指令，每次流水線作業必須配備有且僅有其中的一條結束指令。

接下來列舉幾個實際應用的業務場景，看看采取流式處理時該如何編碼。首先準備一個原始的蘋果清單，後續将對這個蘋果清單發動流水作業。原始清單的擷取代碼示例如下：

// 擷取預設的蘋果清單
private static ArrayList<Apple> getAppleList() {
	ArrayList<Apple> appleList = new ArrayList<Apple>();
		appleList.add(new Apple("紅蘋果", "RED", 150d, 10d));
		appleList.add(new Apple("大蘋果", "green", 250d, 10d));
		appleList.add(new Apple("紅蘋果", "red", 300d, 10d));
		appleList.add(new Apple("大蘋果", "yellow", 200d, 10d));
		appleList.add(new Apple("紅蘋果", "green", 100d, 10d));
		appleList.add(new Apple("大蘋果", "Red", 250d, 10d));
	return appleList;
}

然後需要統計紅蘋果總數的話，可通過下列的流式代碼開展統計操作：

// 統計紅蘋果的總數
long redCount = getAppleList().stream() // 串行處理
		.filter(Apple::isRedApple) // 過濾條件。專門挑選紅蘋果
		.count(); // 統計記錄個數
System.out.println("紅蘋果總數=" + redCount);

注意到上述代碼的filter方法内部出現了方法引用，的确流式處理的主要方法都預留了函數式接口的調用，是以經常會在流式代碼中看到五花八門的方法引用與Lambda表達式。比如下面的結果周遊代碼就在forEach方法中填充了Lambda表達式：

// 對每個紅蘋果依次進行處理
getAppleList().stream() // 串行處理
		.filter(Apple::isRedApple) // 過濾條件。專門挑選紅蘋果
		.forEach(s -> System.out.println("目前顔色為"+s.getColor())); // 逐條開展操作

當然流水作業更常見的輸出另一串清單資料，此時流式處理的結束指令就得采用collect方法。下面便是從原始清單中挑出紅蘋果清單的流式代碼：

// 挑出紅蘋果清單
List<Apple> redAppleList = getAppleList().stream() // 串行處理
		//.parallelStream() // 并行處理
		.filter(Apple::isRedApple) // 過濾條件。專門挑選紅蘋果
		.sorted(Comparator.comparing(Apple::getWeight)) // 按蘋果重量升序排列
		//.sorted(Comparator.comparing(Apple::getWeight).reversed()) // 按蘋果重量降序排列
		.limit(3) // 隻取前幾條資料
		.distinct() // 去掉重複記錄
		.collect(Collectors.toList()); // 傳回一串清單
System.out.println("紅蘋果清單=" + redAppleList.toString());

結果清單可能不需要完整的蘋果資訊，隻需列出蘋果名稱字段，那麼得調用map方法把完整的蘋果資訊映射為單個的名稱字段。此時的篩選代碼變成下面這樣：

// 挑出去重後的蘋果名稱清單
List<String> allNameList = getAppleList().stream() // 串行處理
		.map(Apple::getName) // 映射成新的資料類型
		.distinct() // 去掉重複記錄
		.collect(Collectors.toList()); // 傳回一串清單
System.out.println("蘋果名稱去重後的清單=" + allNameList.toString());

除了普通的清單，collect方法還能傳回分組清單，也就是把結果資料按照某種條件進行分組，再統計每個分組的成員數目。仍以蘋果清單為例，紅蘋果可通過名稱或者産地分組，分組的同時計算每個小組裡各有多少粒蘋果。于是形成了以下的分組計數代碼：

// 按照名稱統計紅蘋果的分組個數
Map<String, Long> redStatisticCount = getAppleList().stream() // 串行處理
		.filter(Apple::isRedApple) // 過濾條件。專門挑選紅蘋果
		.collect(Collectors.groupingBy(Apple::getName, Collectors.counting())); // 傳回分組計數
System.out.println("紅蘋果分組計數=" + redStatisticCount.toString());

分組計數僅僅是簡單統計各組的成員數量，有時還想單獨計算某個字段的統計值，比如每個小組裡的蘋果總價各是多少？這時collect方法必須同時完成兩項任務，第一項要根據某種條件分組，第二項要對各組的蘋果價格求和，如此改造之後的分組求和代碼如下所示：

// 按照名稱統計紅蘋果的分組總價
Map<String, Double> redPriceSum = getAppleList().stream() // 串行處理
		.filter(Apple::isRedApple) // 過濾條件。專門挑選紅蘋果
		.collect(Collectors.groupingBy(Apple::getName, Collectors.summingDouble(Apple::getPrice))); // 傳回分組并對某字段求和
System.out.println("紅蘋果分組總價=" + redPriceSum.toString());

觀察以上的具體案例，發現流式處理的代碼相當連貫，每個步驟該做什麼事情都一清二楚，中間沒有許多繁複的流程控制，唯有一條條分工明确的處理指令，同時充分發揮了方法引用及Lambda表達式的便利性，使得原本令人頭痛的容器加工變成了有章可循的流水線作業，進而極大地提高了開發者的編碼效率。

更多Java技術文章參見《Java開發筆記（序）章節目錄》

Java開發筆記（七十二）Java8新增的流式處理1、獲得容器的流對象2、設定流的各項篩選和加工指令3、規劃處理結果的展示形式

1、獲得容器的流對象

2、設定流的各項篩選和加工指令

3、規劃處理結果的展示形式

繼續閱讀

Java小案例——随機數猜測随機數猜測

nginx location中斜線的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的簡單使用

neo4j之cypher使用文檔

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

用mybatis的generator插件在項目中自動生成dao及entity

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

mybatis_入門程式Mybatis入門

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

Effective Java 8:通用程式設計

OOM三種類型

工廠模式-三種類型

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method