2020年,一個注定會被曆史銘記的一年。在全球化合作受到挑戰的大環境下,作為全球最大的開源軟體基金會,Apache 軟體基金所引領的開源社群,依然彙聚了全球的頂尖開發人員,交出了一份鼓舞人心的成績單。2021年1月1日,Apache 基金會在其官方部落格上發表了文章《Apache in 2020 - By The Digits》[1],用數字回顧了2020 一整年的社群發展:
Apache 軟體基金會在過去的一年中,來自各個領域共計 238 個項目共疊代了接近 3500 個釋出版本。
Apache 軟體基金會的所有開源軟體在如今貢獻着超過 220 億美元的價值。
Apache 的線上會議吸引了超過 150 個國家接近 5750 名參與者,為期兩天的Apache Con 更是吸引了超過 150 萬的浏覽。
而 Apache Flink 作為 Apache 軟體基金會 199 個頂級項目中的一員,在這份報告中,無論從社群使用者活躍度、開發者活躍度,還是曝光度等多個次元上,都取得了卓然的成績。
社群郵件清單活躍度:TOP 1
郵件清單(mailing list)是 Apache 軟體基金會各個項目常用的,用于開發者和使用者之間進行溝通的管道,一般分為開發者交流 (dev@ mailing list)和使用者交流(user@ mailing list)兩個頻道,我們往往會用郵件清單的活躍度來反映社群的交流溝通活躍度。2020年,Flink 取得了使用者交流郵件頻道第一名和開發者交流頻道第二名的好成績:

特别值得一提的是,在前20名郵件清單中,Flink 社群是唯一提供中文使用者交流頻道的([email protected]),而且其活躍度在2020年中僅次于 Flink 的英文使用者郵件清單。自2018年開始,Flink 在郵件清單的活躍度已連續三年蟬聯第一,我們很欣喜地看到越來越多的中文母語使用者在開源社群中發聲,為全球開源軟體社群帶來不可忽視的影響力。
Commits 送出:TOP 2
開源項目在過去一年的新增送出(commit)數,是一種常用的衡量開源項目開發活躍度的名額。Apache 軟體基金會每年都會公布去年的最多送出數的前五名,而 Flink 在2020年度新增 commit 數目中排名第二,僅次于路由引擎建構建構軟體Apache Camel。如果把範圍限制在大資料計算/存儲領域,Apache Flink 則是當仁不讓的開發者最活躍的項目。如果放眼到過去的 2019 [2]、2018年 [3] 年度報告,每年的最活躍的5個開源軟體中,都能看到大資料領域的身影,其中 Flink、Hadoop、HBase、Beam、Airflow、Spark 均有過上榜,我們繪制了如下的表格來描述這一趨勢(由于隻公布了 TOP5,是以有些項目會在某些年份落榜):
Apache Flink 是唯一近三年都連續出現在 TOP5 中,并且排名不斷上升的大資料相關開源項目。
由于每年的 TOP5 名單都會發生變化,我們又對近三年上過榜的項目統計了 commits 數目[4],并繪制了如下的統計圖表,可以看出 Flink 的 commit 數目逐年增長,并且在2020年表現十分亮眼,進一步擴大了其在大資料項目中的優勢。
GitHub 通路量:TOP 2
Apache Flink 社群除了在開發和使用者交流方面有着極高的活躍度,其在網際網路世界中還有着極高的曝光量和浏覽度。Apache 軟體基金會統計了2020年度通路 Flink 的 Github 頁面的流量,在所有項目中位居第二。
由于2018、2019年的 Apache 軟體基金會的自然年年度總結報告中并沒有展示這一名額,我們在2019财年(2018.5.1 - 2019.4.30)年報[5] 和2020财年(2019.5.1 - 2020.4.30)年報[6]中找到了 Github 通路流量的名額:
可以看出,從2018年年中開始,Flink 的曝光浏覽度從總第三名上升到2020年的第二名。
總結
通過 Apache 軟體基金會2020年的總結,并結合 2018、2019 年的總結、财年年報,我們可以看到 Flink 已經毋庸置疑地茁壯成長為 Apache 頭部項目之一。無論是使用者交流活躍度、開發活躍度、還是影響力等多方面都已經穩居在 Apache 所有開源軟體項目 TOP 位置。
同時,剛剛落幕的 Flink 社群年度盛會 Flink Forward Asia 2020,我們也見證了 Flink 社群的高速發展與技術創新、流批一體在生産環境的落地,越來越多的企業如位元組跳動、小米、網易、知乎等都在探索使用 Flink 做流批一體統一架構的方案。
這其中,來自中國的大量開發者和使用者無疑是其能取得相關成績的最重要的原因之一,正在閱讀本文的您,想必也正在為 Apache 的最頂尖項目之一貢獻着一份力量。如今,2021年已然到來,相信在新的一年中,Apache Flink 會繼續朝着流批一體化、離線實時一體化、大資料與 AI 一體化演進,取得更大的成績!
實時即未來,Flink 社群期待您的參與!
參考文獻
[1] Apache in 2020 - By The Digits
https://blogs.apache.org/foundation/entry/apache-in-2020-by-the[2] Apache in 2019 - By The Digits
https://blogs.apache.org/foundation/entry/apache-in-2019-by-the[3] Apache in 2018 - By The Digits
https://blogs.apache.org/foundation/entry/apache-in-2018-by-the[4] commits數統計參考指令 git rev-list --after="Jan 1 2020" --before="Jan 1 2021" --all --no-merges --count
[5] Apache FY2019 annual report
https://files-dist.s3.amazonaws.com/AnnualReports/FY2019+Annual+Report.pdf[6] Apache FY2020 annual report
https://www.apache.org/foundation/docs/FY2020AnnualReport.pdf