2019 年即将落下帷幕,這一年對于 Apache Flink 來說是非常精彩的一年,裡程碑式的一年。随着這一年在郵件清單發送了超過 1 萬封郵件,JIRA 中超過 4 千個 tickets,以及 GitHub 上超過 3 千個 PR,Apache Flink 迎來了快速的發展。筆者作為一名全職在 Flink 社群工作的成員,表示想要跟上社群的最新狀态着實不太容易。
本文筆者将帶大家一起回顧下 Flink 所經過的 2019 年,感受 Flink 蓬勃發展的同時,我們也将展望 2020 年。
Tips:文末有福利,不要錯過哦~
大事記
筆者整理了 2019 年對于 Flink 社群而言發生的一些大事件(如有遺漏,敬請諒解)。
2019 年初,一篇阿裡巴巴正式向 Apache Flink 貢獻 Blink 源碼的新聞點燃了社群,這也是 Apache Flink 在這一年能有如此快速發展的關鍵,此事件也直接加速了許多使用者期待已久的功能快速落地,如 Hive 內建、更好的 Python 支援,高性能的批處理等等。
這一年,Apache Flink 保持着以往的快節奏,釋出了兩個大版本:Flink 1.8 和 Flink 1.9,以及即将釋出的 Flink 1.10。Flink 1.10 已經進入了測試階段,并有望于春節前與大家見面。Flink 1.9 和 Flink 1.10 是社群迄今為止所經曆過的最大版本(見下圖),從解決的 issue 數和送出的 commit 數上看,1.9 與 1.10 都已經達到了以前版本的兩倍之多,而且也可以預見未來 Flink 還将保持着如此高速發展的态勢。同時單版本的貢獻者數量也在穩步增長中,說明越來越多的開發者加入到了社群中。值得一提的是,阿裡巴巴通過 1.9 和 1.10 兩個版本,曆經 1 年左右将 Blink 中比較通用的部分都悉數回饋給了 Apache Flink 社群,回饋總代碼量一百多萬行。從郵件讨論與代碼送出上看,國内貢獻者正扮演者越來越重要的作用。
除此之外,Flink GitHub 倉庫的 Star 數也早在 8 月份就突破了 1 萬的裡程碑。并且僅 2019 年一年的時間,Star 數就實作了翻番。
user@ 和 dev@ 郵件清單的活動表明了社群非常活躍,并且 user-zh@ 雖然年初才投入使用但也正在變得越來越活躍。從 2018 年同期的數字來看,dev@ 郵件清單的活動量激增最快,郵件和獨立使用者的數量平均增長了 2.5 倍,這很好地反映了上文提到的 Flink 代碼庫的極度活躍。
從
Apache 軟體基金會在 2019 财年報告中,也能印證 Flink 的活躍,報告中提到 Flink:
- 最活躍的郵件清單(user@ + dev@):第一
- GitHub 通路流量:第三
- 送出 commits 數:第五
與往年一樣,今年 Flink 社群在北美(舊金山)、歐洲(柏林)、亞洲(北京)三地分别舉辦了 Flink Forward 大會,其中北京場到會人次突破 2000,同比增加了100%。
在 11 月份,社群釋出了 Flink 生态網站(flink-packages.org),旨在推動圍繞 Apache Flink 的生态建設,用于收集三方包并友善使用者查找,包括連接配接器、類庫、擴充等等。希望 flink-packages.org 能成為社群用于探索 Flink 插件的地方,并讓專注于插件貢獻者們獲得使用者的認可,進而可持續地打造更好的 Flink 生态。
社群發展
随着 Flink 社群貢獻量的猛增,社群在 2019 年也有條不紊地邀請了 6 位 PMC member 以及 8 位 Committer。
- 新增 Committers:Bowen Li,Andrey Zagrebin,Zili Chen,Hequn Cheng, Jiangjie (Becket) Qin, Rong Rong, Zhijiang Wang, Zhu Zhu。
- 新增 PMC member: Jincheng Sun, Kete (Kurt) Young, Kostas Kloudas, Thomas Weise, Jiangjie (Becket) Qin, Jark Wu。
今年 Flink 社群的一個亮點就是擁抱了中文社群。年初的時候,就建立了中文郵件清單,從上文的郵件清單活躍圖上也能看出國内使用者對于中文郵件清單的接受度還是很高的。在 5 月份的時候,Flink 中文學習網站(ververica.cn)上線了,與此同時,中文社群微信公衆号(Ververica)也同步上線。截止目前,微信公衆号訂閱量已突破一萬。
從另外的次元也能看出中文社群的熱情,在 Flink 官網(flink.apache.org)流量統計中,來自中國的流量占了全部流量的 24% ,位列所有國家之首。下圖是 Flink 官網的流量分布圖,圖中不僅反映了 2019 年的整體流量要遠高于往年,更有意思的是圖中标出的兩個流量波谷,其中第一個波谷正好是聖誕節,第二個更大的波谷恰好是中國的春節。從中也能看出中文社群影響力之大。
中文社群之是以能在國際開源項目中扮演越來越重要的作用,離不開這一年 Flink 中文社群的努力。據統計,Flink 中文社群在 2019 年共舉辦了 10 場 Meetup,橫跨了北上深杭等多個城市,其中最大的北京場超過了 500 人參加。并且出品了 36 場 Flink 中文直播課程,覆寫了從基礎到進階到運維的各個方面,累積播放量達16萬多。在此感謝每一位講師以及從業人員為中文社群做出的貢獻!
展望 2020 年
Flink 1.10 版本即将在 2020 年初與大家見面,1.10 版本可以看作一個比較重要的裡程碑式版本,至此,Blink 功能都已經進入 Flink,包括 Blink 中比較關鍵的設計和通用的優化。該版本包含以下主要功能:
- SQL DDL 增強,支援在建表語句中定義計算列和 watermark。
- 生産級别的 Batch 支援與 Hive 相容,其中 TPC-DS 10T 的性能是 Hive 3.0 的 7 倍。
- 更加強大的 Python 支援,支援 Python UDF。
- 支援原生 K8S 內建。
- 新增多個主流機器學習算法庫,包括邏輯回歸,随機森林,KMeans 等。
随着 Blink 的核心功能都已逐漸貢獻到 Flink,相信我們對 Flink 的未來有了更多的期盼,期盼 Flink 在 2020 年能帶給我們更多的驚喜,當然這離不開社群中每一位同學的努力,也希望能有更多的人加入到社群中!
如果您想密切關注社群中發生的事情,請關注微信公衆号(Ververica)以擷取詳細的每周更新、即将舉辦的活動、最新的技術文章與直播課程等。
作者介紹:
伍翀(雲邪),Apache Flink PMC,阿裡巴巴技術專家,北京理工大學碩士畢業,2015 年加入阿裡巴巴,參與阿裡巴巴實時計算引擎 JStorm 的開發與設計。2016 年開始從事阿裡新一代實時計算引擎 Blink SQL 的開發與優化,并活躍于 Flink 社群,Flink/Blink SQL 子產品的核心開發之一。目前主要專注于分布式處理和實時計算,熱愛開源,熱愛分享。
# 福利 #
最新 Apache Flink 基礎入門學習資料第三季專刊新鮮出爐啦!年終尾牙,我們準備了 100 本專刊來感謝大家 2019 年對 Flink 社群的愛與支援!無論你是用來學習還是珍藏,這可能是今年唯一一次獲得專刊的機會了。
我們的目标就是送送送!加小松鼠微信(Ververica2019)即可參與互動領取手感超好的紙質版專刊,數量有限,先到先得~
▼ 專刊展示 ▼
如果你也喜歡 Apache Flink,可以點亮 Star 告訴我們哦。點選下方連結即可給 Flink 送星星,動動手指,Flink 愛你!
https://github.com/apache/flink