天天看點

Flink Weekly | 每周社群動态更新-12/24Flink開發已知缺陷活動/部落格文章/其他

作者:程鶴群(軍長)

Apache Flink 中文郵件清單中的 Flink Weekly 周報,計劃每周一期,内容涵蓋郵件清單中使用者問題的解答、社群開發和提議的進展、社群新聞以及其他活動、部落格文章等,歡迎持續關注~

本期的主要内容由 Hequn Cheng 整理,包括:釋出 Flink 1.10 和 Flink 1.9.2 的更新,關于将 Flink Docker image 釋出內建到 Flink 釋出過程中的讨論,PyFlink 後期新功能的讨論以及一些部落格文章。

Flink開發

  • [releases] Kostas Kloudas 建議在 feature-freeze 期間,關注下1.10新功能的文檔。他建立了一個總 umbrella issue(FLINK-15273)來跟蹤未完成的文檔任務。 [1]
  • [releases] Hequn 展開了一個啟動Flink 1.9.2釋出的讨論。 本周解決了一個 blocker,還剩一個blocker。 考慮到正在進行的1.10版本以及社群的資源有限,計劃在聖誕節後進行1.9.2的投票。[2]
  • [releases] Patrick 建議将 Flink Docker 映像釋出內建到Flink釋出過程中。 目前的争論點是是否要為釋出 Docker 鏡像的 Dockerfiles 提供專門的 git repo。[3]
  • [sql] 關于在 Flink SQL 中支援 JSON 函數的讨論似乎已經達成共識。 Jark Wu 建議 Forward Xu 開始 Flip 投票。[4]
  • [runtime] 在試用了新的 FLIP-49 記憶體配置之後,Stephan 進行了讨論并提供了一些回報。 他提供了一些關于配置鍵名稱和描述的改進意見。 目前收到了許多其他人的贊同。 [5]
  • [connectors] Flip-27(新的 source 接口)的讨論本周有了一些更新。 本周讨論的重點是“有界和無界”的概念。 [6]
  • [pyflink] Jincheng 展開了一個讨論,意在和社群一起讨論 PyFlink 接下來希望支援的功能。目前有一個人回複,期待 PyFlink 能更好地內建 Jupyter。 [7]

[1]

http://apache-flink-mailing-list-archive.1008284.n3.nabble.com/Documentation-tasks-for-release-1-10-td36031.html

[2]

http://apache-flink-mailing-list-archive.1008284.n3.nabble.com/DISCUSS-Releasing-Flink-1-9-2-td36087.html

[3]

http://apache-flink-mailing-list-archive.1008284.n3.nabble.com/DISCUSS-Integrate-Flink-Docker-image-publication-into-Flink-release-process-td36139.html

[4]

http://apache-flink-mailing-list-archive.1008284.n3.nabble.com/DISCUSS-Support-JSON-functions-in-Flink-SQL-td32674.html

[5]

http://apache-flink-mailing-list-archive.1008284.n3.nabble.com/DISCUSS-Some-feedback-after-trying-out-the-new-FLIP-49-memory-configurations-td36129.html

[6]

http://apache-flink-mailing-list-archive.1008284.n3.nabble.com/DISCUSS-FLIP-27-Refactor-Source-Interface-td24952.html

[7]

http://apache-flink-mailing-list-archive.1008284.n3.nabble.com/DISCUSS-What-parts-of-the-Python-API-should-we-focus-on-next-td36119.html

已知缺陷

  • [FLINK-15262] [1.10.0] kafka connector doesn't read from beginning immediately when 'connector.startup-mode' = 'earliest-offset'. [8]

    即使設定了'connector.startup-mode' = 'earliest-offset'的配置項,Kafka 的 connector 也沒有從最開始的點位消費。

  • [FLINK-15300] [1.10.0] Shuffle memory fraction sanity check does not account for its min/max limit. [9]

    如果我們有一個設定 shuffle memory 最小/最大值的配置,但是分數超出最小/最大範圍,則完整性檢查(TaskExecutorResourceUtils#sanityCheckShuffleMemory)可能會失敗。

  • [FLINK-15304] [1.11.0] Remove unexpected Hadoop dependency from Flink's Mesos integration. [10]

    目前 Hadoop 依賴存在于 Flink 的 Mesos 內建中,需要去掉。

  • [FLINK-15313] [1.10.0] Can not insert decimal with precision into sink using TypeInformation. [11]

    如果 Insert 到一張帶有 Decimal 類型的表,并且 Decimal 類型包含精度,那麼目前 Flink 會抛出異常。

  • [FLINK-15320] [1.10.0] JobManager crashes in the standalone model when cancelling job which subtask' status is scheduled. [12]

    Standalone 叢集下,如果 cancel 一個子 task 的狀态是 scheduled 的作業,JobManager 會崩潰。

[8]

https://issues.apache.org/jira/browse/FLINK-15262

[9]

https://issues.apache.org/jira/browse/FLINK-15300

[10]

https://issues.apache.org/jira/browse/FLINK-15304

[11]

https://issues.apache.org/jira/browse/FLINK-15313

[12]

https://issues.apache.org/jira/browse/FLINK-15320

活動/部落格文章/其他

  • Philip Wilcox 釋出了一個部落格,介紹 Bird 公司内他們如何使用 Flink 檢測離線踏闆車。 該部落客要分享一些如何解決實際業務場景中一系列棘手問題的經驗,涉及 Kafka,事件時間,水印和排序。 [13]
  • Preetdeep Kumar 發表了一篇博文,介紹了使用 Apache Flink 處理流資料的用例和最佳實踐。[14].

[13]

https://www.ververica.com/blog/replayable-process-functions-time-ordering-and-timers

[14]

https://dzone.com/articles/streaming-etl-with-apache-flink

2 分鐘快速訂閱 Flink 中文郵件清單

Apache Flink 中文郵件清單訂閱流程:

  1. 發送任意郵件到 [email protected]
  2. 收到官方确認郵件
  3. 回複該郵件 confirm 即可訂閱

訂閱成功後将收到 Flink 官方的中文郵件清單的消息,您可以向 [email protected] 發郵件提問也可以幫助别人解答問題,動動手測試一下!