大家好,本文为 Flink Weekly 的第九期,由沈磊(LakeShen)整理,主要内容包括:近期社区开发进展,邮件问题答疑以及 Flink 最新社区动态及本周社区直播内容、技术文章推荐。
Flink 开发进展
■ [Table API & SQL] Jingsong Li 发起 FLIP-115 的讨论,主要在 Flink Table 支持 FileSystem Connector,FLIP-115 主要内容包括:
在 Flink Table 中支持 FileSystem Table Factory,同时支持csv/parquet/orc/json/avro 格式。
支持在流应用或者 Flink On Hive 中数据输出。
更多信息请参考:
[1]
https://cwiki.apache.org/confluence/display/FLINK/FLIP-115%3A+Filesystem+connector+in+Table[2]
http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/DISCUSS-FLIP-115-Filesystem-connector-in-Table-td33625.html■ [RunTime / Configuration] Andrey 发起 FLIP-116 统一的 JobManager 的内存配置的讨论,在 FLIP-49中,我们针对 TaskManager 进行统一的内存管理和配置,在 Flink 1.10 版本中 release 该功能。为了让 JobManager 的内存模型和配置保持对齐,同时针对用户代码 native non-direct memory 的使用,在FLIP-116 中都进行了详细说明。更多信息请参考:
[3]
https://cwiki.apache.org/confluence/display/FLINK/FLIP-49%3A+Unified+Memory+Configuration+for+TaskExecutors[4]
https://cwiki.apache.org/confluence/display/FLINK/FLIP+116%3A+Unified+Memory+Configuration+for+Job+Managers[5]
https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/memory/mem_detail.html#overview■ [Connectors / HBase] Flavio 发起了 FLIP-117 HBase Catalog的讨论,该 FLIP 主要讨论 HBaseCatalog 的实现。更多信息参考:
[6]
https://cwiki.apache.org/confluence/display/FLINK/FLIP-117%3A+HBase+catalog[7]
https://issues.apache.org/jira/browse/FLINK-16575■ Yu Li 发起了 Releasing Flink 1.10.1 的相关讨论。
[8]
http://apache-flink-mailing-list-archive.1008284.n3.nabble.com/DISCUSS-Releasing-Flink-1-10-1-td38689.html■ 为了让大家了解到 Flink 1.11 的相关特性,Zhijiang 发起了 Flink 1.11 特性的讨论,大家有什么想法或者期待可以在下面邮件中进行相关回复。
[9]
http://apache-flink-mailing-list-archive.1008284.n3.nabble.com/DISCUSS-Features-of-Apache-Flink-1-11-td38724.html#a38793邮件问题答疑
■ shravan 社区提问:当 k8s 集群突然 down 掉时,如何优雅的通过 stop with savepoint 停止作业,Vijay 进行了解答。
[10]
http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Stop-job-with-savepoint-during-graceful-shutdown-on-a-k8s-cluster-td33626.html■ Alexander 使用 Flink 1.10 ,对于 Mesos 容器内存配置方面遇到一些问题,Yangze Guo进行了详细解答。
[11]
http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Flink-1-10-container-memory-configuration-with-Mesos-td33594.html■ wanglei2 询问了在 Flink SQL 任务中,如何设置状态后端,以及在 SQL Client 中,维表 Join 任务没有运行问题。Jingsong Li 和 Zhenghua Gao 分别进行了详细的回答。
[12]
http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/How-to-set-stateBackEnd-in-flink-sql-program-td33590.html[13]
http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/dimention-table-join-not-work-under-sql-client-fink-1-10-0-td33616.html■ Yuval 提问了关于 Flink 如何从增量的 Checkpoint 状态回复的一些问题,Andrey 进行了详细的解答。
[14]
http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Restoring-state-from-an-incremental-RocksDB-checkpoint-td33630.html■ Eyal 遇到了一些 Flink On Yarn 方面的日志打印配置问题,社区同学进行了解答。
[15]
http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Setting-app-Flink-logger-td33537.html■ Flavio 在社区提问了关于 Alink 和 Flink ML 的问题,感兴趣的可以看一下。
[16]
http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Alink-and-Flink-ML-td33332.html■ LakeShen 询问了关于从 Checkppoint 状态文件恢复,是否能够改变算子的并发的问题。对于 Checkpoint 的状态文件,当任务从其开始恢复时,可以调整算法的并发度,只要不要修改算子最大的并发度就行。
[17]
http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Cancel-the-flink-task-and-restore-from-checkpoint-can-I-change-the-flink-operator-s-parallelism-td33613.html■ karl 在社区提问了关于 Flink Session 窗口的状态 TTL 问题。
[18]
http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Flink-Session-Windows-State-TTL-td33349.html活动 / 博客文章 / 其他
■
SQL 开发任务超 50%,滴滴实时计算的演进和优化 Flink 如何支持特征工程、在线学习、在线预测等 AI 场景? 一行配置作业性能提升53%!Flink SQL 性能之旅 有赞实时任务优化:Flink Checkpoint 异常解析与应用实践■ Flink 中文社区进行了【1.10 特别篇】系列直播:《PyFlink 架构、应用案例及未来规划》,由 Apache Flink PMC,阿里巴巴高级技术专家孙金城分享。
- 公众号后台回复关键字「PyFlink」可获取嘉宾分享 PPT。
- 直播回顾: https://ververica.cn/developers/flink-training-course3/
2 分钟快速订阅 Flink 中文邮件列表
Apache Flink 中文邮件列表订阅流程:
- 发送任意邮件到 [email protected]
- 收到官方确认邮件
- 回复该邮件 confirm 即可订阅
订阅成功后将收到 Flink 官方的中文邮件列表的消息,您可以向 [email protected] 发邮件提问也可以帮助别人解答问题,动动手测试一下!
Tips:
Flink Weekly 周报计划每周更新一期,内容涵盖邮件列表中用户问题的解答、社区开发和提议的进展、社区新闻以及其他活动、博客文章等,欢迎持续关注~
作者介绍:
沈磊(LakeShen),目前在有赞负责实时平台、以及 Flink 相关开发和维护工作。积极参与 Flink 开源社区,喜欢和大家分享 Flink 技术,个人也写了很多 Flink 相关技术文章,帮助大家一起学习 Flink。