Flink Weekly | 每周社区动态更新 - 20200318,


大家好,本文为 Flink Weekly 的第九期,由沈磊(LakeShen)整理,主要内容包括:近期社区开发进展,邮件问题答疑以及 Flink 最新社区动态及本周社区直播内容、技术文章推荐。

Flink 开发进展

■ [Table API & SQL] Jingsong Li 发起 FLIP-115 的讨论,主要在 Flink Table 支持 FileSystem Connector,FLIP-115 主要内容包括:

在 Flink Table 中支持 FileSystem Table Factory,同时支持csv/parquet/orc/json/avro 格式。
支持在流应用或者 Flink On Hive 中数据输出。

更多信息请参考:

[1] https://cwiki.apache.org/confluence/display/FLINK/FLIP-115%3A+Filesystem+connector+in+Table
[2] http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/DISCUSS-FLIP-115-Filesystem-connector-in-Table-td33625.html

■ [RunTime / Configuration] Andrey 发起 FLIP-116 统一的 JobManager 的内存配置的讨论,在 FLIP-49中,我们针对 TaskManager 进行统一的内存管理和配置,在 Flink 1.10 版本中 release 该功能。为了让 JobManager 的内存模型和配置保持对齐,同时针对用户代码 native non-direct memory 的使用,在FLIP-116 中都进行了详细说明。更多信息请参考:

[3] https://cwiki.apache.org/confluence/display/FLINK/FLIP-49%3A+Unified+Memory+Configuration+for+TaskExecutors
[4] https://cwiki.apache.org/confluence/display/FLINK/FLIP+116%3A+Unified+Memory+Configuration+for+Job+Managers
[5] https://ci.apache.org/projects/flink/flink-docs-release-1.10/ops/memory/mem_detail.html#overview

■ [Connectors / HBase] Flavio 发起了 FLIP-117 HBase Catalog的讨论,该 FLIP 主要讨论 HBaseCatalog 的实现。更多信息参考:

[6] https://cwiki.apache.org/confluence/display/FLINK/FLIP-117%3A+HBase+catalog

[7] https://issues.apache.org/jira/browse/FLINK-16575

■ Yu Li 发起了 Releasing Flink 1.10.1 的相关讨论。

[8] http://apache-flink-mailing-list-archive.1008284.n3.nabble.com/DISCUSS-Releasing-Flink-1-10-1-td38689.html

■ 为了让大家了解到 Flink 1.11 的相关特性,Zhijiang 发起了 Flink 1.11 特性的讨论,大家有什么想法或者期待可以在下面邮件中进行相关回复。

[9] http://apache-flink-mailing-list-archive.1008284.n3.nabble.com/DISCUSS-Features-of-Apache-Flink-1-11-td38724.html#a38793

邮件问题答疑

■ shravan 社区提问:当 k8s 集群突然 down 掉时,如何优雅的通过 stop with savepoint 停止作业,Vijay 进行了解答。

[10] http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Stop-job-with-savepoint-during-graceful-shutdown-on-a-k8s-cluster-td33626.html

■ Alexander 使用 Flink 1.10 ,对于 Mesos 容器内存配置方面遇到一些问题,Yangze Guo进行了详细解答。

[11] http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Flink-1-10-container-memory-configuration-with-Mesos-td33594.html

■ wanglei2 询问了在 Flink SQL 任务中,如何设置状态后端,以及在 SQL Client 中,维表 Join 任务没有运行问题。Jingsong Li 和 Zhenghua Gao 分别进行了详细的回答。

[12] http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/How-to-set-stateBackEnd-in-flink-sql-program-td33590.html

[13] http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/dimention-table-join-not-work-under-sql-client-fink-1-10-0-td33616.html

■ Yuval 提问了关于 Flink 如何从增量的 Checkpoint 状态回复的一些问题,Andrey 进行了详细的解答。

[14] http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Restoring-state-from-an-incremental-RocksDB-checkpoint-td33630.html

■ Eyal 遇到了一些 Flink On Yarn 方面的日志打印配置问题,社区同学进行了解答。

[15] http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Setting-app-Flink-logger-td33537.html

■ Flavio 在社区提问了关于 Alink 和 Flink ML 的问题,感兴趣的可以看一下。

[16] http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Alink-and-Flink-ML-td33332.html

■ LakeShen 询问了关于从 Checkppoint 状态文件恢复,是否能够改变算子的并发的问题。对于 Checkpoint 的状态文件,当任务从其开始恢复时,可以调整算法的并发度,只要不要修改算子最大的并发度就行。

[17] http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Cancel-the-flink-task-and-restore-from-checkpoint-can-I-change-the-flink-operator-s-parallelism-td33613.html

■ karl 在社区提问了关于 Flink Session 窗口的状态 TTL 问题。

[18] http://apache-flink-user-mailing-list-archive.2336050.n4.nabble.com/Flink-Session-Windows-State-TTL-td33349.html

活动 / 博客文章 / 其他

■ SQL 开发任务超 50%,滴滴实时计算的演进和优化

■ Flink 如何支持特征工程、在线学习、在线预测等 AI 场景?

■ 一行配置作业性能提升53%!Flink SQL 性能之旅

■ 有赞实时任务优化:Flink Checkpoint 异常解析与应用实践

■ Flink 中文社区进行了【1.10 特别篇】系列直播:《PyFlink 架构、应用案例及未来规划》,由 Apache Flink PMC,阿里巴巴高级技术专家孙金城分享。

相关内容