依賴
kafka的source
Flink+kafka是如何實作exactly-once語義的
kafka的消費
Flink通過checkpoint來儲存資料是否處理完成的狀态
由JobManager協調各個TaskManager進行checkpoint存儲,checkpoint儲存在 StateBackend中,預設StateBackend是記憶體級的,也可以改為檔案級的進行持久化儲存。
執行過程實際上是一個兩段式送出,每個算子執行完成,會進行“預送出”,直到執行完sink操作,會發起“确認送出”,如果執行失敗,預送出會放棄掉。
如果當機需要通過StateBackend進行恢複,隻能恢複所有确認送出的操作。