天天看點

Flink入坑指南 第一章 - 簡介Flink是什麼實時計算産品是什麼本教程适合人群适合場景

Flink入坑指南系列文章,從實際例子入手,一步步引導使用者零基礎入門實時計算/Flink,并成長為使用Flink的高階使用者。本文屬個人原創,僅做技術交流之用,筆者才疏學淺,如有錯誤,歡迎指正。轉載請注明出處,侵權必究。

Flink是什麼

這是個很玄妙的問題。在以下網站上做了很專業的介紹。

如果你是大資料從業人士,簡單了解,在功能上:flink>storm=jstorm=spark streaming。玩過大資料的同學對這些系統應該都不陌生。作為流計算領域的後起之秀,flink架構設計先進,ms級延時,支援Exactly once語義等,逐漸受到廣大工程師的青睐,有越來越多的公司開始入坑Flink。

如果你是大資料小白,應該怎麼了解Flink呢?

  • Flink是個分布式實時計算引擎
  • 可以通過SQL/DataStream API來送出Flink作業
  • 可以解決低延時/大數量/精确計算的業務需求

    還不了解?那麼就跟我們的文章一步步來探索吧。

有問題?點我提問

實時計算産品是什麼

官方介紹 -- 阿裡雲實時計算(Alibaba Cloud Realtime Compute)(原阿裡雲流計算)是一套基于Apache Flink建構的一站式、高性能實時大資料處理平台,廣泛應用于流式資料處理、離線資料處理、DataLake計算等場景。

實時計算底層計算引擎用的就是Flink,并且底層Flink版本與開源相比,在SQL解析層以及Runtime層都做了大量優化,SQL支援更完善,性能更優秀。實時計算産品使用的Flink版本中的各項feature會開源,逐漸推回社群。

實時計算産品在Ali内部的引擎上,做了産品化包裝,開發了一套開發+運維IDE,并且與其他阿裡雲産品的互動做了大量工作。在核心功能上,實時計算産品=Flink,是以以後系列文章中,用Flink代替産品名稱。

本教程适合人群

對Flink有濃厚興趣,想用Flink解決實際生産中的各種問題。

如果你是:

  • 技術小白,不會寫SQL。 請移步google/百度,先學習一下SQL的基本知識。
  • 有一定技術基礎,并且會寫SQL。恭喜你,你已經具備了學習Flink的基礎知識。
  • 大資料從業人員,從本教程中,也可以學到很多原理性知識,進而成長稱為優秀的Flink高階開發人員。

适合場景

Flink能解決什麼問題?如果你的場景:

  • 流量大:單機搞不定
  • 實時性要求高:s/ms級延時
  • 計算邏輯複雜:有各種聚合/分組/關聯等複雜操作

    恭喜你,入坑

    實時計算/Flink

也可以參考目前我們收集的

使用者案例

,來判斷Flink是否适合你的場景。

如果你有任何Flink使用的優質案例,歡迎投稿,聯系我們:

點我提問

如果你不确定Flink是否适合解決你的問題?

如果你不确定你的需求在Flink中如何實作?

如果你對實時計算産品/Flink有任何問題?