天天看點

Dinky的使用——parquet2mysql

 需求:将parquet資料檔案同步資料到mysql資料庫

需要通過建立parquet格式的hive表,從hdfs中将資料檔案下載下傳,我這裡提前做好了

一、添加依賴包

在dinky的plugins目錄和flink的lib目錄下添加parquet檔案格式的依賴包,并重新開機dinky和flink

依賴包下載下傳位址參考:https://www.bookstack.cn/read/ApacheFlink-1.13-zh/d8d654b36a91abf4.md

Dinky的使用——parquet2mysql

下載下傳的時候大家注意自己的flink版本

二、建立作業

Dinky的使用——parquet2mysql

 三、編寫flinksql代碼

CREATE TABLE fs_table (
`id` STRING,
`name` STRING,
`sex` STRING,
`age` INT,
`work` STRING
)  WITH (
  'connector'='filesystem',
  'path'='/home/data/parquet',
  'format'='parquet'
);

CREATE TABLE par_out( 
`id` STRING,
`name` STRING,
`sex` STRING,
`age` INT,
`work` STRING
) WITH (
  'connector' = 'jdbc', 
  'url' = 'jdbc:mysql://172.16.119.50:3306/test?createDatabaseIfNotExist=true&useSSL=false',
  'username' = 'root',
  'password' = 'Tj@20220710', 
  'table-name' = 'par_out' 
);

INSERT INTO par_out select id,name,sex,age,work from      

四、運作作業

標明好提前部署的flink叢集,并通過sql代碼的檢查沒問題就可以運作

Dinky的使用——parquet2mysql

運作成功

Dinky的使用——parquet2mysql

也可以通過flink頁面觀察作業運作情況 

Dinky的使用——parquet2mysql

繼續閱讀