需求:将parquet資料檔案同步資料到mysql資料庫
需要通過建立parquet格式的hive表,從hdfs中将資料檔案下載下傳,我這裡提前做好了
一、添加依賴包
在dinky的plugins目錄和flink的lib目錄下添加parquet檔案格式的依賴包,并重新開機dinky和flink
依賴包下載下傳位址參考:https://www.bookstack.cn/read/ApacheFlink-1.13-zh/d8d654b36a91abf4.md
下載下傳的時候大家注意自己的flink版本
二、建立作業
三、編寫flinksql代碼
CREATE TABLE fs_table (
`id` STRING,
`name` STRING,
`sex` STRING,
`age` INT,
`work` STRING
) WITH (
'connector'='filesystem',
'path'='/home/data/parquet',
'format'='parquet'
);
CREATE TABLE par_out(
`id` STRING,
`name` STRING,
`sex` STRING,
`age` INT,
`work` STRING
) WITH (
'connector' = 'jdbc',
'url' = 'jdbc:mysql://172.16.119.50:3306/test?createDatabaseIfNotExist=true&useSSL=false',
'username' = 'root',
'password' = 'Tj@20220710',
'table-name' = 'par_out'
);
INSERT INTO par_out select id,name,sex,age,work from
四、運作作業
標明好提前部署的flink叢集,并通過sql代碼的檢查沒問題就可以運作
運作成功
也可以通過flink頁面觀察作業運作情況