天天看點

shell中擷取hdfs檔案路徑參數

 算是個簡單的工具吧。需求是這樣的,有套腳本是不定期跑的累積表,是以需要知道上次跑到了哪天。累積表有個day_id分區,是以直接看表分區是最後的day_id就行。

不多比比直接上代碼

#!/bin/bash
hdfs_path=$1
#擷取hdfs最後一個時間分區時間參數腳本
#注意分區在第幾層改第二個print的參數
last_data_date=`hadoop fs -ls  $hdfs_path | awk '{print $8}' |  awk -F'/' '{print $8}' | tail -n 1`
#echo $last_data_date 
last_date=${last_data_date##*=}
echo $last_date 
           

擷取其他資訊同理。需要加别的條件就加grep。

繼續閱讀