google cloud platform 中ML engine 任務中的檔案讀取儲存問題

2022-12-19 02:19:04

前幾天在做kaggle的比賽——The 2nd YouTube-8M Video Understanding Challenge時，使用的是gcp的ML Engine來做的模型的訓練和結果的預測，在使用bucket中的檔案時，我們直接的思路就是用os.path系列指令來判斷檔案的有無并完成檔案操作和讀取。然而在實際操作過程中，發現檔案并沒有按照預想進行讀取和寫入。

查找相關資料後，發現使用TensorFlow裡面的io指令可以解決這一問題：

from tensorflow.python.lib.io import file_io
#從ML Engine伺服器本地中複制檔案到bucket裡
def copy_file_to_gcp(job_dir, file_path):
    with file_io.FileIO(file_path, mode='rb') as input_f:
        with file_io.FileIO(os.path.join(job_dir, file_path), mode='w+') as output_f:
            output_f.write(input_f.read())
#從bucket裡複制檔案到ML Engine伺服器本地
def copy_gcp_to_file(job_dir,file_name):            
with file_io.FileIO(os.path.join(job_dir, file_path), mode='rb') as input_f:
    with file_io.FileIO(file_path, mode='w+') as output_f:
        output_f.write(input_f.read())

google cloud platform 中ML engine 任務中的檔案讀取儲存問題

繼續閱讀

黑馬程式員--學習IO流的一些總結

io engine

Linux網絡程式設計 | IO模型：阻塞IO、非阻塞IO、信号驅動IO、異步IO、多路複用IOIO模型阻塞IO非阻塞IO信号驅動IO多路複用IO異步IO

【Linux 驅動】第六章進階字元驅動程式操作 ----阻塞型I/O

Linux IO模型概念說明Linux IO 模型IO多路複用

Linux的IO端口和IO記憶體

linux 下基本的I/O系統函數

深入淺出異步I/O模型

VB使用API實作序列槽通訊的異常問題

[轉載]關于檔案系統和磁盤驅動的一點學習心得

Windows CE 休眠喚醒全面解析(基于2440平台) ——轉載

Linux下C中chdir函數

程序排程的目标，nice值，靜态優先級，動态優先級，實時優先級，時間片 .

java io性能分析(轉載)

IO流中flush、close的差別和換行