天天看點

利用PAI-DSW通路Github, 快速擷取最新的學習資源

在學習資料科學的時候,我們往往需要從各個地方下載下傳各種各樣的資料集和代碼。其中大名鼎鼎的就是我們的Github。這篇文章會簡單講講我們如何從Github下載下傳想要的學習資源,然後在DSW上進行運作和學習。

Step 0: 購買華東2地區的PAI-DSW

記得要先購買。

購買位址

現在隻有華東2地區的資源可以通路github

利用PAI-DSW通路Github, 快速擷取最新的學習資源

Step 1: 選擇華東2地區的PAI-DSW P100 系列

這邊 一定 要選擇P100系列的,這個系列最近有很多活動 而且也隻有華東2地區的p100系列可以通路github

利用PAI-DSW通路Github, 快速擷取最新的學習資源

Step 2: 打開PAI執行個體

然後我們通過控制台打開我們的PAI-DSW實驗室

利用PAI-DSW通路Github, 快速擷取最新的學習資源

Step 3: 建立Terminal

滑動DSW Launcher到底部,單擊Terminal啟動一個指令行的Session

利用PAI-DSW通路Github, 快速擷取最新的學習資源

Step 4: 輸入想要下載下傳的倉庫的指令

這裡就和平時我們從github上面clone東西一樣,通過輸入

git clone https://github.com/jakevdp/PythonDataScienceHandbook.git

并運作就可以下載下傳了。我這邊以資料科學方向大牛 Jake Vanderplas 的一本

資料科學基本法

為例,将這本書下載下傳到DSW中去。

利用PAI-DSW通路Github, 快速擷取最新的學習資源

Step 5: 打開剛剛下載下傳的檔案夾,開始閱讀資料科學基本法

檔案下載下傳完成之後,在左邊就能看到了。要注意下載下傳的路徑,不要下載下傳了之後找不到就尴尬了

利用PAI-DSW通路Github, 快速擷取最新的學習資源

以上就是一個簡單的通過PAI下載下傳Github上代碼倉的教程,歡迎大家私聊我更多資源~

PAI 位址:

https://data.aliyun.com/product/learn

繼續閱讀