天天看點

《資料驅動安全:資料安全分析、可視化和儀表盤》一2.2 用Canopy快速開始Python分析

本節書摘來華章計算機《資料驅動安全:資料安全分析、可視化和儀表盤》一書中的第2章 ,第2.1節,[美]傑·雅克布(jay jacobs)鮑布·魯迪斯(bob rudis) 著 薛傑 王占一 張卓 胡開勇 蔣夢飏 趙爽 譯, 更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

如果你熟悉和精通python,通過我們提供的連結,可以快速可靠地安裝好python、ipython和pandas,但是我們不建議這麼做。對于python新手,基礎安裝包含了核心解釋器以及内置的标準擴充庫,就好比你已經有了便宜的畫闆、基礎的塗料和畫筆,你需要更好的材料去創造藝術作品,統計、計算、畫圖的庫是以應運而生。即使是忠誠的python擁護者也認為管理庫檔案的依賴關系以及更新衆多的必要元件是一件很有挑戰性的工作。而這會浪費你的時間,尤其是當你需要在不同作業系統和環境下管理分析過程時。

為了安裝和維護友善,我們強烈建議使用開源軟體enthought canopy python資料分析開發環境(www.enthought.com/products/canopy)。canopy運作于linux、microsoft windows以及mac osx,擁有一個内置的python內建開發環境,結合一個中繼資料包管理器,能確定依賴包和子產品實時更新,并且和ipython一樣有個控制台。對于那些不想使用開源解決方案的組織,enthought同樣提供canopy的商業版本。

首先需要做的是指導canopy在ipython控制台裡顯示所有圖像。這是可選的步驟,但可保證在canopy環境下所有輸出能正确顯示。當你打開canopy編輯器會話時,你可以從preferences視窗裡找到python标簽,選擇inline(svg)選項,來調整pylab backend的偏好設定(見圖2-2)。

你可以在編輯器的ipython控制台裡運作如下代碼來驗證環境是否設定合适。

《資料驅動安全:資料安全分析、可視化和儀表盤》一2.2 用Canopy快速開始Python分析
《資料驅動安全:資料安全分析、可視化和儀表盤》一2.2 用Canopy快速開始Python分析

成功後的輸出如圖2-3所示。當完成這一切後,你已經搞定了基本的環境安裝設定,可以開始用資料分析的例子進行後續工作了。如果柱狀圖沒有顯示,你應該檢查你的安裝步驟,或者驗證剛剛提過的圖像顯示設定是否正常。