天天看點

小白|怎樣從程式設計零基礎入行分析領域(附學習資源)

怎麼從程式設計零基礎到可以在科技和分析領域工作?

如果你對學習這些技能感興趣,不管是為了開心還是職業轉換,哪條路是最好的呢?

市面上有無數個網課清單,但你要怎樣分辨出最适合你的那一條路?

我自己從沒想過我會學習任何這方面的實操技能,像程式設計、資料分析、或相關科技。鑒于我是金融專業的,我總是設想我會成為一名“商務人士”。但不知怎麼的,我自學了Python和SQL,而且還在“Jet.com”找到了分析領域的工作,每天都會用到這些語言中的一種。

你可能會問,為什麼要學習Python和SQL?

Python是目前發展最迅速的程式設計語言( fastest growing programming)它擁有大量工具庫,可以用來編寫機器學習應用程式、資料分析、可視化、網頁應用程式、API內建等。而且,它是最容易上手和掌握的語言之一。對于SQL,各種資料庫強化了技術公司的能力,SQL能讓你更好地了解、探索和利用收集到的資料。

下面,我将講述一下我是怎樣從學習這些語言到入門資料分析的學習之路。講真,這條路很具有挑戰性。我曾有無數個夜晚感到心力交瘁。有很多個晚上我隻想拱手認輸,安于當一名商務人士。

但是你内心的動力依然是在不可避免的各種阻力中推動你前進的關鍵。

不管你是想進軍資料分析、資料科學這類的領域,還是隻是覺得學一些程式設計和科技好玩兒(實際上它确實很好玩兒);如果你是真的想好好學的話,你要讓自己保持自律和動力滿滿。

對于我來說,每天回家後立即安排一定的時間(大約90分鐘到2小時)學習和練習,讓我形成了堅持的習慣并且徹底了解了那些我曾覺得迷惑的概念。

下面是我的學習之路,希望能給大家一些啟發。

關鍵的基礎

1. 學習“Python the Hard Way”

這是我那個時期上過最好的課程之一。它是自主的、有挑戰性的,但Zed給了你 你學習在Python上程式設計足夠的細節和指導。他讓程式設計變得好了解,而且每周發放的學習材料真的會給你能學好Python的信心。

2. 模式分析:Pandas

模式分析給了Python一個完美的介紹,包括基于它最強的一個的資料結構的各種例子:pandas資料框( the Pandas DataFrame)。一旦你掌握了python的這些知識,學習資料分析就比較容易上手了。

3. 模式分析:SQLMode Analytics: SQL

另一個關于SQL的學習教程也很棒。你可以學習到很多關鍵概念,打好SQL堅實的基礎。他們甚至有他們自己的SQL編輯器和你可以用來“玩耍”的資料。

連同模式分析, W3 Schools可以解答任何你在學習過程中遇到的關于SQL的問題。

正确的地進入機器學習

在我完全掌握Python之前,我嘗試申請了優達學城的自駕車微學位。我知道這完全是我無法承擔的,但我想,為什麼不試試呢?

當被實際的應用程式而迷住時,你更容易激勵自己學習Python和機器學習。

小白|怎樣從程式設計零基礎入行分析領域(附學習資源)

TensorFlow,由谷歌公司開發,是一個可以在Python上操作的開源機器學習工具包。它很強大,當然也值得被熟悉。

"MNIST exercise"是TensorFlow架構下一個極好的入門檢驗練習。

我發現 "Stanford CS231"這個課程也很有用。它包括了卷積神經網絡(用在圖檔或面部識别軟體裡),這對獲得自駕車微學位是極其有幫助的。如果你隻是對圖檔或視訊形式的機器學習感興趣的話,你不會找到比這個課程更好的了。

CS231n大資料文摘經授權翻譯版(複制連結打開):http://study.163.com/course/introduction/1003223001.htm

我不打算過多談論它因為已經有很多關于這門課的文章。我想說的是,盡管是我所經曆過的最具挑戰性的課程,但我還是能夠了解大部分的内容。有了正确的基礎知識,你會驚訝于你對複雜主題的了解有多深。

持續的分析和資料科學的學習

在深入學習了幾個月的機器學習之後,對我幫助很大的是後退一步,加強我對實用分析和資料科學原理的了解。

我開始學習如何用python學習資料科學,深度學習,和機器學習。在接觸機器學習時,它完全涵蓋了分析、資料科學和統計的原則,特别是圍繞不同的資料挖掘技術和部署它們的實際場景。

小白|怎樣從程式設計零基礎入行分析領域(附學習資源)

《 Data Science For Business 》一書中,也很好地解釋了某些模型在解決特定環境中的問題時是如何工作的以及為什麼會起作用;它會強化你的分析架構和思維模式,以适應圍繞資料問題出現的任何情況。這是我發現的最好的資源,它将不同的分析方法與特定的業務情況和問題聯系起來。

當然,如果你對從事分析或資料科學的職業感興趣,你應該經常鍛煉你曾經擁有的技能,然後繼續增加新的技能。FreeCodeCamp和 Hackernoon釋出了關于所有資料科學和軟體工程的資訊文章和教程。最近我最喜歡的文章是一篇關于寫自己的區塊鍊(blockchain)的教程。

你想知道繼續學習的最好方法嗎?

建構一些東西。任何東西。探索資料集。找出一個你或你的公司面臨的實際問題,并試着去解決它。

即使你無法通路公司的高品質資料,也有大量的開源資料集可供你使用和練習。我敢打賭,你會學到和學習任何課程或閱讀任何書一樣多的東西,甚至更多。

最後,與擁有你想要獲得的技能的人見面和學習是非常有益的。我強烈建議您使用 Meetup 來在您的地區尋找分析或軟體專業人員。許多這樣的團體都有免費的教程或學習課程,你會遇到很多超級聰明的人,他們可以提供一些技巧和技巧來加速你的學習。

在紐約市,一些幫助過我的團體是:

Machine Learning Society

Google Developer Group

NYAI

New York Data Science

原文釋出時間為:2017-12-29