本節書摘來自華章社群《python資料科學實踐指南》一書中的第0章,第0.2節如何成為資料科學家,作者紀路,更多章節内容可以通路雲栖社群“華章社群”公衆号檢視
0.2 如何成為資料科學家
讀者應該知道這個問題很難回答,失敗的原因總是相似的,成功的經曆卻各有不同。從來沒有人靠複制他人的經曆就能獲得同樣的成就,就像“人不能兩次踏入同一條河流”的哲學觀點一樣,沒有人可以複制别人的經曆,更何談成就。是以在回答這個問題時,我隻假設一些概念上的前提條件:良好的計算機科學基礎,較高的英文讀寫水準,極強的自學能力,還有一些個人品質比如耐心、毅力、樂于分享,等等。不過最重要的還是“興趣”,我相信能花上幾十塊錢購買這本書的讀者一定是有興趣的,因為這本書是給那些對資料科學有一些了解,希望學習具體方法的人準備的。是以,即使上面所說的前提條件你一個都不具備,隻要有興趣,那麼讓我們從現在就開始吧。
我需要數學或計算機科學的學位嗎
最好有!如果你恰好是在校大學生,又碰巧學習數學或計算機相關專業(在這個程式員匮乏的年代,所有必修c語言的專業都稱為“計算機相關專業”),希望你能學習好學校的課程,下面是一份技能清單,如果其中有一些技能沒有在你的課程安排裡,那麼最好是通過選修或自學的方式進行補充。
一門程式設計語言
算法、資料庫、作業系統
機率與統計、線性代數
英語
對于已經錯過了花季、雨季的社會人來講,如果你并非從事計算機程式開發的相關工作,上述幾項技能對你來說可能要求太高了。不過,你還是需要多付出一些努力來補上這些知識,當然是在讀過本書之後。得益于網際網路的發達,很多教學資源都能夠從網上擷取,這裡也向各位讀者推薦一些好的網站。
程式設計學習:
<a href="https://www.codecademy.com/">https://www.codecademy.com/</a>
<a href="https://www.codeschool.com/">https://www.codeschool.com/</a>
這是國外的兩家程式設計學習網站,擁有互動式解釋器、美觀的講義,有一些課程還有手把手的視訊教程,可能讀英文對你來說有點慢,不過這是一個好的開始。
算法學習:
<a href="http://www.brpreiss.com/books/opus7/">http://www.brpreiss.com/books/opus7/</a>
這是由布魯諾·r·普萊斯所著的一系列算法圖書的線上版,包括c++版、java版、c#版、python版、ruby版、lua版、perl版、php版、objective-c版等,你能想到的常用程式設計語言都有對應的版本,它們中的一部分有過正式引進的中文版,或者有愛好者翻譯的版本,當然推薦閱讀原版。
另外,本書會帶領讀者複習一下機率與統計和線性代數的基本概念,以及介紹一些sql方面的知識。最後,不要忘記本書的目的是通過資料科學實戰學習python程式設計。希望讀者在讀過這本書之後,能有充分的知識來支援後續的學習。