天天看點

大資料入門學習必讀好書推薦,請收藏!

身處于一個大資料時代,大資料無疑是近期最時髦的詞彙了。

不管是雲計算、社交網絡,還是物聯網、移動網際網路和智慧城市,都要與大資料搭上聯系。

随着雲計算、移動網際網路和物聯網等新一代資訊技術的創新和應用普及。學習大資料,除了網課,一些經典的技術書籍是非常實用且有幫助的。

為了跟上技術更疊的節奏,不落人後,最好的方式是繼續重新整理自己的知識,同時保持上手的經驗。在這行業中要取得成功,需要完美的項目經驗和技能組合。盡管網上有大量的資源,我們仍要專門推薦一些好的實體書籍。

大資料書單

《Machine Learning Yearning》 

by 吳恩達

大資料入門學習必讀好書推薦,請收藏!

由現代資料,大資料和資料科學開發并生産出的機器學習系統已經不是什麼秘密。雖然它們不一定是同義詞,但卻是互相關聯的,是以如果你在資料行業工作,那麼提高對機器學習的了解和認識是個不錯的想法。

很多初學者,對大資料的概念都是模糊不清的,大資料是什麼,能做什麼,學的時候,該按照什麼線路去學習,學完往哪方面發展,想深入了解,想學習的同學歡迎加入大資料學習qq群:458345782,有大量幹貨(零基礎以及進階的經典實戰)分享給大家,并且有清華大學畢業的資深大資料講師給大家免費授課,給大家分享目前國内最完整的大資料高端實戰實用學習流程體系。

從本書中你可以學到一些洞察能力,例如你應該多長時間收集一次訓練資料集,如何使用端到端的深度學習,以及如何利用你正在建立的系統來共享資料和統計資訊。

《資料之巅》

by塗子沛

大資料入門學習必讀好書推薦,請收藏!

這本書中,從小資料時代到大資料的崛起,作者以宏大的曆史觀、文化觀、大資料觀,給我們描繪了一幅資料科學、智慧文化的全景圖。

《為資料而生》

by周濤

書中分别闡述在大資料1.0、大資料2.0和大資料3.0時代下,相對應的資料分析需要做到分析、外化、內建。作者提供了一套基本的大資料分析架構:确定問題和名額, 清洗資料, 特征提取和選擇, 模型訓練, 模型融合。

《智能時代》

by吳軍

大資料入門學習必讀好書推薦,請收藏!

回顧了科學研究發展的四個範式,用執行個體證明了資料在科學發現中的位置。這本書作者分七章從不同角度對大資料進行介紹,分别以技術和思維方式的改變為主線,從工業革命這個角度嵌入,順理成章的延伸出大資料與智能化,但是沒有将過多筆墨放在技術的深究上,而是選擇從應用層面展現大資料的理念。大資料應用則會滲透到各行各業,這正是作者的用心之處。

這本書作者分七章從不同角度對大資料進行介紹,分别以技術和思維方式的改變為主線,從工業革命這個角度嵌入,順理成章的延伸出大資料與智能化,但是沒有将過多筆墨放在技術的深究上,而是選擇從應用層面展現大資料的理念。大資料應用則會滲透到各行各業,這正是作者的用心之處。

《Hadoop:權威指南》 

by Tom White

大資料入門學習必讀好書推薦,請收藏!

Apache Hadoop是用于處理和管理大量資料的主要架構。任何從事程式設計或資料科學工作的人都有必要熟悉這個平台。事實上,這是開發可擴充系統最有效的方法之一。身為Hadoop顧問和Apache軟體基金會成員的Tom White寫了這本标準指南,其中包羅作者的個人見解和一些有用的資源。更重要的是,它将引導你完成Hadoop的設定并且過一遍整體流程。

Apache Spark是你可能需要花時間學習的另一個重要平台。

《預測分析》 

by Eric Siegel

大資料入門學習必讀好書推薦,請收藏!

本書詳細解釋了如何擷取多種形式的資料和資訊,并将其轉化為可實施的預測或見解的方法。本書的核心目的是幫助專業人員更好地了解他們的閱聽人。你将學會如何識别他們購買的産品和服務,通路的地點,與他們産生共鳴的内容等等。

衆所周知,資料科學家的工作是檢視未經過濾的原始資料,并發現可用的趨勢和模式。本書不僅可以幫助你做到這一點,而且還提出必要的預測算法來改進未來的操作和流程。本書可以算是預測分析的聖經。

《大拐點》 

by  Scott Stawski

大資料入門學習必讀好書推薦,請收藏!

本書對于了解目前資料分析和雲計算行業的發展勢頭十分有幫助。特别值得注意的是,Stawski主要關注原始資料存儲和挖掘系統、如何部署以及在現實世界中的使用情況。

它不僅是一個理論指南,還揭示了實際的工作系統,并且提到如何把相應模式套用到你的企業或公司。更重要的一點是,你可以從本書中清楚了解如何在組織内部署這些工具和平台。

《統計學習導論·基于R應用》  

by Gareth James等人

大資料入門學習必讀好書推薦,請收藏!

統計學習和相關的方法是資料科學工作所必需的概念。這本教科書旨在幫助每個人——從大學到博士,了解這些統計概念。

當然,它也提供了一些很好的R-lab與練習,其中有詳細的解釋和攻略。你可以在學習階段直接用它來練習資料科學。他還能在你的日常應用中作為工具書反複查閱。

《R語言預測實戰》

by遊皓麟

大資料入門學習必讀好書推薦,請收藏!

R語言橫跨了金融、生物、醫學、網際網路等多個領域,主要用于統計、模組化及可視化。由于上手快、效率高,備受技術人員青睐。預測是大資料挖掘的主要作用之一,借助R語言來做大資料預測,可以兼具效率與價值于一身。

市面上為數不多的系統講解R語言預測專題的書籍,可以get到做R語言預測時的基本步驟和方法思路,還有更多技術細節

《商業中的資料分析》 

by Foster Provost, Tom Fawcett

大資料入門學習必讀好書推薦,請收藏!

本書由著名資料科學專家Foster Provost和Tom Fawcett撰寫,介紹了資料科學的基本原理,讓你從收集的資料中提取有用的知識和業務價值所需的“資料分析思維”,并可幫助你了解當今使用的許多資料挖掘技術。

這本書有趣的地方,是會特别标記出較困難的技術部分,并深入淺出的介紹資料挖掘中的重要的幾個概念:分類,聚類和回歸。更重要的是書中包含了這些概念在商務上的的直接應用。

《資料科學實戰》 

by Cathy O'Neil, Rachel Schutt

大資料入門學習必讀好書推薦,請收藏!

這本以哥倫比亞大學的資料科學入門課為基礎,包含了Google,Microsoft和eBay等公司的資料科學家的經驗,通過介紹案例研究和他們使用的代碼的經曆,分享了新的算法,方法和模型。

如果你熟悉線性代數,機率和統計,并具有程式設計經驗,本書是你對資料科學的理想介紹。主題包括:統計推斷、探索性資料分析和資料科學過程算法、垃圾郵件過濾器、樸素貝葉斯和資料處理邏輯回歸、财務模組化、推薦引擎和因果關系資料可視化、社交網絡和資料新聞、資料工程、MapReduce。

《Show Me the Numbers》 

by Stephen Few

大資料入門學習必讀好書推薦,請收藏!

在BI産業有30多年的經驗之後,Stephen Few并不針對哪一種可視化工具進行鑽研,而是從更高層次的去讨論,什麼圖形該怎麼使用,來傳達什麼樣的訊息是最有效的,以及資料分析産業的發展與趨勢。

這本書中,他介紹了可視化的起源和背後的應用,為讀者提供實際的設計指導,針對不同資料使用者的不同使用場景給出建議,在一些現在流行卻有潛在問題的可視化設計上做出改進。

《精益資料分析》

by Alistair Croll / Benjamin Yoskovitz

大資料入門學習必讀好書推薦,請收藏!

本書延續了新創企業文化中MVP(Most Valuable Product)概念和商業畫布架構,展示了如何利用資料的方式,分析六個産業中(電子商務、SaaS、免費移動應用、媒體網站、使用者生成内容與雙邊市場)的資料,驗證創業者自己的設想、找到真正的客戶、打造能賺錢的産品,以及提升企業知名度。

有趣的地方是,就算新創企業的資料沒有成熟企業來的多,作者認為每種不同的産業仍有必須關注的名額數字。根據這些數字新創公司可以更有效的管理和拓展生意。

很多初學者,對大資料的概念都是模糊不清的,大資料是什麼,能做什麼,學的時候,該按照什麼線路去學習,學完往哪方面發展,想深入了解,想學習的同學歡迎加入大資料學習qq群:458345782,有大量幹貨(零基礎以及進階的經典實戰)分享給大家,并且有清華大學畢業的資深大資料講師給大家免費授課,給大家分享目前國内最完整的大資料高端實戰實用學習流程體系。

繼續閱讀