天天看點

《資料科學:R語言實作》——導讀

《資料科學:R語言實作》——導讀

大資料、物聯網、人工智能已經變成近幾年最熱門的科技流行語。盡管大家用很多名詞去定義這些技術,但是共通的思想是它們都是資料驅動的。人們并不滿足于簡單地擁有資料,因為發現其中的價值才是最本質的。是以資料科學家已經開始關注如何從原始資料中洞悉深層價值。

資料科學已經變成學術界和産業界最流行的話題。但是資料科學是一門非常寬泛的學科,學會掌握資料科學注定很有挑戰性。初學者必須學習如何準備、處理、聚合和可視化資料。而更多進階技能包括機器學習,挖掘各種資料格式(文本、圖像和視訊),以及最重要的—使用資料産生商業價值。資料科學家的角色需要大量的努力,同時,一名成功的資料科學家也需要一個有力的工具來解決日常問題。

在這個領域中,資料科學家使用最廣泛的工具是開源而且免費的r語言。作為一種機器語言,r提供了許多資料處理函數、學習庫和可視化函數,允許使用者快速上手分析資料。r可以幫助使用者快速執行分析,并在不需要懂得複雜數學模型細節的前提下執行機器學習算法。

本書給出了實際方案,教你如何使用r語言将資料科學落地。全書共12章,每一章都分成幾個簡單的教程。通過每一個教程循序漸進的介紹,你可以使用r的程式包,掌握書中所教授的技術。

本書首先介紹如何建立r函數來避免不必要的代碼重複。你會學到如何使用r程式包,在各種資料源上準備資料、處理資料和執行進階etl操作。資料操作的一個例子是介紹如何使用dplyr和data.table程式包有效地處理大型資料結構。還有一章關注ggplot2,介紹如何建立進階圖形,進行資料展示。你也會學到如何使用ggvis程式包建構互動式報告。

本書也會介紹如何使用資料挖掘技術發現經常一起購買的産品。後面的章節還給出了财務資料的時間序列分析結果。還有一些章節會深入介紹機器學習技術,包括資料分類、回歸、聚類和降維。我可以保證,本書會讓你覺得,資料科學學習原來如此簡單。

目  錄

[第1章 r中的函數

<a href="https://yq.aliyun.com/articles/119450/">1.2 建立r函數</a>

<a href="https://yq.aliyun.com/articles/119455/">1.3 比對參數</a>

<a href="https://yq.aliyun.com/articles/119459/">1.4 了解環境</a>

<a href="https://yq.aliyun.com/articles/119462/">1.5 使用詞法域</a>

<a href="https://yq.aliyun.com/articles/119466/">1.6 了解閉包</a>

<a href="https://yq.aliyun.com/articles/119469/">1.7 執行延遲計算</a>

<a href="https://yq.aliyun.com/articles/119472/">1.8 建立中綴操作符</a>

<a href="https://yq.aliyun.com/articles/119476/">1.9 使用替代函數</a>

<a href="https://yq.aliyun.com/articles/119480/">1.10 處理函數中的錯誤</a>

<a href="https://yq.aliyun.com/articles/119482/">1.11 調試函數</a>

[第2章 資料抽取、轉換和加載

<a href="https://yq.aliyun.com/articles/119486/">2.2 下載下傳公開資料</a>

<a href="https://yq.aliyun.com/articles/119488/">2.3 讀取和寫入csv檔案</a>

<a href="https://yq.aliyun.com/articles/119490/">2.4 掃描文本檔案</a>

<a href="https://yq.aliyun.com/articles/119492/">2.5 使用excel檔案</a>

<a href="https://yq.aliyun.com/articles/119495/">2.6 從資料庫中讀取資料</a>

<a href="https://yq.aliyun.com/articles/119500/">2.7 爬取網絡資料</a>

<a href="https://yq.aliyun.com/articles/119502/">2.8 擷取facebook資料</a>

<a href="https://yq.aliyun.com/articles/119504/">2.9 使用twitter</a>

[第3章 資料預處理和準備

<a href="https://yq.aliyun.com/articles/119507/">3.2 重命名資料變量</a>

<a href="https://yq.aliyun.com/articles/119510/">3.3 轉換資料類型</a>

<a href="https://yq.aliyun.com/articles/119513/">3.4 使用日期格式</a>

<a href="https://yq.aliyun.com/articles/120188/">3.5 添加新的記錄</a>

<a href="https://yq.aliyun.com/articles/120195/">3.6 過濾資料</a>

<a href="https://yq.aliyun.com/articles/120199/">3.7 舍棄資料</a>

<a href="https://yq.aliyun.com/articles/120207/">3.8 合并資料</a>

<a href="https://yq.aliyun.com/articles/120212/">3.9 排列資料</a>

<a href="https://yq.aliyun.com/articles/120222/">3.10 重塑資料</a>

<a href="https://yq.aliyun.com/articles/120230/">3.11 檢測缺失資料</a>

<a href="https://yq.aliyun.com/articles/120235/">3.12 估計缺失資料</a>

繼續閱讀