天天看點

知道這些用于資料科學和機器學習的GitHub存儲庫和Reddit主題嗎?

GitHub和Reddit都是比較有趣的平台,在這裡,我不僅學習了資料科學的一些最佳應用,而且還了解資料科學家們是如何程式設計的。

一直以來,GitHub都是開發人員之間進行協作的終極平台,并且,我們也看到了據科學和機器學習社群以同樣的熱情來改善它。

而Reddit仍然是一個很好的資料科學領域知識和見解的來源。人們在這個平台上共享代碼、資料科學新聞、尋求幫助和意見、發表研究論文等。

這篇文章總結了Reddit平台上5月份的一些關于資料科學的讨論,其中包括資料科學家在未來3年的作用以及有史以來最好的機器學習論文集。在GitHub社群中,英特爾開放了其NLP架構庫,微軟推出ML.NET以支援Dot Net開發者進行機器學習等。

讓我們來看看GitHub上的頂級存儲庫以及Reddit上個月發生的有趣讨論吧。下面是之前四個月較為流行的GitHub存儲庫和頂級Reddit讨論(從四月起):

一月 二月 三月 四月

ML.NET

知道這些用于資料科學和機器學習的GitHub存儲庫和Reddit主題嗎?

ML.NET是一個開源機器學習架構。不需要任何建構機器學習模型的經驗,機器學習和.NET開發人員就可以輕松使用.NET開發自己的模型。這是預發行版本,包含了基本的分類和回歸算法。

ML.NET最初由Microsoft建立的,并且已用于各種産品,如Windows,Excel,Access,Bing等。此版本還捆綁了用于各種模型訓練任務的.NET API。

NLP Architect

知道這些用于資料科學和機器學習的GitHub存儲庫和Reddit主題嗎?

NLP Architect是一個開源Python庫,由英特爾實驗室的研究人員開發和開源,旨在幫助資料科學家夠探索自然語言處理(NLP)和自然語言了解(NLU)領域最先進的深度學習技術。

這個庫中我最喜歡的元件之一就是可視化元件,可視化元件很整潔的顯示了模型的注釋。更多NLP Architect的資訊請點選

這裡

Amazon Scraper

知道這些用于資料科學和機器學習的GitHub存儲庫和Reddit主題嗎?

Python包可以讓開發人員在亞馬遜上搜尋和提取産品資訊。你需要分析哪些産品,隻需使用該包即可,而不再需要編碼來确定。隻需輸入想要搜尋的關鍵字和最大産品數量(可選),就可以輸出CSV格式,然後進行分析。

PIGO – Face Detection in Go

知道這些用于資料科學和機器學習的GitHub存儲庫和Reddit主題嗎?

Pigo是基于《基于像素強度比較的對象檢測》論文、用Go語言開發的人臉檢測庫。Pigo庫的主要特點如下:

1.處理速度快。

2.在檢測前不需要做圖像預處理。

3.不需要計算積分圖像,圖像金字塔,HOG金字塔或其他類似的資料結構。

4.人臉檢測基于以二進制檔案資料樹結構編碼的像素強度比較

RL-Adventure-2: Policy Gradients

這是所有強化學習(RL)愛好者所喜歡的庫。深度學習推動了強化學習編寫了一個人工智能機器人以人類專家級技能來玩Atari遊戲。 該存儲庫涵蓋了政策梯度算法的新擴充,這是目前解決強化學習問題最受歡迎的預設選擇之一。 這些擴充縮短了訓練時間、優化了強化學習的整體表現。

Reddit 讨論 實時手勢姿态估計
知道這些用于資料科學和機器學習的GitHub存儲庫和Reddit主題嗎?

這個視訊引起了資料科學家和機器學習發燒友的廣泛關注,我希望你能看完這個視訊,然後你就會很好地了解這項技術是如何實施的。

你會選擇哪篇研究論文來證明機器學習是 完美的

如果你是一個機器學習菜鳥,又或者是正在尋找一些用來閱讀或參考的研究論文,這是一個很好的話題。這個話題中列舉了一些優秀的機器學習研究論文,每個資料科學家都将從中受益匪淺。該讨論包括從基本機器學習概念(如高斯模型)到進階概念(如神經藝術風格轉換),使用簡單功能的增強級聯等快速對象檢測等論文。

這是一個必讀話題。 目前, 我們對泛化有什麼了解? 對于泛化,我們接下來應該提什麼問題?

深度學習中的泛化一直都是一個争議不斷的話題。正如作者所說的那樣,我們仍然需要在不少場景中努力實作泛化。這個話題圍繞目前泛化現狀進行了深入探讨,以及它為什麼在深度和強化學習中很難了解。這個話題文章很長,如果你是這個領域的菜鳥,對于你來說可能會有點複雜。不過,我建議無論如何都要閱讀這個話題,因為這個話題中包含了一些經驗豐富和知識淵博的資料科學家的看法。

醫療行業的機器學習狀況

該話題專門研究了醫療行業的機器學習現狀。醫療領域資料科學家分享了他們工作中的經驗和觀點。想要檢視任何生命科學領域機器學習和深度學習的任何資訊,請參閱該話題!

資料科學家3年後潛在的職業發展 方向

這是大多數人在進入該領域之前非常關心的一個問題。随着自動化機器學習工具的迅速采用,公司在幾年内會需要資料科學家嗎?本話題收集了資料科學中不同人員對未來幾年内的職業發展方向的看法。想要尋求職業方向的指導,請檢視這一話題!

數十款阿裡雲産品限時折扣中,趕緊點選領劵開始雲上實踐吧!

以上為譯文。

本文由北郵

@愛可可-愛生活

 老師推薦,

阿裡雲雲栖社群

組織翻譯。

文章原标題《

Don’t miss out on these awesome GitHub Repositories & Reddit Threads for Data Science & Machine Learning (May 2018)

》,譯者:Mags,審校:袁虎。 文章為簡譯,更為詳細的内容,請檢視 原文

繼續閱讀