天天看點

機器學習&深度學習經典資料彙總

《Brief History of Machine Learning》

介紹:這是一篇介紹機器學習曆史的文章,介紹很全面,從感覺機、神經網絡、決策樹、SVM、Adaboost到随機森林、Deep Learning.

《Deep Learning in Neural Networks: An Overview》

介紹:這是瑞士人工智能實驗室Jurgen Schmidhuber寫的最新版本《神經網絡與深度學習綜述》本綜述的特點是以時間排序,從1940年開始講起,到60-80年代,80-90年代,一 直講到2000年後及最近幾年的進展。涵蓋了deep learning裡各種tricks,引用非常全面.

《A Gentle Introduction to Scikit-Learn: A Python Machine Learning Library》

介紹:這是一份python機器學習庫,如果您是一位python工程師而且想深入的學習機器學習.那麼這篇文章或許能夠幫助到你.

《How to Layout and Manage Your Machine Learning Project》

介紹:這一篇介紹如果設計和管理屬于你自己的機器學習項目的文章,裡面提供了管理模版、資料管理與實踐方法.

《Machine Learning is Fun!》

介紹:如果你還不知道什麼是機器學習,或則是剛剛學習感覺到很枯燥乏味。那麼推薦一讀。這篇文章已經被翻譯成中文,如果有興趣可以移步http://blog.jobbole.com/67616/

《R語言參考卡片》

介紹:R語言是機器學習的主要語言,有很多的朋友想學習R語言,但是總是忘記一些函數與關鍵字的含義。那麼這篇文章或許能夠幫助到你

《Choosing a Machine Learning Classifier》

介紹:我該如何選擇機器學習算法,這篇文章比較直覺的比較了Naive Bayes,Logistic Regression,SVM,決策樹等方法的優劣,另外讨論了樣本大小、Feature與Model權衡等問題。此外還有已經翻譯了的版 本:http://www.52ml.net/15063.html

《An Introduction to Deep Learning: From Perceptrons to Deep Networks》

介紹:深度學習概述:從感覺機到深度網絡,作者對于例子的選擇、理論的介紹都很到位,由淺入深。翻譯版本:http://www.cnblogs.com/xiaowanyer/p/3701944.html

《The LION Way: Machine Learning plus Intelligent Optimization》

介紹:<機器學習與優化>這是一本機器學習的小冊子, 短短300多頁道盡機器學習的方方面面. 圖文并茂, 生動易懂, 沒有一坨坨公式的煩惱. 适合新手入門打基礎, 也适合老手溫故而知新. 比起MLAPP/PRML等大部頭, 也許這本你更需要!具體内容推薦閱讀:http://intelligent-optimization.org/LIONbook/

《深度學習與統計學習理論》

介紹:作者是來自百度,不過他本人已經在2014年4月份申請離職了。但是這篇文章很不錯如果你不知道深度學習與支援向量機/統計學習理論有什麼聯系?那麼應該立即看看這篇文章.

《計算機科學中的數學》

介紹:這本書是由谷歌公司和MIT共同出品的計算機科學中的數學:Mathematics for Computer Science,Eric Lehman et al 2013 。分為5大部分:1)證明,歸納。2)結構,數論,圖。3)計數,求和,生成函數。4)機率,随機行走。5)遞歸。等等

《資料科學入門》

介紹:這是一本由雪城大學新編的第二版《資料科學入門》教材:偏實用型,淺顯易懂,适合想學習R語言的同學選讀。

《Twenty Questions for Donald Knuth》

介紹:這并不是一篇文檔或書籍。這是篇向圖靈獎得主Donald Knuth提問記錄稿: 近日, Charles Leiserson, Al Aho, Jon Bentley等大神向Knuth提出了20個問題,内容包括TAOCP,P/NP問題,圖靈機,邏輯,以及為什麼大神不用電郵等等。

《Automatic Construction and Natural-Language Description of Nonparametric Regression Models》

介紹:不會統計怎麼辦?不知道如何選擇合适的統計模型怎麼辦?那這篇文章你的好好讀一讀了麻省理工Joshua B. Tenenbaum和劍橋Zoubin Ghahramani合作,寫了一篇關于automatic statistician的文章。可以自動選擇回歸模型類别,還能自動寫報告…

《ICLR 2014論文集》

介紹:對深度學習和representation learning最新進展有興趣的同學可以了解一下

《Introduction to Information Retrieval》

介紹:這是一本資訊檢索相關的書籍,是由斯坦福Manning與谷歌副總裁Raghavan等合著的Introduction to Information Retrieval一直是北美最受歡迎的資訊檢索教材之一。最近作者增加了該課程的幻燈片和作業。IR相關資源:http://www- nlp.stanford.edu/IR-book/information-retrieval.html

《Machine learning in 10 pictures》

介紹:Deniz Yuret用10張漂亮的圖來解釋機器學習重要概念:1. Bias/Variance Tradeoff 2. Overfitting 3. Bayesian / Occam’s razor 4. Feature combination 5. Irrelevant feature 6. Basis function 7. Discriminative / Generative 8. Loss function 9. Least squares 10. Sparsity.很清晰

《雅虎研究院的資料集彙總》

介紹:雅虎研究院的資料集彙總: 包括語言類資料,圖與社交類資料,評分與分類資料,計算廣告學資料,圖像資料,競賽資料,以及系統類的資料。

《An Introduction to Statistical Learning with Applications in R》

介紹:這是一本斯坦福統計學著名教授Trevor Hastie和Robert Tibshirani的新書,并且在2014年一月已經開課:https://class.stanford.edu/courses /HumanitiesScience/StatLearning/Winter2014/about

Best Machine Learning Resources for Getting Started

介紹:機器學習最佳入門學習資料彙總是專為機器學習初學者推薦的優質學習資源,幫助初學者快速入門。而且這篇文章的介紹已經被翻譯成中文版。如果你不怎麼熟悉,那麼我建議你先看一看中文的介紹。

My deep learning reading list

介紹:主要是順着Bengio的PAMI review的文章找出來的。包括幾本綜述文章,将近100篇論文,各位山頭們的Presentation。全部都可以在google上找到。

Cross-Language Information Retrieval

介紹:這是一本書籍,主要介紹的是跨語言資訊檢索方面的知識。理論很多

探索推薦引擎内部的秘密,第 1 部分: 推薦引擎初探

介紹:本文共有三個系列,作者是來自IBM的工程師。它主要介紹了推薦引擎相關算法,并幫助讀者高效的實作這些算法。探索推薦引擎内部的秘密,第 2 部分: 深度推薦引擎相關算法 – 協同過濾,探索推薦引擎内部的秘密,第 3 部分: 深度推薦引擎相關算法 – 聚類

《Advice for students of machine learning》

介紹:康奈爾大學資訊科學系助理教授David Mimno寫的《對機器學習初學者的一點建議》, 寫的挺實際,強調實踐與理論結合,最後還引用了馮 • 諾依曼的名言: “Young man, in mathematics you don’t understand things. You just get used to them.”

分布式并行處理的資料

介紹:這是一本關于分布式并行處理的資料《Explorations in Parallel Distributed Processing: A Handbook of Models, Programs, and Exercises》,作者是斯坦福的James L. McClelland。着重介紹了各種神級網絡算法的分布式實作,做Distributed Deep Learning 的童鞋可以參考下

《“機器學習”是什麼?》

介紹:【“機器學習”是什麼?】John Platt是微軟研究院傑出科學家,17年來他一直在機器學習領域耕耘。近年來機器學習變得炙手可熱,Platt和同僚們遂決定開設部落格,向公衆介紹機器 學習的研究進展。機器學習是什麼,被應用在哪裡?來看Platt的這篇博文

《2014年國際機器學習大會ICML 2014 論文》

介紹:2014年國際機器學習大會(ICML)已經于6月21-26日在國家會議中心隆重舉辦。本次大會由微軟亞洲研究院和清華大學聯手主辦,是這個有着 30多年曆史并享譽世界的機器學習領域的盛會首次來到中國,已成功吸引海内外1200多位學者的報名參與。幹貨很多,值得深入學習下

《Machine Learning for Industry: A Case Study》

介紹:這篇文章主要是以Learning to Rank為例說明企業界機器學習的具體應用,RankNet對NDCG之類不敏感,加入NDCG因素後變成了LambdaRank,同樣的思想從神經網絡 改為應用到Boosted Tree模型就成就了LambdaMART。Chirs Burges,微軟的機器學習大神,Yahoo 2010 Learning to Rank Challenge第一名得主,排序模型方面有RankNet,LambdaRank,LambdaMART,尤其以LambdaMART最為突出,代表 論文為: From RankNet to LambdaRank to LambdaMART: An Overview 此外,Burges還有很多有名的代表作,比如:A Tutorial on Support Vector Machines for Pattern Recognition

Some Notes on Applied Mathematics for Machine Learning

100 Best GitHub: Deep Learning

介紹:100 Best GitHub: Deep Learning

《UFLDL-斯坦福大學Andrew Ng教授“Deep Learning”教程》

介紹:本教程将闡述無監督特征學習和深度學習的主要觀點。通過學習,你也将實作多個功能學習/深度學習算法,能看到它們為你工作,并學習如何應用/适應這 些想法到新問題上。本教程假定機器學習的基本知識(特别是熟悉的監督學習,邏輯回歸,梯度下降的想法),如果你不熟悉這些想法,我們建議你去這裡機器學習 課程,并先完成第II,III,IV章(到邏輯回歸)。此外這關于這套教程的源代碼在github上面已經有python版本了 UFLDL Tutorial Code

*《Deep Learning for Natural Language Processing and Related Applications》

介紹:這份文檔來自微軟研究院,精髓很多。如果需要完全了解,需要一定的機器學習基礎。不過有些地方會讓人眼前一亮,毛塞頓開。

Understanding Convolutions

介紹:這是一篇介紹圖像卷積運算的文章,講的已經算比較詳細的了

《Machine Learning Summer School》

介紹:每天請一個大牛來講座,主要涉及機器學習,大資料分析,并行計算以及人腦研究。https://www.youtube.com/user/smolix (需翻牆)

《Awesome Machine Learning》

介紹:一個超級完整的機器學習開源庫總結,如果你認為這個碉堡了,那後面這個清單會更讓你驚訝:【Awesome Awesomeness】,國内已經有熱心的朋友進行了翻譯中文介紹,機器學習資料挖掘免費電子書

斯坦福《自然語言處理》課程視訊

介紹:ACL候任主席、斯坦福大學計算機系Chris Manning教授的《自然語言處理》課程所有視訊已經可以在斯坦福公開課網站上觀看了(如Chrome不行,可用IE觀看) 作業與測驗也可以下載下傳。

《Deep Learning and Shallow Learning》

介紹:對比 Deep Learning 和 Shallow Learning 的好文,來着浙大畢業、MIT 讀博的 Chiyuan Zhang 的部落格。

《Recommending music on Spotify with deep learning》

介紹:利用卷積神經網絡做音樂推薦。

《Neural Networks and Deep Learning》

介紹:神經網絡的免費線上書,已經寫了三章了,還有對應的開源代碼:https://github.com/mnielsen/neural-networks-and-deep-learning愛好者的福音。

《Java Machine Learning》

介紹:Java機器學習相關平台和開源的機器學習庫,按照大資料、NLP、計算機視覺和Deep Learning分類進行了整理。看起來挺全的,Java愛好者值得收藏。

《Machine Learning Theory: An Introductory Primer》

介紹:機器學習最基本的入門文章,适合零基礎者

《機器學習常見算法分類彙總》

介紹:機器學習的算法很多。很多時候困惑人們都是,很多算法是一類算法,而有些算法又是從其他算法中延伸出來的。這裡,我們從兩個方面來給大家介紹,第一個方面是學習的方式,第二個方面是算法的類似性。

《機器學習經典論文/survey合集》

介紹:看題目你已經知道了是什麼内容,沒錯。裡面有很多經典的機器學習論文值得仔細與反複的閱讀。

《機器學習視訊庫》

介紹:視訊由加州理工學院(Caltech)出品。需要英語底子。

《機器學習經典書籍》

介紹:總結了機器學習的經典書籍,包括數學基礎和算法理論的書籍,可做為入門參考書單。

《16 Free eBooks On Machine Learning》

介紹:16本機器學習的電子書,可以下載下傳下來在pad,手機上面任意時刻去閱讀。不多我建議你看完一本再下載下傳一本。

《A Large set of Machine Learning Resources for Beginners to Mavens》

介紹:标題很大,從新手到專家。不過看完上面所有資料。肯定是專家了

《機器學習最佳入門學習資料彙總》

介紹:入門的書真的很多,而且我已經幫你找齊了。

《Sibyl》

介紹:Sibyl 是一個監督式機器學習系統,用來解決預測方面的問題,比如 YouTube 的視訊推薦。

《Deep Learning》

介紹:Yoshua Bengio, Ian Goodfellow, Aaron Courville著

《Neural Network & Text Mining》

介紹:關于(Deep) Neural Networks在 NLP 和 Text Mining 方面一些paper的總結

《前景目标檢測1(總結)》

介紹:計算機視覺入門之前景目标檢測1(總結)

《行人檢測》

介紹:計算機視覺入門之行人檢測

《Deep Learning – important resources for learning and understanding》

介紹:Important resources for learning and understanding . Is awesome

《Machine Learning Theory: An Introductory Primer》

介紹:這又是一篇機器學習初學者的入門文章。值得一讀

《Neural Networks and Deep Learning》

介紹:線上Neural Networks and Deep Learning電子書

《Python 網頁爬蟲 & 文本處理 & 科學計算 & 機器學習 & 資料挖掘兵器譜》

介紹:python的17個關于機器學習的工具

《神奇的伽瑪函數(上)》

介紹:下集在這裡神奇的伽瑪函數(下)

《分布式機器學習的故事》

介紹:作者王益目前是騰訊廣告算法總監,王益博士畢業後在google任研究。這篇文章王益博士7年來從谷歌到騰訊對于分布機器學習的所見所聞。值得細讀

《機器學習提升之道(Level-Up Your Machine Learning)》

介紹:把機器學習提升的級别分為0~4級,每級需要學習的教材和掌握的知識。這樣,給機器學習者提供一個上進的路線圖,以免走彎路。另外,整個網站都是關于機器學習的,資源很豐富。

《Machine Learning Surveys》

介紹:機器學習各個方向綜述的網站

《Deep Learning Reading list》

介紹:深度學習閱資源清單

《Deep Learning: Methods and Applications》

介紹:這是一本來自微的研究員 li Peng和Dong Yu所著的關于深度學習的方法和應用的電子書

《Machine Learning Summer School 2014》

介紹:2014年七月CMU舉辦的機器學習夏季課剛剛結束 有近50小時的視訊、十多個PDF版幻燈片,覆寫 深度學習,貝葉斯,分布式機器學習,伸縮性 等熱點話題。所有13名講師都是牛人:包括大牛Tom Mitchell (他的[機器學習]是名校的常用教材),還有CMU李沐 .(1080P高清喲)

《Sibyl: 來自Google的大規模機器學習系統》

介紹:在今年的IEEE/IFIP可靠系統和網絡(DSN)國際會議上,Google軟體工程師Tushar Chandra做了一個關于Sibyl系統的主題演講。 Sibyl是一個監督式機器學習系統,用來解決預測方面的問題,比如YouTube的視訊推薦。詳情請閱讀google sibyl

《Building a deeper understanding of images》

介紹:谷歌研究院的Christian Szegedy在谷歌研究院的部落格上簡要地介紹了他們今年參加ImageNet取得好成績的GoogLeNet系統.是關于圖像處理的。

《Bayesian network 與python機率程式設計實戰入門》

介紹:貝葉斯學習。如果不是很清可看看機率程式設計語言與貝葉斯方法實踐

《AMA: Michael I Jordan》

介紹:網友問伯克利機器學習大牛、美國雙料院士Michael I. Jordan:”如果你有10億美金,你怎麼花?Jordan: “我會用這10億美金建造一個NASA級别的自然語言處理研究項目。”

《機器學習&資料挖掘筆記_16(常見面試之機器學習算法思想簡單梳理)》

介紹:常見面試之機器學習算法思想簡單梳理

《文本與資料挖掘視訊彙總》

介紹:Videolectures上最受歡迎的25個文本與資料挖掘視訊彙總

《怎麼選擇深度學習的GPUs》

介紹:在Kaggle上經常取得不錯成績的Tim Dettmers介紹了他自己是怎麼選擇深度學習的GPUs, 以及個人如何建構深度學習的GPU叢集: http://t.cn/RhpuD1G

《對話機器學習大神Michael Jordan:深度模型》

介紹:對話機器學習大神Michael Jordan

《Deep Learning 和 Knowledge Graph 引爆大資料革命》

介紹:還有2,3部分。http://blog.sina.com.cn/s/blog_46d0a3930101gs5h.html

《Deep Learning 教程翻譯》

介紹:是Stanford 教授 Andrew Ng 的 Deep Learning 教程,國内的機器學習愛好者很熱心的把這個教程翻譯成了中文。如果你英語不好,可以看看這個

《Deep Learning 101》

介紹:因為近兩年來,深度學習在媒體界被炒作很厲害(就像大資料)。其實很多人都還不知道什麼是深度學習。這篇文章由淺入深。告訴你深度學究竟是什麼!

《UFLDL Tutorial》

介紹:這是斯坦福大學做的一免費課程(很勉強),這個可以給你在深度學習的路上給你一個學習的思路。裡面提到了一些基本的算法。而且告訴你如何去應用到實際環境中。中文版

《Toronto Deep Learning Demos》

介紹:這是多倫多大學做的一個深度學習用來識别圖檔标簽/圖轉文字的demo。是一個實際應用案例。有源碼

《Deep learning from the bottom up》

介紹:機器學習模型,閱讀這個内容需要有一定的基礎。

《R工具包的分類彙總》

介紹: (CRAN Task Views, 34種常見任務,每個任務又各自分類列舉若幹常用相關工具包) 例如: 機器學習,自然語言處理,時間序列分析,空間資訊分析,多重變量分析,計量經濟學,心理統計學,社會學統計,化學計量學,環境科學,藥物代謝動力學 等

《機器學習常見算法分類彙總》

介紹: 機器學習無疑是目前資料分析領域的一個熱點内容。很多人在平時的工作中都或多或少會用到機器學習的算法。本文為您總結一下常見的機器學習算法,以供您在工作和學習中參考.

《Deep Learning(深度學習)學習筆記整理系列》

介紹: 很多幹貨,而且作者還總結了好幾個系列。另外還作者還了一個文章導航.非常的感謝作者總結。

Deep Learning(深度學習)學習筆記整理系列之(二)

Deep Learning(深度學習)學習筆記整理系列之(三)

Deep Learning(深度學習)學習筆記整理系列之(四)

Deep Learning(深度學習)學習筆記整理系列之(五)

Deep Learning(深度學習)學習筆記整理系列之(六)

Deep Learning(深度學習)學習筆記整理系列之(七)

DeepLearning(深度學習)學習筆記整理系列之(八)

《Tutorials Session A – Deep Learning for Computer Vision》

介紹:傳送理由:Rob Fergus的用深度學習做計算機是覺的NIPS 2013教程。有mp4, mp3, pdf各種下載下傳 他是紐約大學教授,目前也在Facebook工作,他2014年的8篇論文

《FudanNLP》

介紹:FudanNLP,這是一個複旦大學計算機學院開發的開源中文自然語言處理(NLP)工具包 Fudan NLP裡包含中文分詞、關鍵詞抽取、命名實體識别、詞性标注、時間詞抽取、文法分析等功能,對搜尋引擎 文本分析等極為有價值。

《Open Sourcing ml-ease》

介紹:LinkedIn 開源的機器學習工具包,支援單機, Hadoop cluster,和 Spark cluster 重點是 logistic regression 算法

《機器學習周刊》

介紹:對于英語不好,但又很想學習機器學習的朋友。是一個大的福利。機器學習周刊目前主要提供中文版,還是面向廣大國内愛好者,内容涉及機器學習、資料挖掘、并行系統、圖像識别、人工智能、機器人等等。謝謝作者

《線性代數》

介紹:《線性代數》是《機器學習》的重要數學先導課程。其實《線代》這門課講得淺顯易懂特别不容易,如果一上來就講逆序數及羅列行列式性質,很容易讓學生 失去學習的興趣。我個人推薦的最佳《線性代數》課程是麻省理工Gilbert Strang教授的課程。 課程首頁

《Big-data》

介紹:大資料資料處理資源、工具不完備清單,從架構、分布式程式設計、分布式檔案系統、鍵值資料模型、圖資料模型、資料可視化、列存儲、機器學習等。很贊的資源彙總。

《machine learning for smart dummies》

介紹:雅虎邀請了一名來自本古裡安大學的通路學者,制作了一套關于機器學習的系列視訊課程。本課程共分為7期,詳細講解了有關SVM, boosting, nearest neighbors, decision trees 等正常機器學習算法的理論基礎知識。

《Entanglement-Based Quantum Machine Learning》

介紹:應對大資料時代,量子機器學習的第一個實驗 paper 下載下傳

《How a Math Genius Hacked OkCupid to Find True Love》

介紹:Wired雜志報道了UCLA數學博士Chris McKinlay (圖1)通過大資料手段+機器學習方法破解婚戀網站配對算法找到真愛的故事,通過Python腳本控制着12個賬号,下載下傳了婚戀網站2萬女使用者的600萬 問題答案,對他們進行了統計抽樣及聚類分析(圖2,3),最後終于收獲了真愛。科技改變命運!

《Underactuated Robotics》

介紹:MIT的Underactuated Robotics于 2014年10月1日開課,該課屬于MIT研究所學生級别的課程,對機器人和非線性動力系統感興趣的朋友不妨可以挑戰一下這門課程!

《mllib實踐經驗(1)》

介紹:mllib實踐經驗分享

《Google Turns To Deep Learning Classification To Fight Web Spam》

介紹:Google用Deep Learning做的antispam(反垃圾郵件)

《NLP常用資訊資源》

介紹:NLP常用資訊資源* 《NLP常用資訊資源》

《機器學習速查表》

介紹:機器學習速查表

《Best Papers vs. Top Cited Papers in Computer Science》

介紹:從1996年開始在計算機科學的論文中被引用次數最多的論文

《InfiniTAM: 基于深度圖像的體資料內建架構》

介紹:把今年的一個ACM Trans. on Graphics (TOG)論文中的代碼整理為一個開源的算法架構,共享出來了。歡迎大家使用。可以實時的采集3D資料、重建出三維模型。Online learning,GPU Random forest,GPU CRF也會後續公開。

《Hacker’s guide to Neural Networks》

介紹:【神經網絡黑客指南】現在,最火莫過于深度學習(Deep Learning),怎樣更好學習它?可以讓你在浏覽器中,跑起深度學習效果的超酷開源項目convnetjs作者karpathy告訴你,最佳技巧是, 當你開始寫代碼,一切将變得清晰。他剛釋出了一本圖書,不斷線上更新

《Building a Production Machine Learning Infrastructure》

介紹:前Google廣告系統工程師Josh Wills 講述工業界和學術界機器學習的異同,大實話

《Deep Learning Sentiment Analysis for Movie Reviews using Neo4j》

介紹:使用Neo4j 做電影評論的情感分析。

《DeepLearning.University – An Annotated Deep Learning Bibliography》

介紹:不僅是資料,而且還對有些資料做了注釋。

《A primer on deeping learning》

介紹:深度學習入門的初級讀本

《Machine learning is teaching us the secret to teaching 》

介紹:機器學習教會了我們什麼?

《scikit-learn:用于機器學習的Python子產品》

介紹:scikit-learn是在SciPy基礎上建構的用于機器學習的Python子產品。

《對話機器學習大神Michael Jordan:解析領域中各類模型》

介紹:喬丹教授(Michael I. Jordan)教授是機器學習領域神經網絡的大牛,他對深度學習、神經網絡有着很濃厚的興趣。是以,很多提問的問題中包含了機器學習領域的各類模型,喬丹教授對此一一做了解釋和展望。

《A*搜尋算法的可視化短教程》

介紹:A*搜尋是人工智能基本算法,用于高效地搜尋圖中兩點的最佳路徑, 核心是 g(n)+h(n): g(n)是從起點到頂點n的實際代價,h(n)是頂點n到目标頂點的估算代價。合集

《基于雲的自然語言處理開源項目FudanNLP》

介紹:本項目利用了Microsoft Azure,可以在幾分種内完成NLP on Azure Website的部署,立即開始對FNLP各種特性的試用,或者以REST API的形式調用FNLP的語言分析功能

《吳立德《機率主題模型&資料科學基礎》》

介紹:現任複旦大學首席教授、計算機軟體博士生導師。計算機科學研究所副所長.内部課程

《機器學習入門資源不完全彙總》》

介紹:好東西的幹貨真的很多

《收集從2014年開始深度學習文獻》

介紹:從硬體、圖像到健康、生物、大資料、生物資訊再到量子計算等,Amund Tveit等維護了一個DeepLearning.University小項目:收集從2014年開始深度學習文獻,相信可以作為深度學習的起點,github

《EMNLP上兩篇關于股票趨勢的應用論文 》

介紹:EMNLP上兩篇關于stock trend 用到了deep model組織特征; Exploiting Social Relations and Sentiment for Stock Prediction用到了stock network。

《Bengio組(蒙特利爾大學LISA組)深度學習教程 》

介紹:作者是深度學習一線大牛Bengio組寫的教程,算法深入顯出,還有實作代碼,一步步展開。

《學習算法的Neural Turing Machine 》

介紹:許多傳統的機器學習任務都是在學習function,不過谷歌目前有開始學習算法的趨勢。谷歌另外的這篇學習Python程式的Learning to Execute也有相似之處

《Learning to Rank for Information Retrieval and Natural Language Processing》

介紹:作者是華為技術有限公司,諾亞方舟實驗室,首席科學家的李航博士寫的關于資訊檢索與自然語言處理的文章

《Rumor has it: Identifying Misinformation in Microblogs》

介紹:利用機用器學習在謠言的判别上的應用,此外還有兩個。一個是識别垃圾與虛假資訊的paper.還有一個是網絡輿情及其分析技術

《R機器學習實踐》

介紹:該課程是網易公開課的收費課程,不貴,超級便宜。主要适合于對利用R語言進行機器學習,資料挖掘感興趣的人。

《大資料分析:機器學習算法實作的演化》

介紹:本章中作者總結了三代機器學習算法實作的演化:第一代非分布式的, 第二代工具如Mahout和Rapidminer實作基于Hadoop的擴充,第三代如Spark和Storm實作了實時和疊代資料處理。BIG DATA ANALYTICS BEYOND HADOOP

《圖像處理,分析與機器視覺》

介紹:講計算機視覺的四部奇書(應該叫經典吧)之一,另外三本是Hartley的《多圖幾何》、Gonzalez的《數字圖像處理》、Rafael C.Gonzalez / Richard E.Woods 的《數字圖像處理》

《LinkedIn最新的推薦系統文章Browsemaps》

介紹:裡面基本沒涉及到具體算法,但作者介紹了CF在LinkedIn的很多應用,以及他們在做推薦過程中獲得的一些經驗。最後一條經驗是應該監控log資料的品質,因為推薦的品質很依賴資料的品質!

《初學者如何查閱自然語言處理(NLP)領域學術資料》

介紹:初學者如何查閱自然語言處理(NLP)領域學術資料

《樹莓派的人臉識别教程》

介紹:用樹莓派和相機子產品進行人臉識别

《利用深度學習與大資料建構對話系統 》

介紹:如何利用深度學習與大資料建構對話系統

《經典論文Leo Breiman:Statistical Modeling: The Two Cultures 》

介紹:Francis Bach合作的有關稀疏模組化的新綜述(書):Sparse Modeling for Image and Vision Processing,内容涉及Sparsity, Dictionary Learning, PCA, Matrix Factorization等理論,以及在圖像和視覺上的應用,而且第一部分關于Why does the l1-norm induce sparsity的解釋也很不錯。

《Reproducing Kernel Hilbert Space》

介紹:RKHS是機器學習中重要的概念,其在large margin分類器上的應用也是廣為熟知的。如果沒有較好的數學基礎,直接了解RKHS可能會不易。本文從基本運算空間講到Banach和Hilbert空間,深入淺出,一共才12頁。

《Hacker’s guide to Neural Networks》

介紹:許多同學對于機器學習及深度學習的困惑在于,數學方面已經大緻了解了,但是動起手來卻不知道如何下手寫代碼。斯坦福深度學習博士Andrej Karpathy寫了一篇實戰版本的深度學習及機器學習教程,手把手教你用Javascript寫神經網絡和SVM.

《【語料庫】語料庫資源彙總》

介紹:【語料庫】語料庫資源彙總

《機器學習算法之旅》

介紹:本文會過一遍最流行的機器學習算法,大緻了解哪些方法可用,很有幫助。

《Reproducible Research in Computational Science》

介紹:這個裡面有很多關于機器學習、信号處理、計算機視覺、深入學習、神經網絡等領域的大量源代碼(或可執行代碼)及相關論文。科研寫論文的好資源

《NYU 2014年的深度學習課程資料》

介紹:NYU 2014年的深度學習課程資料,有視訊

《計算機視覺資料集不完全彙總》

介紹:計算機視覺資料集不完全彙總

《Machine Learning Open Source Software》

介紹:機器學習開源軟體

《LIBSVM》

介紹:A Library for Support Vector Machines

《Support Vector Machines》

介紹:資料挖掘十大經典算法之一

《100 Best GitHub: Deep Learning》

介紹:github上面100個非常棒的項目

《加州大學歐文分校(UCI)機器學習資料集倉庫》

介紹:目前加州大學歐文分校為機器學習社群維護着306個資料集。查詢資料集

《Andrej Karpathy個人首頁》

介紹:Andrej Karpathy 是斯坦福大學Li Fei-Fei的博士生,使用機器學習在圖像、視訊語義分析領域取得了科研和工程上的突破,發的文章不多,但每個都很紮實,在每一個問題上都做到了state-of-art.

《Andrej Karpathy的深度強化學習示範》

介紹:Andrej Karpathy的深度強化學習示範,論文在這裡

《CIKM資料挖掘競賽奪冠算法-陳運文》

介紹:CIKM Cup(或者稱為CIKM Competition)是ACM CIKM舉辦的國際資料挖掘競賽的名稱。

《Geoffrey E. Hinton》

介紹:傑弗裡·埃弗裡斯特·辛頓 FRS是一位英國出生的計算機學家和心理學家,以其在神經網絡方面的貢獻聞名。辛頓是反向傳播算法和對比散度算法的發明人之一,也是深度學習的積極推動者.

《自然語言處理的深度學習理論與實際》

介紹:微軟研究院深度學習技術中心在CIKM2014 上關于《自然語言處理的深度學習理論與實際》教學講座的幻燈片

《用大資料和機器學習做股票價格預測》

介紹: 本文基于<支援向量機的高頻限價訂單的動态模組化>采用了 Apache Spark和Spark MLLib從紐約股票交易所的訂單日志資料建構價格運動預測模型。(股票有風險,投資謹慎)GitHub源代碼托管位址.

《關于機器學習的若幹理論問題》

介紹:徐宗本 院士将于熱愛機器學習的小夥伴一起探讨有關于機器學習的幾個理論性問題,并給出一些有意義的結論。最後通過一些執行個體來說明這些理論問題的實體意義和實際應用價值。

《深度學習在自然語言處理的應用》

介紹:作者還著有《這就是搜尋引擎:核心技術詳解》一書,主要是介紹應用層的東西

《Undergraduate machine learning at UBC》

介紹:機器學習課程

《人臉識别必讀的N篇文章》

介紹:人臉識别必讀文章推薦

《推薦系統經典論文文獻及業界應用》

介紹:推薦系統經典論文文獻

《人臉識别必讀的N篇文章》

介紹:人臉識别必讀文章推薦

《第十二屆中國”機器學習及其應用”研讨會PPT》

介紹:第十二屆中國”機器學習及其應用”研讨會PPT

《統計機器學習》

介紹:統計學習是關于計算機基于資料建構的機率統計模型并運用模型對資料進行預測和分析的一門科學,統計學習也成為統計機器學習。課程來自上海交通大學

《機器學習導論》

介紹:機器學習的目标是對計算機程式設計,以便使用樣本資料或以往的經驗來解決給定的問題.

《CIKM 2014主題報告的幻燈片》

介紹:CIKM 2014 Jeff Dean、Qi Lu、Gerhard Weikum的主題報告的幻燈片, Alex Smola、Limsoon Wong、Tong Zhang、Chih-Jen Lin的Industry Track報告的幻燈片

《人工智能和機器學習領域有趣的開源項目》

介紹:部分中文清單

《機器學習經典算法詳解及Python實作–基于SMO的SVM分類器》

介紹:此外作者還有一篇元算法、AdaBoost python實作文章

《Numerical Optimization: Understanding L-BFGS》

介紹:加州伯克利大學博士Aria Haghighi寫了一篇超贊的數值優化博文,從牛頓法講到拟牛頓法,再講到BFGS以及L-BFGS, 圖文并茂,還有僞代碼。強烈推薦。

《簡明深度學習方法概述(一)》

介紹:還有續集簡明深度學習方法概述(二)

《R language for programmers》

介紹:R語言程式員私人定制版

《谷歌地圖解密:大資料與機器學習的結合》

介紹:谷歌地圖解密

《空間資料挖掘常用方法》

介紹:空間資料挖掘常用方法

《Use Google’s Word2Vec for movie reviews》

介紹:Kaggle新比賽 ”When bag of words meets bags of popcorn“ aka ”邊學邊用word2vec和deep learning做NLP“ 裡面全套教程教一步一步用python和gensim包的word2vec模型,并在實際比賽裡面比調參數和清資料。 如果已裝過gensim不要忘更新

《PyNLPIR》

介紹:PyNLPIR提供了NLPIR/ICTCLAS漢語分詞的Python接口,此外Zhon提供了常用漢字常量,如CJK字元和偏旁,中文标點,拼音,和漢字正規表達式(如找到文本中的繁體字)

《深度卷積神經網絡下圍棋》

介紹:這文章說把最近模型識别上的突破應用到圍棋軟體上,打16萬張職業棋譜訓練模型識别功能。想法不錯。訓練後目前能做到不用計算,隻看棋盤就給出下一 步,大約10級棋力。但這篇文章太過樂觀,說什麼人類的最後一塊堡壘馬上就要跨掉了。話說得太早。不過,如果與别的軟體結合應該還有潛力可挖。@萬精油墨 綠

《NIPS審稿實驗》

介紹:UT Austin教授Eric Price關于今年NIPS審稿實驗的詳細分析,他表示,根據這次實驗的結果,如果今年NIPS重新審稿的話,會有一半的論文被拒。

《2014年最佳的大資料,資料科學文章》

介紹:KDNuggets分别總結了2014年14個閱讀最多以及分享最多的文章。我們從中可以看到多個主題——深度學習,資料科學家職業,教育和薪酬,學習資料科學的工具比如R和Python以及大衆投票的最受歡迎的資料科學和資料挖掘語言

《機器學習經典算法詳解及Python實作–線性回歸(Linear Regression)算法》

介紹:Python實作線性回歸,作者還有其他很棒的文章推薦可以看看

《2014中國大資料技術大會33位核心專家演講PDF》

介紹:2014中國大資料技術大會33位核心專家演講PDF下載下傳

《使用RNN和Paragraph Vector做情感分析》

介紹:這是T. Mikolov & Y. Bengio最新論文Ensemble of Generative and Discriminative Techniques for Sentiment Analysis of Movie Reviews ,使用RNN和PV在情感分析效果不錯,[項目代碼](https://github.com/mesnilgr/iclr15)公布在github(目 前是空的)。這意味着Paragraph Vector終于揭開面紗了嘛。

《NLPIR/ICTCLAS2015分詞系統大會上的技術演講 》

介紹:NLPIR/ICTCLAS2015分詞系統釋出與使用者交流大會上的演講,請更多朋友檢閱新版分詞吧。 我們實驗室同學的演講包括:孫夢姝-基于評論觀點挖掘的商品搜尋技術研究 李然-主題模型

《Machine Learning is Fun!》

介紹:Convex Neural Networks 解決維數災難

《CNN的反向求導及練習》

介紹:介紹CNN參數在使用bp算法時該怎麼訓練,畢竟CNN中有卷積層和下采樣層,雖然和MLP的bp算法本質上相同,但形式上還是有些差別的,很顯然在完成CNN反向傳播前了解bp算法是必須的。此外作者也做了一個資源集:機器學習,深度學習,視覺,數學等

《正規表達式優化成Trie樹 》

介紹:如果要在一篇文章中比對十萬個關鍵詞怎麼辦?Aho-Corasick 算法利用添加了傳回邊的Trie樹,能夠線上性時間内完成比對。 但如果比對十萬個正規表達式呢 ? 這時候可以用到把多個正則優化成Trie樹的方法,如日本人寫的 Regexp::Trie

《Deep learning Reading List》

介紹:深度學習閱讀清單

《Caffe》

介紹:Caffe是一個開源的深度學習架構,作者目前在google工作,作者首頁Yangqing Jia (賈揚清)

《GoogLeNet深度學習模型的Caffe複現 》

介紹:2014 ImageNet冠軍GoogLeNet深度學習模型的Caffe複現模型,GoogleNet論文.

《LambdaNet,Haskell實作的開源人工神經網絡庫 》

介紹:LambdaNetLambdaNet是由Haskell實作的一個開源的人工神經網絡庫,它抽象了網絡建立、訓練并使用了高階函數。該庫還提供了一組預定義函數,使用者可以采取多種方式組合這些函數來操作現實世界資料。

《百度餘凱&張潼機器學習視訊》

介紹:如果你從事網際網路搜尋,線上廣告,使用者行為分析,圖像識别,自然語言了解,或者生物資訊學,智能機器人,金融預測,那麼這門核心課程你必須深入了解。

《楊強在TEDxNanjing談智能的起源》

介紹:”人工智能研究分許多流派。其中之一以IBM為代表,認為隻要有高性能計算就可得到智能,他們的‘深藍’擊敗了世界象棋冠軍;另一流派認為智能來自 動物本能;還有個很強的流派認為隻要找來專家,把他們的思維用邏輯一條條寫下,放到計算機裡就行……” 楊強在TEDxNanjing談智能的起源

《深度RNN/LSTM用于結構化學習 0)序列标注Connectionist Temporal ClassificationICML06》

介紹:1)機器翻譯Sequence to Sequence NIPS14 2)成分句法GRAMMAR AS FOREIGN LANGUAGE

《Deep Learning實戰之word2vec》

介紹:網易有道的三位工程師寫的word2vec的解析文檔,從基本的詞向量/統計語言模型->NNLM->Log-Linear/Log- Bilinear->階層化Log-Bilinear,到CBOW和Skip-gram模型,再到word2vec的各種tricks,公式推導與 代碼,基本上是網上關于word2vec資料的大合集,對word2vec感興趣的朋友可以看看

《Machine learning open source software》

介紹:機器學習開源軟體,收錄了各種機器學習的各種程式設計語言學術與商業的開源軟體.與此類似的還有很多例如:DMOZ – Computers: Artificial Intelligence: Machine Learning: Software, LIBSVM — A Library for Support Vector Machines, Weka 3: Data Mining Software in Java, scikit-learn:Machine Learning in Python, Natural Language Toolkit:NLTK, MAchine Learning for LanguagE Toolkit, Data Mining – Fruitful and Fun, Open Source Computer Vision Library

《機器學習入門者學習指南》

介紹:作者是計算機研二(寫文章的時候,現在是2015年了應該快要畢業了),專業方向自然語言處理.這是一點他的經驗之談.對于入門的朋友或許會有幫助

《A Tour of Machine Learning Algorithms》

介紹:這是一篇關于機器學習算法分類的文章,非常好

《2014年的《機器學習日報》大合集》

介紹:機器學習日報裡面推薦很多内容,在這裡有一部分的優秀内容就是來自機器學習日報.

《 Image classification with deep learning常用模型》

介紹:這是一篇關于圖像分類在深度學習中的文章

《自動語音識别:深度學習方法》

介紹:作者與Bengio的兄弟Samy 09年合編《自動語音識别:核方法》 3)李開複1989年《自動語音識别》專著,其博導、94年圖靈獎得主Raj Reddy作序

《NLP中的中文分詞技術》

介紹: 作者是360電商技術組成員,這是一篇NLP在中文分詞中的應用

《Using convolutional neural nets to detect facial keypoints tutorial》

介紹: 使用deep learning的人臉關鍵點檢測,此外還有一篇AWS部署教程

《書籍推薦:Advanced Structured Prediction》

介紹: 由Sebastian Nowozin等人編纂MIT出版的新書《Advanced Structured Prediction》http://t.cn/RZxipKG ,彙集了結構化預測領域諸多牛文,涉及CV、NLP等領域,值得一讀。網上公開的幾章草稿:一,二,三,四,五

《An Introduction to Matrix Concentration Inequalities》

介紹: Tropp把數學家用高深裝逼的數學語言寫的矩陣機率不等式用初等的方法寫出來,是非常好的手冊,領域内的paper各種證明都在用裡面的結果。雖說是初等的,但還是非常的難

《The free big data sources you should know》

介紹: 不容錯過的免費大資料集,有些已經是耳熟能詳,有些可能還是第一次聽說,内容跨越文本、資料、多媒體等,讓他們伴你開始資料科學之旅吧,具體包 括:Data.gov、US Census Bureau、European Union Open Data Portal、Data.gov.uk等

《A Brief Overview of Deep Learning》

介紹: 谷歌科學家、Hinton親傳弟子Ilya Sutskever的深度學習綜述及實際建議

《A Deep Dive into Recurrent Neural Nets》

介紹: 非常好的讨論遞歸神經網絡的文章,覆寫了RNN的概念、原理、訓練及優化等各個方面内容,強烈推薦!本文作者Nikhil Buduma還有一篇Deep Learning in a Nutshell值得推薦

《機器學習:學習資源》

介紹:裡面融合了很多的資源,例如競賽,線上課程,demo,資料整合等。有分類

《Statistical foundations of machine learning》

介紹:《機器學習的統計基礎》線上版,該手冊希望在理論與實踐之間找到平衡點,各主要内容都伴有實際例子及資料,書中的例子程式都是用R語言編寫的。

《A Deep Learning Tutorial: From Perceptrons to Deep Networks》

介紹:IVAN VASILEV寫的深度學習導引:從淺層感覺機到深度網絡。高可讀

《Research priorities for robust and beneficial artificial intelligence》

介紹:魯棒及有益的人工智能優先研究計劃:一封公開信,目前已經有Stuart Russell, Tom Dietterich, Eric Horvitz, Yann LeCun, Peter Norvig, Tom Mitchell, Geoffrey Hinton, Elon Musk等人簽署The Future of Life Institute (FLI).這封信的背景是最近霍金和Elon Musk提醒人們注意AI的潛在威脅。公開信的内容是AI科學家們站在造福社會的角度,展望人工智能的未來發展方向,提出開發AI系統的 Verification,Validity, Security, Control四點要求,以及需要注意的社會問題。畢竟目前AI在經濟領域,法律,以及道德領域相關研究較少。其實還有一部美劇《疑犯追蹤》,介紹了AI 的演進從一開始的自我學習,過濾,圖像識别,語音識别等判斷危險,到第四季的時候出現了機器通過學習成長之後想控制世界的狀态。說到這裡推薦收看。

《metacademy》

介紹:裡面根據詞條提供了許多資源,還有相關知識結構,路線圖,用時長短等。号稱是”機器學習“搜尋引擎

《FAIR open sources deep-learning modules for Torch》

介紹:Facebook人工智能研究院(FAIR)開源了一系列軟體庫,以幫助開發者建立更大、更快的深度學習模型。開放的軟體庫在 Facebook 被稱作子產品。用它們替代機器學習領域常用的開發環境 Torch 中的預設子產品,可以在更短的時間内訓練更大規模的神經網絡模型。

《淺析人臉檢測之Haar分類器方法》

介紹:本文雖然是寫于2012年,但是這篇文章完全是作者的經驗之作。

《如何成為一位資料科學家》

介紹:本文是對《機器學習實戰》作者Peter Harrington做的一個訪談。包含了書中部分的疑問解答和一點個人學習建議。

(來源:亞馬遜)

繼續閱讀