天天看點

五個非常實用的自然語言處理資源

如果你對自然語言處理方面的資源感興趣,請仔細閱讀本篇文章。

五個非常實用的自然語言處理資源

<a href="https://pages.dataiku.com/data-science-poc-1?utm_campaign=Data%20Science%20POC&amp;utm_source=kdnuggets-feb2018&amp;utm_medium=display%20ad"><b>運作資料科學POC</b><b>的7</b><b>個步驟</b></a>

網上有很多依靠深度學習方法的NLP資源,有一些資源理論深厚,十分經典,特别是斯坦福大學和牛津大學的NLP,其深度學習課程為:

但是如果你已經完成了這些,或已經在NLP中獲得了基礎并想要轉向一些實用資源,或者隻是對其他方法感興趣,希望這篇文章能對你有所幫助。

<b></b>

五個非常實用的自然語言處理資源

<b>1.</b>

<a href="http://www.nltk.org/book/"><b>用Python</b><b>進行自然語言處理—用自然語言工具包分析文本</b></a>

五個非常實用的自然語言處理資源

<b>2. </b>

<a href="https://insights.untapt.com/deep-learning-for-natural-language-processing-tutorials-with-jupyter-notebooks-ad67f336ce3f"><b>深度學習自然語言處理:Jupyter</b><b>筆記本課程</b></a>

這是一個Jupyter筆記本并附随Jon Krohn的關于NLP深度學習的一系列精彩視訊的回購協定。如果你有興趣觀看他的視訊(它是通過O’Reilly的Safari平台提供的)請注冊一個免費的10天試用版,。

Jon在這些筆記本和随附視訊中的主要内容包括:

1.預處理用于機器學習應用的自然語言資料;

2.将自然語言轉換為數字表示(使用word2vec);

3.通過訓練自然語言的深層學習模型進行預測;

4.在進階TensorFlow API Keras中應用先進的NLP方法;

5.通過調整超參數來提高深度學習模型的性能。

五個非常實用的自然語言處理資源

這是以筆記本的形式出現的另一套非常棒的教程,它遵循類似于上述Krohn的軌迹。Insight AI的Emmanuel

Ameisen分解了完成哪些任務需要執行哪些步驟,閱讀完本文後,您将知道如何:

1.收集、準備和檢查資料。

2.從建立簡單的模型開始,并在必要時過渡到深度學習。

3.解釋并了解你的模型,確定您實際上擷取的是資訊而不是噪音。

五個非常實用的自然語言處理資源
五個非常實用的自然語言處理資源

我們的CNN-LSTM模型的準确度比CNN模型高3%,但比LSTM模型差3.2%。同時,我們的LSTM-CNN模型比CNN模型的性能好8.5%,比LSTM模型好2.7%。

關于該項目的結果的可靠性,我暫時無法保證。但是,其創新的情感分析方式與混合在不同的神經網絡體系結構中搭配使用,使我将其納入該清單中,希望能對讀者有所啟發。

相關:

文章原标題《5 Fantastic

Practical Natural Language Processing Resources》

譯者:烏拉烏拉,審校:袁虎。