天天看點

《NLTK基礎教程——用NLTK和Python庫建構機器學習應用》——1.5 小結

本節書摘來異步社群《nltk基礎教程——用nltk和python庫建構機器學習應用》一書中的第1章,第1.5節,作者:nitin hardeniya,更多章節内容可以通路雲栖社群“異步社群”公衆号檢視。

總而言之,本章緻力于為自然語言處理這一領域提供一份簡要概括。雖然,本書假定讀者在nlp領域,以及使用python程式設計方面具有一定的背景知識,但我們也提供了一份與python和nlp相關的快速入門。我們帶你安裝了所有在nltk工作中将會用到的程式。另外,我們還通過幾行簡單的代碼給你示範了nltk的使用思路。我們提供的是一個了不起的詞雲執行個體,這是在大量非結構化文本中進行可視化處理的一種好方法,同時也是文本分析領域中相當流行的一種運用。我們的目标是要圍繞着nltk建構起所需要的一切,并讓python在我們的系統上順利地工作。為此,你也應該要能編寫并運作基本的python程式。除此之外,我也希望讀者能親身感受一下nltk庫的魅力,自行建構出一個能實際運作的、涉及雲詞的小型應用程式。隻要讀者能順利地産生出雲詞,我們就認為自己功德圓滿了。

在接下來的幾章中,我們将更為詳細地了解python這門語言,及其與處理自然語言相關的特性。另外,我們還将探讨一些基本的nlp預處理步驟,并了解一些與nlp相關的基本概念。