天天看點

Ubuntu安裝anaconda做英文詞雲

1.詞雲是什麼?想必大家都見過這種圖檔,這就是詞雲啦

Ubuntu安裝anaconda做英文詞雲
Ubuntu安裝anaconda做英文詞雲
“詞雲”這個概念由美國西北大學新聞學副教授、新媒體專業主任裡奇·戈登(Rich Gordon)于近日提出。戈登做過編輯、記者,曾擔任邁阿密先驅報(Miami Herald)新媒體版的主任。他一直很關注網絡内容釋出的最新形式——即那些隻有網際網路可以采用而報紙、廣播、電視等其它媒體都望塵莫及的傳播方式。通常,這些最新的、最适合網絡的傳播方式,也是最好的傳播方式。 是以,“詞雲”就是對網絡文本中出現頻率較高的“關鍵詞”予以視覺上的突出,形成“關鍵詞雲層”或“關鍵詞渲染”,進而過濾掉大量的文本資訊,使浏覽網頁者隻要一眼掃過文本就可以領略文本的主旨。
                                 ----百度百科
           

2 . 那如何做詞雲呢,這些詞雲是怎麼生成的呢

現在,我們用Python這門非常熱門的程式設計語言來做詞雲,如果你之前沒有程式設計基礎,沒關系。從零開始,意味着我會教你如何安裝Python運作環境,一步步完成詞雲圖。希望你不要限于浏覽,而是親自動手嘗試一番。
           

3.環境的安裝

要使用Python,我們就需要安裝Python的運作環境,如果你和我一樣使用的是Ubuntu系統,那麼的你的系統就已經安裝了Python2.7和Python3.6的運作環境,在終端下輸入python2.7或python3即可啟動。

Ubuntu安裝anaconda做英文詞雲

但這隻是一個運作環境,我們知道Python是一門非常強大的語言,擁有非常多的庫。所有我們要做詞雲,也需要安裝一些庫.那麼我們最好是安裝一個工具包,這樣我們需要的庫,或者擴充包都包含了,不需要我們在安裝上花費太多的時間。

那麼我推薦,也是業内非常推薦的一款套裝,他就是大名鼎鼎的Anaconda

官方下載下傳位址:https://www.anaconda.com/download/

Ubuntu安裝anaconda做英文詞雲

但是這個位址下載下傳速度實在是慢得讓人抓狂,所有我給出這個下載下傳位址

清華大學開源軟體鏡像站:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/

按照對應的系統版本下載下傳即可。

這裡有一個版本選擇的問題我們是選擇Python2.7還是Python3呢

我推薦大家選Python3,也就是Anaconda3畢竟長江後浪推前浪

Ubuntu安裝anaconda做英文詞雲

我的是Ubuntu,下載下傳好的是一個以.sh結尾的腳步檔案。

打開終端,輸入

bash Anaconda3--Linux-x86_64.sh
           

按提示輸入回車,所有要求選擇yes/no的都選擇yes

騷等片刻,Anaconda就安裝好了。

接着我們打開終端,輸入

mkdir ciyun                  //建立一個專用的目錄(個人喜好)
cd ciyun
pip install wordcloud     //安裝詞雲wordcloud擴充包,做詞雲用的
//過程略 ....
pip list                      //輸出的結果下有wordcloud
           

一路下載下傳安裝,完成。如果沒有報錯,并且在恭喜你環境就配置好了。非常簡單是不是.

4.開始動手做詞雲

在開始之前,我們還需要分析的對象,也就是文本。因為中文的構成畢竟複雜,我們先選擇英文文本

我這次選擇的是馬丁路德金的我有一個夢想演講搞,大家可以去搜尋一下。把這個txt的文本放在我們建立的ciyun目錄下。我取名為dream_En.txt

在終端輸入

然後切換到我們建立的ciyun目錄,點選右上角的NEW,建立一個編輯器,名字随意,有些不用名字.輸入一下代碼

file = open('dream_En.txt')   //打開文本
text = file.read()              //讀取文本
text                        //輸出文本   按Shift+Enter執行代碼
           
Ubuntu安裝anaconda做英文詞雲

到這裡說明我們的資料沒有問題,接着我們需要使用wordcloud對文本進行分析

from wordcloud import WordCloud
wordcloud = WordCloud().generate(mytext)  //如果出現警告,忽略,不影響的
           
Ubuntu安裝anaconda做英文詞雲

把text用#注釋掉,防止幹擾。但是到這一步卻沒有輸出,但詞雲其實已經分析完成了,隻是沒有輸出

注意:如果你在這一步報了一個錯,比如

那麼是你的wordcloud沒有安裝好,回到終端檢查一下。

pip list            //看看輸出結果有沒有wordcloud,如果沒有,請繼續
pip install wordcloud     //安裝
           

接着,

%pylab inline
import matplotlib.pyplot as plt
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")      //忽略警告
           
Ubuntu安裝anaconda做英文詞雲

是不是很激動,一張英文詞雲就這樣做好了.簡單吧!

5.總結

wordcloud這個擴充包的功能非常多,大家發現,做出的詞雲與本文開頭的還是有一些差距的,那麼在後續的文章中我會一一講解。慢慢挖掘wordcloud的進階特性。