天天看點

python詞頻統計完整步驟_python3如何進行詞頻統計

在做資料分析的時候需要對某些特定的元素進行統計,或者需要對一篇英文文章中的單詞出現頻率最高的5個單詞進行統計等。

工具/原料

ipython3

步驟一:統計序列中元素的頻率

1

1. 以序列中統計元素個數為例

新用随機數生成有重複的随機序列

python詞頻統計完整步驟_python3如何進行詞頻統計

2

2. 方法一建立空字典,循環周遊做判斷

python詞頻統計完整步驟_python3如何進行詞頻統計

3

2. 方法二建立一個以序列元素為鍵,值為0的字典

然後循環周遊判斷, 再根據字典排序找到頻率最高前五個元素

python詞頻統計完整步驟_python3如何進行詞頻統計

4

4. 方法三使用Collections下的Counter對象

Counter對象下的most_common()方法統計出頻率最高的元素

python詞頻統計完整步驟_python3如何進行詞頻統計

END

步驟2:統計一段文本中單詞出現的頻率

1

1. 先用正則表達把文本分割成單詞清單

python詞頻統計完整步驟_python3如何進行詞頻統計

2

2. 執行個體化Counter對象

再用Counter下的most_common方法統計單詞在文本中出現的頻率

python詞頻統計完整步驟_python3如何進行詞頻統計

END

經驗内容僅供參考,如果您需解決具體問題(尤其法律、醫學等領域),建議您詳細咨詢相關領域專業人士。

舉報作者聲明:本篇經驗系本人依照真實經曆原創,未經許可,謝絕轉載。

展開閱讀全部