Python資料分析——文本挖掘分詞，用jiaba擷取詞語的詞性

2023-07-26 07:24:36

分詞，用jiaba

# 分詞
import jieba
doc = '我喜歡上海東方明珠'
# 全模式；精準模式；搜尋引擎模式
w1 = jieba.cut(doc,cut_all=False) # 參數1：資料  參數2：模式 有三種模式，這裡使用了精準模式
for item in w1:
    print(item)

運作結果：

Building prefix dict from the default dictionary ...
Loading model from cache C:\Users\pc\AppData\Local\Temp\jieba.cache
我
喜歡
上海
東方明珠
Loading model cost 0.752 seconds.
Prefix dict has been built succesfully.

擷取詞語的詞性

import jieba.posseg
doc = '我喜歡上海東方明珠'
w2 = jieba.posseg.cut(doc)
# flag詞性
# word詞語
for item in w2:
    print(item.flag)

運作結果：

Building prefix dict from the default dictionary ...
Loading model from cache C:\Users\pc\AppData\Local\Temp\jieba.cache
Loading model cost 0.745 seconds.
Prefix dict has been built succesfully.
r
v
ns
nr

a：形容詞

c：連詞

d：副詞

e：歎詞

f：方位詞

i：成語

m：數詞

n：名詞

nr：人名

ns：地名

nt：機構團體

nz：其他專有名詞

p：介詞

r：代詞

t：時間

u：助詞

v：動詞

vn：動名詞

w：标點符号

un：未知詞語

詞典的加載

jieba.load_userdict('檔案名')

Python資料分析——文本挖掘分詞，用jiaba擷取詞語的詞性

分詞，用jiaba

擷取詞語的詞性

詞典的加載

繼續閱讀

來自python的【條件控制/語句循環/break/continue/else/pass】一、條件控制二、語句循環

無法解析的外部符号 wmain，該符号在函數 "void cdecl mainCRTStartupHelper(struct HINSTANCE *,unsigned short con......

TestLink導出用例轉換工具(XML2Excel)

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

Small tricks

libsvm for python 安裝

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入