sklearn .feature_extraction.text.TfidVectorizer.fit_transform(text)

2023-03-22 02:21:16

def normal_test():
    from sklearn.feature_extraction.text import TfidfVectorizer
    corpus = [
     'This is the first document.',
     'This document is the second document.',
    ]  
    vectorizer = TfidfVectorizer() 
    X = vectorizer.fit_transform(corpus)
    print(X)

output:

(0, 0)        0.40909010368335985
  (0, 1)        0.5749618667993135
  (0, 4)        0.40909010368335985
  (0, 2)        0.40909010368335985
  (0, 5)        0.40909010368335985
  (1, 3)        0.4691317250431934
  (1, 0)        0.6675821723880022
  (1, 4)        0.3337910861940011
  (1, 2)        0.3337910861940011
  (1, 5)        0.3337910861940011

sklearn .feature_extraction.text.TfidVectorizer.fit_transform(text)

功能解析：

計算每個詞在其所在的文章中的tf_idf，即逆文檔詞頻。

sklearn .feature_extraction.text.TfidVectorizer.fit_transform(text)

繼續閱讀

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

Small tricks

libsvm for python 安裝

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

無人機--飛控科普

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入