特征提取 --- 中文文本特征抽取

2023-08-07 00:36:09

jieba庫

ex_1

import jieba

def cut_word(text):
    text = ' '.join(list(jieba.cut(text)))
    return text
    
def cut_chinese_demo2():
    data = ["每一個公民的合法權利都值得守護",
            "每一個維權訴求都值得珍視。",
            "當且僅當舉報管道暢通無阻、",
            "解決問題馬上就辦，",
            "才能少一些驚詫眼球的“誇張舉報”"]
    data_new = []
    for sen in data:
        data_new.append(cut_word(sen))
    transfer = CountVectorizer()
    data_final = transfer.fit_transform(data_new)
    print("data_new：\n", data_final.toarray())
    print("特征名字：\n", transfer.get_feature_names())

特征提取 --- 中文文本特征抽取

繼續閱讀

華為又對計算機視覺下手了！

回顧人工智能大爆炸的引爆點（The origin of the AI big bang）

alphaGo的前世今生，并不那麼玄乎

AlphaGo：從直覺學習到整體知識

AI修複後的王祖賢和林青霞，真的是人間絕色啊

AI空前火爆，“智能時代”真的到來了嗎？

【初創公司系列】Runway - 機器學習和人工智能徹底改變藝術與創意世界

AI—資料中毒

英國最新報告：40% AI公司其實沒用任何AI技術40%的AI公司是假AI？打上AI标簽，投資能多拿一半AI技術落地應用榜

阿裡文娛永叔：利器or成本損耗？算法不是黑匣子

感覺機(Perceptron) Python實作scikit-learn 方法

沒錯! AI已經開始“引領”服裝潮流趨勢了

用Matlab搞計算機視覺是怎樣的體驗？

人工智能有朝一日真的能取代人類教師嗎?

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

人工智能如何有效地運用于自然語言處理