特征提取 --- 中文文本特征抽取

2023-08-07 00:36:09

jieba库

ex_1

import jieba

def cut_word(text):
    text = ' '.join(list(jieba.cut(text)))
    return text
    
def cut_chinese_demo2():
    data = ["每一个公民的合法权利都值得守护",
            "每一个维权诉求都值得珍视。",
            "当且仅当举报渠道畅通无阻、",
            "解决问题马上就办，",
            "才能少一些惊诧眼球的“夸张举报”"]
    data_new = []
    for sen in data:
        data_new.append(cut_word(sen))
    transfer = CountVectorizer()
    data_final = transfer.fit_transform(data_new)
    print("data_new：\n", data_final.toarray())
    print("特征名字：\n", transfer.get_feature_names())

特征提取 --- 中文文本特征抽取

继续阅读

华为又对计算机视觉下手了！

回顾人工智能大爆炸的引爆点（The origin of the AI big bang）

alphaGo的前世今生，并不那么玄乎

AlphaGo：从直觉学习到整体知识

AI修复后的王祖贤和林青霞，真的是人间绝色啊

AI空前火爆，“智能时代”真的到来了吗？

【初创公司系列】Runway - 机器学习和人工智能彻底改变艺术与创意世界

AI—数据中毒

英国最新报告：40% AI公司其实没用任何AI技术40%的AI公司是假AI？打上AI标签，投资能多拿一半AI技术落地应用榜

阿里文娱永叔：利器or成本损耗？算法不是黑匣子

感知机(Perceptron) Python实现scikit-learn 方法

没错! AI已经开始“引领”服装潮流趋势了

用Matlab搞计算机视觉是怎样的体验？

人工智能有朝一日真的能取代人类教师吗?

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

人工智能如何有效地运用于自然语言处理