PCA 主成分分析的執行個體程式

2023-06-24 12:32:08

import numpy as np
from sklearn.decomposition import PCA
from sklearn import datasets
import matplotlib
import matplotlib.pyplot as plt




#加載資料
data = np.loadtxt(open("./data/task1.csv","r"),delimiter=",",skiprows=0)
#設定主成分參數：pc個數，數值求解器的類型
pca = PCA(n_components=10, svd_solver='full')
#得到score vectors 
Data_transformed = pca.fit(data).transform(data)
#輸出第一個對象在first PC 上的值，即score vectors 的第一行
print(np.round(Data_transformed[0][0],3))
#2輸出第一個對象在second PC 上的值
print(np.round(Data_transformed[0][1],3))
#得到variance explained 
explained_variance = np.cumsum(pca.explained_variance_ratio_)

#3當使用前兩個主成分時的variance explained
print(np.round(explained_variance[1],3))

plt.plot(np.arange(10), np.round(explained_variance,3), ls = '-')
plt.show()
#4variance explained 大于0.85時應該使用前幾個主成分
for i in range(0,10):
    if explained_variance[i]>0.85:
        print(i+1)
        break
#5
plt.plot(Data_transformed[:60, 0], Data_transformed[:60, 1], 'o', markerfacecolor='red', markeredgecolor='k', markersize=8)
plt.show()

使用score vectors 和 loading vectors 重構原始圖像

import numpy as np
scores = np.genfromtxt('./data/task12_score.csv', delimiter=';')
loadings = np.genfromtxt('./data/task12_loading.csv', delimiter=';')
values = np.dot(scores,loadings.T)
import matplotlib.pyplot as plt
#1
plt.imshow(values, cmap='Greys_r')
plt.show()

PCA 主成分分析的執行個體程式

繼續閱讀

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

Small tricks

libsvm for python 安裝

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入