(一)基礎鋪墊
- 一進制非線性回歸分析(Univariate Nonlinear Regression)
- 在回歸分析中,隻包括一個自變量和一個因變量,且二者的關系可用一條曲線近似表示,則稱為一進制非線性回歸分析。
- 一進制二次方程:
y=a2x2+a1x1+a0x0
-
- 一進制三次方程:
y=a3x3+a2x2+a1x1+a0x0
-
- 一進制 n 次方程:
y=anxn+......+a1x1+a0x0
(二)案例-金融場景為例
産品編号 | 手續費(%) | 金融産品銷售額 |
---|---|---|
1 | 2.2 | 25.5 |
2 | 2.3 | 22.5 |
3 | 2.4 | 19.5 |
4 | 2.5 | 16.5 |
5 | 2.7 | 13.5 |
6 | 3.1 | 10.5 |
7 | 3.6 | 7.5 |
8 | 4.8 | 4.5 |
9 | 7.0 | 1.5 |
1.模組化邏輯
- 一進制非線性回歸方程轉為多元一次回歸方程
例如:y=a2x2+a1x1+a0x0
轉為:y=a2x¯2+a1x¯1+a0x¯0
資料分析部落公衆号(shujudata)
其中:
x¯0=x0
x¯1=x1
x¯2=x2
2.實操
- jacky關鍵點提示:把一進制非線性方程轉化為多元線性方程的方法
- 轉化的方法是PolynomialFeatures類
- 要确定是一進制幾次方程(從圖形中觀察),然後确定degree是幾(多少階的方程)
#---author:朱元祿---
import pandas
data = pandas.read_csv(
\'file:///Users/apple/Desktop/jacky_1.csv\',encoding=\'GBK\'
)
x = data[["手續費(%)"]]
y = data[["金融産品銷售額"]]
import matplotlib
font = {
\'family\':\'SimHei\'
}
matplotlib.rc(\'font\',**font)
matplotlib.rcParams[\'axes.unicode_minus\'] = False
from pandas.plotting import scatter_matrix
scatter_matrix(
data[["手續費(%)","金融産品銷售額"]],
alpha = 0.8,figsize =(10,10),diagonal = \'kid\'
)
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
pf = PolynomialFeatures(degree=2)
x_2_fit = pf.fit_transform(x)
lrModel = LinearRegression()
lrModel.fit(x_2_fit,y)
lrModel.score(x_2_fit,y)
x_2_predict = pf.fit_transform([9],[10])
lrModel.predict(x_2_predict)