天天看點

Python回歸分析五部曲(三)—一進制非線性回歸

(一)基礎鋪墊

  • 一進制非線性回歸分析(Univariate Nonlinear Regression)
    • 在回歸分析中,隻包括一個自變量和一個因變量,且二者的關系可用一條曲線近似表示,則稱為一進制非線性回歸分析。
    • 一進制二次方程:

y=a2x2+a1x1+a0x0

    • 一進制三次方程:

y=a3x3+a2x2+a1x1+a0x0

    • 一進制 n 次方程:

y=anxn+......+a1x1+a0x0

(二)案例-金融場景為例

産品編号 手續費(%) 金融産品銷售額
1 2.2 25.5
2 2.3 22.5
3 2.4 19.5
4 2.5 16.5
5 2.7 13.5
6 3.1 10.5
7 3.6 7.5
8 4.8 4.5
9 7.0 1.5

1.模組化邏輯

  • 一進制非線性回歸方程轉為多元一次回歸方程

例如:y=a2x2+a1x1+a0x0

轉為:y=a2x¯2+a1x¯1+a0x¯0

資料分析部落公衆号(shujudata)

其中:

x¯0=x0

x¯1=x1

x¯2=x2

2.實操

  • jacky關鍵點提示:把一進制非線性方程轉化為多元線性方程的方法
    • 轉化的方法是PolynomialFeatures類
    • 要确定是一進制幾次方程(從圖形中觀察),然後确定degree是幾(多少階的方程)
#---author:朱元祿---
import pandas
data = pandas.read_csv(
    \'file:///Users/apple/Desktop/jacky_1.csv\',encoding=\'GBK\'
)

x = data[["手續費(%)"]]
y = data[["金融産品銷售額"]]

import matplotlib
font = {
    \'family\':\'SimHei\'
}
matplotlib.rc(\'font\',**font)
matplotlib.rcParams[\'axes.unicode_minus\'] = False
from pandas.plotting import scatter_matrix

scatter_matrix(
    data[["手續費(%)","金融産品銷售額"]],
    alpha = 0.8,figsize =(10,10),diagonal = \'kid\'
)

from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures

pf = PolynomialFeatures(degree=2)
x_2_fit = pf.fit_transform(x)

lrModel = LinearRegression()
lrModel.fit(x_2_fit,y)

lrModel.score(x_2_fit,y)

x_2_predict = pf.fit_transform([9],[10])
lrModel.predict(x_2_predict)
           
Python回歸分析五部曲(三)—一進制非線性回歸