線性回歸在整個财務中廣泛應用于衆多應用程式中。在之前的教程中,我們使用普通最小二乘法(OLS)計算了公司的beta與相對索引的比較。現在,我們将使用線性回歸來估計股票價格。
線性回歸是一種用于模拟因變量(y)和自變量(x)之間關系的方法。通過簡單的線性回歸,隻有一個自變量x。可能有許多獨立變量屬于多元線性回歸的範疇。在這種情況下,我們隻有一個自變量即日期。對于第一個日期上升到日期向量長度的整數,該日期将由1開始的整數表示,該日期可以根據時間序列資料而變化。當然,我們的因變量将是股票的價格。為了了解線性回歸,您必須了解您可能在學校早期學到的相當基本的等式。
y = a + bx
Y =預測值或因變量
b =線的斜率
x =系數或自變量
a = y截距
從本質上講,這将構成我們對資料的最佳拟合。在OLS過程中通過資料集繪制了大量線條。該過程的目标是找到最佳拟合線,最小化平方誤差和(SSE)與股票價格(y)的實際值以及我們在資料集中所有點的預測股票價格。這由下圖表示。對于繪制的每條線,資料集中的每個點與模型輸出的相應預測值之間存在差異。将這些差異中的每一個加起來并平方以産生平方和。從清單中,我們采用最小值導緻我們的最佳比對線。考慮下圖:
![](https://img.laitimes.com/img/_0nNw4CM6IyYiwiM6ICdiwiInBnauI2Y1QjN0IDM4ADO1MGZ0EDMhdzYyUTM0IjM2AjZ5gDZvwFOw0SOw0SOxAjMvwFbsVGaz9CXw9GblZXZk9CXlxWam9CXk9CX0VmbuMXZk92YyUjL3d3dvw1LcpDc0RHaiojIsJye.jpg)
第一部分:擷取資料:
from matplotlib import style
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
import quandl
import datetime
style.use('ggplot')
#Dates
start_date = datetime.date(2017,1,3)
t_date=start_date, end_date=end_date, collapse="daily")
df = df.reset_index()
prices = np.reshape(prices, (len(prices), 1))
第二部分:建立一個回歸對象:
', linewidth=3, label = 'Predicted Price') #plotting the line made by linear regression
plt.title('Linear Regression | Time vs. Price')
plt.legend()
predicted_price =regressor.predict(date)
輸出:
預測日期輸入價格:
建立訓練/測試集
et
xtrain, x , ytrain)
#Train
plt.title('Linear Regression | Time vs. Price')
#Test Set Graph
plt.scatter(xtest, ytest, color='yellow', label= 'Actual Price') #plotting the initial datapoints
plt.plot(xtest, regressor.predict(xtest), color='blue', linewidth=3, label = 'Predicted Price') #plotting
plt.show()
輸出:
測試集:
以上就是本文的全部内容,希望對大家的學習有所幫助,也希望大家多多支援腳本之家。
您可能感興趣的文章:Python程式設計實作使用線性回歸預測資料
Python線性回歸實戰分析
python程式設計線性回歸代碼示例
python實作機器學習之多元線性回歸
Python實作的簡單線性回歸算法執行個體分析
python實作簡單的單變量線性回歸方法
python實作機器學習之元線性回歸
8種用Python實作線性回歸的方法對比詳解
Python利用神經網絡解決非線性回歸問題執行個體詳解
python3 線性回歸驗證方法