天天看點

3分鐘,看回歸分析模型怎麼做一、為什麼叫回歸?二、回歸模型有什麼用?三、如何進行回歸分析四、模型計算與解讀五、回歸分析模型應用六、回歸分析局限性

作者:人人都是産品經理

編者按:回歸分析模型用于進行預測,但在資料分析中,預測可分為連續預測和分類預測。作者從一個簡單的線性回歸開始,分析模型的用途及其使用方式,與您分享,并進行檢視。

3分鐘,看回歸分析模型怎麼做一、為什麼叫回歸?二、回歸模型有什麼用?三、如何進行回歸分析四、模型計算與解讀五、回歸分析模型應用六、回歸分析局限性

大家好,我是一個愛學的小熊妹。總有一些小夥伴想要檢視分析模型,我們從最簡單的回歸分析模型開始。回歸分析是所有分析模型中最明顯和最容易了解的,回歸分析具有許多不斷變化的模式,可以應用于許多問題場景。今天讓我們來看看。

<h1頭條起源"h2">,為什麼叫回歸?</h1>

回歸,最初是一位統計學家,注意到孩子的身高總是接近平均身高,即使他們的父母很高,他們的孩子也不會無限期地長高。從這些研究來看,回歸分析方法(回歸,也有一個含義:退化,可以說是很形象的)。

是以,這裡的"回歸"隻是一個習慣性的名字,而業務機關口中的"回歸原心""回歸原點"一角錢的關系則不然!在讨論問題時,業務部門喜歡拉"回歸",做資料夥伴,不要被繞過!!!

回歸模型<h1 toutiao-origin">2有什麼用?</h1>

回歸模型用于執行:預測。在資料分析中,預測分為兩種類型:

連續預測:例如,預測銷售額為3550萬,預測客戶為15萬,預測為連續數字。

分類預測:例如,預期使用者接聽電話/不接電話,新産品預計在A/B級/C級之後上市,預測結果不是連續數,而是分類結果。

大多數回歸分析模型都是連續預測(邏輯回歸除外)。今天,從對一個變量進行最簡單的線性回歸分析開始。

< h1頭條起源"h2">iii,如何進行回歸分析</h1>

回歸分析有五個步驟:

步驟 1:确認這是一個預測問題

步驟 2:确定要預測的因變量,以及影響預測結果的參數

步驟 3:收集資料并驗證資料之間的關系

步驟4:計算模型,測試結果

第 5 步:進行預測

看一個具體的問題場景:一家公司會提前把新産品推向市場,并進行預約。雖然最終上市後,不僅預訂使用者要購買,但如果能通過預訂數量,預測銷量,就可以預先判斷産品是否會受歡迎,進而控制庫存情況。具體資料如下表所示。

3分鐘,看回歸分析模型怎麼做一、為什麼叫回歸?二、回歸模型有什麼用?三、如何進行回歸分析四、模型計算與解讀五、回歸分析模型應用六、回歸分析局限性

一旦你遇到問題,請逐漸:步驟1:場景需要預測,銷售預測和連續變量。步驟2:确認因變量,參數。在這個問題中:

因變量(待預測):銷售額

參數(影響預測結果):約會數

沒有其他變量。

一旦資料可用,就可以确定兩個名額是否具有以及具有何種關系,進而選擇适當的模型。判斷關系的最簡單、最快捷的方法是散點圖。是以,獲得資料後,可以先執行散點圖。如上圖所示,因變量和參數之間似乎存在明顯的線性關系,是以可以使用線性回歸。

步驟3:收集資料,該主題已幫助收集,繼續下一步。

步驟4:進行計算。簡單的線性回歸,使用 excel →資料分析→回歸計算(見下圖)。

3分鐘,看回歸分析模型怎麼做一、為什麼叫回歸?二、回歸模型有什麼用?三、如何進行回歸分析四、模型計算與解讀五、回歸分析模型應用六、回歸分析局限性

至于模型解釋,稍微複雜一點,我們慢慢看哦

< h1頭條原點"h2">、模型計算和解釋</h1>

回歸分析對模型的解釋稍微複雜一些,并且包含了大量的假設檢驗知識,這裡先不去探索其複雜的原理,給出一個簡單的原理判斷,小夥伴可以複制起來就可以使用了。模型解釋分為三個部分:

模型本身是不可預測的。主要看R平方(下面的藍色)。

模型作為一個整體是否有效。主要檢視 F 測試的結果(下圖橙色)。

在模型中,每個因變量的測試結果(下面綠色)。

3分鐘,看回歸分析模型怎麼做一、為什麼叫回歸?二、回歸模型有什麼用?三、如何進行回歸分析四、模型計算與解讀五、回歸分析模型應用六、回歸分析局限性

從上圖可以看出,此模組化的所有三個測試結果都通過,表明該模型可用。這次模組化隻有一個參數加一個常量,是以最終模型是 y-60-5x。常量項和參數的值,請參閱下圖的黃色部分。

3分鐘,看回歸分析模型怎麼做一、為什麼叫回歸?二、回歸模型有什麼用?三、如何進行回歸分析四、模型計算與解讀五、回歸分析模型應用六、回歸分析局限性

<h1頭條原點"h2">五、回歸分析模型應用</h1>

使用回歸模型,我們可以預測未來。例如,有一個新産品,預訂人數為45,000人,可以用模型替換,預測銷售量為60加5×4.5×825,000,商品部門可以相應地準備。

< h1頭條原點"h2">,回歸分析局限性</h1>

沒有模型是lmsy的,回歸分析突出了兩個弱點:

倒退并不意味着因果關系!不是因果關系!不是因果關系!回歸模型隻能從資料中來描述:兩個變量之間存在關系,但在實踐中沒有關系,這取決于具體的業務情況。是以不要亂來。

模型測試可能很難通過。為了示範友善,本文選擇的資料非常漂亮,使這三項測試全部通過,但實際情況會很複雜,有各種檢測不通過的情況,是以也推導出了更多、更複雜的知識點,這我們稍後慢慢分享。

其實本文隻是一個開始,回歸分析有了更多的應用,比如邏輯回歸用來預測使用者響應/非響應,用來預測時間序列自回歸的時間趨勢等等,小夥伴首先了解了回歸分析的基本概念,我們再深入一點。

作者:代碼工作者Cub,微信公衆号:代碼工作者Cub

本文最初由 Coder Cubs 釋出,未經許可,禁止向所有産品經理轉載。

該圖來自 pexels,基于 CC0 協定

繼續閱讀