細說回歸分析-tft每日頭條

細說回歸分析

科技更新时间:2026-01-09 19:57:34

細說回歸分析（7個回歸分析方法）1

什麼是回歸分析？

回歸分析是一種預測性的建模技術，它研究的是因變量（目标）和自變量（預測器）之間的關系。這種技術通常用于預測分析、時間序列模型以及發現變量之間的因果關系。例如，司機的魯莽駕駛與道路交通事故數量之間的關系，最好的研究方法就是回歸。

回歸分析是建模和分析數據的重要工具。在這裡，我們使用曲線/線來拟合這些數據點，在這種方式下，從曲線或線到數據點的距離差異最小。我會在接下來的部分詳細解釋這一點。

細說回歸分析（7個回歸分析方法）2

我們為什麼使用回歸分析？

如上所述，回歸分析估計了兩個或多個變量之間的關系。下面，讓我們舉一個簡單的例子來理解它：比如說，在當前的經濟條件下，你要估計一家公司的銷售額增長情況。現在，你有公司最新的數據，這些數據顯示出銷售額增長大約是經濟增長的2.5倍。那麼使用回歸分析，我們就可以根據當前和過去的信息來預測未來公司的銷售情況。

使用回歸分析的好處良多。具體如下：

它表明自變量和因變量之間的顯著關系
它表明多個自變量對一個因變量的影響強度

回歸分析也允許我們去比較那些衡量不同尺度的變量之間的相互影響，如價格變動與促銷活動數量之間聯系。這些有利于幫助市場研究人員，數據分析人員以及數據科學家排除并估計出一組最佳的變量，用來構建預測模型。

我們有多少種回歸技術？

有各種各樣的回歸技術用于預測。這些技術主要有三個度量（自變量的個數，因變量的類型以及回歸線的形狀）。我們将在下面的部分詳細讨論它們。

對于那些有創意的人，如果你覺得有必要使用上面這些參數的一個組合，你甚至可以創造出一個沒有被使用過的回歸模型。但在你開始之前，先了解如下最常用的回歸方法：

1. 線性回歸（Linear Regression）

它是最為人熟知的建模技術之一。線性回歸通常是人們在學習預測模型時首選的技術之一。在這種技術中，因變量是連續的，自變量可以是連續的也可以是離散的，回歸線的性質是線性的。

線性回歸使用最佳的拟合直線（也就是回歸線）在因變量（Y）和一個或多個自變量（X）之間建立一種關系。

用一個方程式來表示它，即 Y=a b*X e，其中a表示截距，b表示直線的斜率，e是誤差項。這個方程可以根據給定的預測變量（s）來預測目标變量的值。

細說回歸分析（7個回歸分析方法）3

一元線性回歸和多元線性回歸的區别在于，多元線性回歸有（>1）個自變量，而一元線性回歸通常隻有1個自變量。現在的問題是：我們如何得到一個最佳的拟合線呢？

這個問題可以使用最小二乘法輕松地完成。最小二乘法也是用于拟合回歸線最常用的方法。對于觀測數據，它通過最小化每個數據點到線的垂直偏差平方和來計算最佳拟合線。因為在相加時，偏差先平方，所以正值和負值沒有抵消。

細說回歸分析（7個回歸分析方法）4

我們可以使用R-square指标來評估模型性能。

要點：

自變量與因變量之間必須有線性關系
多元回歸存在多重共線性，自相關性和異方差性
線性回歸對異常值非常敏感。它會嚴重影響回歸線，最終影響預測值

多重共線性會增加系數估計值的方差，使得在模型輕微變化下，估計非常敏感。結果就是系數估計值不穩定，在多個自變量的情況下，我們可以使用向前選擇法，向後剔除法和逐步篩選法來選擇最重要的自變量。

2. 邏輯回歸（Logistic Regression）

邏輯回歸是用來計算“事件=Success”和“事件=Failure”的概率。當因變量的類型屬于二元（1 / 0，真/假，是/否）變量時，我們就應該使用邏輯回歸。這裡，Y的值從0到1，它可以用下方程表示。

odds= p/ (1-p) = probability of event occurrence / probability of not event occurrence

ln(odds) = ln(p/(1-p))

logit(p) = ln(p/(1-p)) = b0 b1X1 b2X2 b3X3.... bkXk

上述式子中，p表述具有某個特征的概率。你應該會問這樣一個問題：我們為什麼要在公式中使用對數log呢？

因為在這裡我們使用的是的二項分布（因變量），我們需要選擇一個對于這個分布最佳的連結函數。它就是Logit函數。在上述方程中，通過觀測樣本的極大似然估計值來選擇參數，而不是最小化平方和誤差（如在普通回歸使用的）。

要點：

它廣泛的用于分類問題。
邏輯回歸不要求自變量和因變量是線性關系。它可以處理各種類型的關系，因為它對預測的相對風險指數OR使用了一個非線性的log轉換。

為了避免過拟合和欠拟合，我們應該包括所有重要的變量。有一個很好的方法來确保這種情況，就是使用逐步篩選方法來估計邏輯回歸。它需要大的樣本量，因為在樣本數量較少的情況下，極大似然估計的效果比普通的最小二乘法差。

自變量不應該相互關聯的，即不具有多重共線性。然而，在分析和建模中，我們可以選擇包含分類變量相互作用的影響。

如果因變量的值是定序變量，則稱它為序邏輯回歸
如果因變量是多類的話，則稱它為多元邏輯回歸

3. 多項式回歸（Polynomial Regression）

對于一個回歸方程，如果自變量的指數大于1，那麼它就是多項式回歸方程。如下方程所示：y=a b*x^2

在這種回歸技術中，最佳拟合線不是直線。而是一個用于拟合數據點的曲線。

細說回歸分析（7個回歸分析方法）5

重點：

雖然會有一個誘導可以拟合一個高次多項式并得到較低的錯誤，但這可能會導緻過拟合。你需要經常畫出關系圖來查看拟合情況，并且專注于保證拟合合理，既沒有過拟合又沒有欠拟合。

下面是一個圖例，可以幫助理解：

細說回歸分析（7個回歸分析方法）6

明顯地向兩端尋找曲線點，看看這些形狀和趨勢是否有意義。更高次的多項式最後可能産生怪異的推斷結果。

4. 逐步回歸（Stepwise Regression）

在處理多個自變量時，我們可以使用這種形式的回歸。在這種技術中，自變量的選擇是在一個自動的過程中完成的，其中包括非人為操作。

這一壯舉是通過觀察統計的值，如R-square，t-stats和AIC指标，來識别重要的變量。逐步回歸通過同時添加/删除基于指定标準的協變量來拟合模型。下面列出了一些最常用的逐步回歸方法：

标準逐步回歸法做兩件事情。即增加和删除每個步驟所需的預測。
向前選擇法從模型中最顯著的預測開始，然後為每一步添加變量。
向後剔除法與模型的所有預測同時開始，然後在每一步消除最小顯着性的變量。

這種建模技術的目的是使用最少的預測變量數來最大化預測能力。這也是處理高維數據集的方法之一。

5. 嶺回歸（Ridge Regression）

嶺回歸分析是一種用于存在多重共線性（自變量高度相關）數據的技術。在多重共線性情況下，盡管最小二乘法（OLS）對每個變量很公平，但它們的差異很大，使得觀測值偏移并遠離真實值。嶺回歸通過給回歸估計上增加一個偏差度，來降低标準誤差。

上面，我們看到了線性回歸方程。還記得嗎？它可以表示為：y=a b*x

這個方程也有一個誤差項。完整的方程是：

y=a b*x e (error term), [error term is the value needed to correct for a prediction error between the observed and predicted value]

=> y=a y= a b1x1 b2x2 .... e, for multiple independent variables.

在一個線性方程中，預測誤差可以分解為2個子分量。一個是偏差，一個是方差。預測錯誤可能會由這兩個分量或者這兩個中的任何一個造成。在這裡，我們将讨論由方差所造成的有關誤差。

嶺回歸通過收縮參數λ（lambda）解決多重共線性問題。看下面的公式：

在這個公式中，有兩個組成部分。第一個是最小二乘項，另一個是β2（β-平方）的λ倍，其中β是相關系數。為了收縮參數把它添加到最小二乘項中以得到一個非常低的方差。

要點：

除常數項以外，這種回歸的假設與最小二乘回歸類似；它收縮了相關系數的值，但沒有達到零，這表明它沒有特征選擇功能，這是一個正則化方法，并且使用的是L2正則化。

6. 套索回歸（Lasso Regression）

它類似于嶺回歸。Lasso （Least Absolute Shrinkage and Selection Operator）也會懲罰回歸系數的絕對值大小。此外，它能夠減少變化程度并提高線性回歸模型的精度。看看下面的公式：

Lasso 回歸與Ridge回歸有一點不同，它使用的懲罰函數是絕對值，而不是平方。這導緻懲罰（或等于約束估計的絕對值之和）值使一些參數估計結果等于零。使用懲罰值越大，進一步估計會使得縮小值趨近于零。這将導緻我們要從給定的n個變量中選擇變量。

要點：

除常數項以外，這種回歸的假設與最小二乘回歸類似
它收縮系數接近零（等于零），确實有助于特征選擇
這是一個正則化方法，使用的是L1正則化

如果預測的一組變量是高度相關的，Lasso 會選出其中一個變量并且将其它的收縮為零。

7. 回歸（ElasticNet）

ElasticNet是Lasso和Ridge回歸技術的混合體。它使用L1來訓練并且L2優先作為正則化矩陣。當有多個相關的特征時，ElasticNet是很有用的。Lasso 會随機挑選他們其中的一個，而ElasticNet則會選擇兩個。

Lasso和Ridge之間的實際的優點是，它允許ElasticNet繼承循環狀态下Ridge的一些穩定性。

要點：

在高度相關變量的情況下，它會産生群體效應
選擇變量的數目沒有限制
它可以承受雙重收縮

除了這7個最常用的回歸技術，你也可以看看其他模型，如Bayesian、Ecological和Robust回歸。

如何正确選擇回歸模型？

當你隻知道一個或兩個技術時，生活往往很簡單。我的老師曾告訴我，如果結果是連續的，就使用線性回歸。如果是二元的，就使用邏輯回歸！然而，在我們的處理中，可選擇的越多，選擇正确的一個就越難。類似的情況下也發生在回歸模型中。

在多類回歸模型中，基于自變量和因變量的類型，數據的維數以及數據的其它基本特征的情況下，選擇最合适的技術非常重要。以下是你要選擇正确的回歸模型的關鍵因素：

1. 數據探索是構建預測模型的必然組成部分

在選擇合适的模型時，比如識别變量的關系和影響時，它應該首選的一步。

2. 比較适合于不同模型的優點，我們可以分析不同的指标參數

如統計意義的參數，R-square，Adjusted R-square，AIC，BIC以及誤差項，另一個是Mallows' Cp準則。這個主要是通過将模型與所有可能的子模型進行對比（或謹慎選擇他們），檢查在你的模型中可能出現的偏差。

3. 交叉驗證是評估預測模型最好額方法

在這裡，将你的數據集分成兩份（一份做訓練和一份做驗證）。使用觀測值和預測值之間的一個簡單均方差來衡量你的預測精度。

4. 如果你的數據集是多個混合變量，那麼你就不應該選擇自動模型選擇方法，因為你應該不想在同一時間把所有變量放在同一個模型中。

5. 它也将取決于你的目的

可能會出現這樣的情況，一個不太強大的模型與具有高度統計學意義的模型相比，更易于實現。

6. 回歸正則化方法（Lasso，Ridge和ElasticNet）在高維和數據集變量之間多重共線性情況下運行良好。

細說回歸分析（7個回歸分析方法）7

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技綠聯無線充電器15w評測
自從蘋果手機支持PD18W快充并且開放了MFi認證授權之後，各個品牌的MFi認證數據線、PD充電器如同雨後春筍般冒了出來，越來越多的數碼配件廠商加入到這場快充争奪戰中，而在這麼多快充産品中，有部分PD充電器出現了兼容穩定性的問題，充iPho... 2022-11-16
科技櫃台買票可以手機退票嗎
說端午節馬上就要到了，那每到一個節假日呢，外出打工的人可能都會選擇回家過節，或者是家裡條件好的人，每到節假日呢也會選擇出門旅行，遊玩兒。那麼，無論是回家還是出門呢，我們都需要購買車票。那今天呢就給大家分享一下我們在手機上如何購買火車票。以及... 2022-12-23
科技槽式鍍鋅橋架規格标準
鍍鋅托盤式電纜橋架是半密封型，材質是鋼制金屬，它跟鍍鋅槽式電纜橋架的樣子非常相似，他的散熱性能會比鍍鋅槽式電纜橋架好主要源于底部打孔增強散熱，并且一樣具有良好防信号幹擾和防塵效果，常用在控制電纜、通信電纜水平式敷設用或垂直敷設用，并且用于動... 2022-12-07
科技 vivoY75A支持多大的儲存卡
vivoY75A支持多大的儲存卡?vivoY75A支持最大256G的内存卡vivoY75A是vivo于2017年12月推出的一款全面屏手機vivoY75A搭配了5.7英寸大屏幕，極窄的上下邊框帶來了83.6%超高屏占比；在背部設計上，viv... 2022-06-15
科技超微主闆加内存條
SuperMicro超微這個名字很多人可能不熟悉，因為它主要活躍在服務器、數據中心企業市場，尤其是服務器主闆和系統産品聞名遐迩，但其實它也曾經在消費級遊戲市場混過，隻不過因為種種原因離開了十幾年。現在，超微正準備重新返回遊戲主闆領域，因為在... 2023-03-05
科技分析液壓系統發生故障的主要原因
液壓系統出現故障是什麼原因引起的？該從哪些方面進行判斷呢？液壓系統故障診斷的主要内容是根據故障現象的特征，借助各種有效手段，找出故障發生的真正原因，弄清故障機制，有效排除故障，并通過總結不斷積累豐富經驗，為預防故障的在發生以及今後排除類似故... 2022-11-28
科技學生最适合用什麼筆記本電腦
相信很多人讀大一的時候在買筆記本電腦上都踩過坑，總是拿着不菲的高價錢買了一款配置極低的筆記本電腦。在這裡我也不例外，在我當年剛高三畢業的暑假，當時興沖沖地跑去電腦城選購電腦，電腦之多簡直五花八門。當時在推銷人員的吹噓下花了六千多大洋買了一台... 2023-01-22
科技手機錄屏功能的詳細講解
相信大家平時都會用到很多非常好用的錄屏方法，但是自帶的錄屏功能，你用過嗎？接下來就帶各位一起看看吧，希望可以幫到你哦！一、手機錄屏1.手機自帶錄屏首先，我們可以使用手機自帶的錄屏功能，例如華為手機，下拉通知欄後，就可以看到屏幕錄制按鈕，幫助... 2023-03-29
科技 win10電腦系統點擊設置閃退
Win10系統打開文件夾後閃退怎麼辦？近日一個用戶反映，每次打開文件夾的時候都會出現閃退的問題，這是怎麼回事呢？下面就給大家分享解決Win10系統打開文件夾閃退的方法。解決辦法：1、使用winx快捷鍵，直接打開菜單，并選擇“控制面闆”。2、... 2023-04-03
科技成龍快手一哥
6月22日，快手正式宣布稱，功夫巨星成龍将在快手開啟其個人全球直播首秀，時間将定在6月25日晚8點。據了解，此次直播是成龍出道60年以來的首次個人直播，此次直播還将通過快手海外版Kwai、SnackVideo，面向全球用戶同步多語言直播，将... 2023-01-03
科技崩壞3有沒有關服過
近日，一款名為《羊了個羊》的微信小遊戲突然在網上走紅。9月14日，“羊了個羊”話題再度登頂微博熱搜。根據官方介紹，這是一款超難的闖關消除小遊戲，通關率不到0.1%。在玩法上，遊戲利用各種道具和提示來消除每一個關卡當中的障礙和陷阱。玩家們需要... 2022-10-25
科技魔獸最新dps單體排行榜
魔獸世界8.1版本《複仇之潮》中，大多數玩家都會根據各種族的強度選擇主玩哪一個角色，創建新種族時往往是作為小号來玩，但随着版本的不斷更叠，魔獸8.15版本橫空出世，一個史上最強的種族贊達拉巨魔進入到玩家們的視線當中，即使在測試服已經削弱了三... 2022-11-13
科技急診網上可以挂号嗎
運城市第一醫院互聯網醫院急診科挂号已于5月1日正式上線，患者可通過手機關注“山西省運城市第一醫院”服務号看互聯網門診，具體操作流程詳見下方圖解運城市第一醫院服務号操作說明一就診人進入山西省運城市第一醫院服務号點擊下方互聯網醫院進入界面一點擊... 2023-03-05
科技 5G步入規模化應用關鍵期
5G步入規模化應用關鍵期?工業和信息化部正式發放5G商用牌照已滿3年在适度超前原則下，我國5G建設加速前行，已進入規模化應用發展的關鍵時期，下面我們就來說一說關于5G步入規模化應用關鍵期?我們一起去了解并探讨一下這個問題吧!5G步入規模化應... 2022-10-30
科技第三個全球衛星系統的國家
世界上哪些國家有完全自主的衛星發射技術和衛星導航系統？世界上能自主發射衛星的國家有7個，自主衛星導航系統隻有四個。人造衛星的發射與應用是現代空間技術的重要内容之一，也是人類走向太空的一大步，更是衡量一個國家科技現代化程度的重要标志。人造衛星... 2023-02-09
科技安卓舊蘋果手機怎麼轉移數據
用簡單的話說不平凡的互聯網科技----互聯網雲科技喜歡本文的就“點贊”“關注”一下吧，長得美的都關注了，你還在等什麼！現在的智能手機更換頻率很多，很多人基本2年換一部手機。然而現在的手機市場安卓和iOS是兩個完全不同的系統，當我們從安卓手機... 2023-03-13
科技戴了這麼久的手表今天才明白說說
借着可穿戴設備的東風，智能手表發展突飛猛進，以至于很多用戶都忘記機械表的存在，對于那些科技大佬他們更愛什麼樣的手表呢？現在美國BI就彙總了目前科技圈大佬佩戴的一些手表，其中有些人的選擇還是讓人很意外的。1、美女CEO瑪麗莎·梅耶爾，佩戴的手... 2023-01-03
科技雪亮工程工程量清單
“雪亮工程”是落實黨中央“數字中國”、省“數字江淮”決策部署的重要發展要求、是維護社會穩定的重要手段、是推進社會治理現代化的重要内容、是提升人民群衆安全感的重要舉措。2022年7月25日，由安徽超清科技股份有限公司承建的安徽某市“雪亮工程”... 2023-01-19
科技 bert代碼介紹
本文約4400字，建議閱讀10分鐘本文對BERT模型預訓練任務的源代碼進行了詳細解讀，在Eclipse開發環境裡，對BERT源代碼的各實現步驟分步解析。BERT模型架構是一種基于多層雙向變換器（Transformers）的編碼器架構，在te... 2023-01-19
科技 win10重置系統教程
win10重置系統教程?如果計算機系統出現藍屏或系統故障，相信用戶會選擇重新安裝系統來解決再見了，那些經常在電腦上折騰的人似乎明白Windows10系統中會有“重置這台電腦”的功能，這與恢複出廠設置的含義類似是否要更換和重新安裝電腦的分區？... 2022-10-15
科技遊戲旗艦手機紅魔7
【手機中國新聞】2月中旬，紅魔遊戲手機紅魔7Pro正式與大家見面。新機提供了暗夜騎士、賽博霓虹、氘鋒透明版三個版本供大家選擇。其中氘鋒透明版又有12GB256GB、16GB256GB、18GB512GB及18GB1TB四種超大内存版本。3月... 2023-03-19
科技怎樣讓電腦顯示文件全名
怎樣讓電腦顯示文件全名?讓電腦顯示文件全名，首先點擊我的電腦，下面我們就來聊聊關于怎樣讓電腦顯示文件全名?接下來我們就一起去了解一下吧!怎樣讓電腦顯示文件全名讓電腦顯示文件全名，首先點擊我的電腦。然後點擊菜單欄的“工具”下面的“文件夾選項”... 2022-06-19
科技弱電門禁安裝全過程
前言：門禁系統的安裝最難的還是鎖，鎖的安裝很重要，今天就重點介紹一下門禁電鎖的安裝。正文：一、外開門挂裝（明裝）磁力鎖安裝方法第一步：首先用螺絲刀打開蓋闆，再用六角扳手打邊闆，準備安裝（見圖一）第二步：拿出安裝紙闆，将紙闆沿着虛線折疊按圖二... 2023-01-05
科技 flash插件崩潰
[PConline]Fliqlo是很多人都喜歡的一款屏保軟件，由于酷似MacOS裡的動态時鐘屏保，點擊率很高。不過很多網友發現，這兩天Fliqlo貌似出問題了，沒有了酷酷的翻頁時鐘，而是下面這個鬼樣子！顯然，這是FlashPlayer出問題... 2023-01-03
科技卡通兔子畫法大全
用電腦畫出可愛的動物總是很有趣，但釋放你的想象力和創造力更有趣。下面教程中，您将看到用繪圖軟件畫出可愛的動物是多麼簡單有趣。緊跟每一個步驟，你會有很多有趣的收獲。找到你喜歡的可愛動物插圖，就動手繪制吧！接下來我們就一起來畫出下面這個可愛的兔... 2023-02-05
科技韋小寶周星馳鹿鼎記電影版結尾
韋小寶周星馳鹿鼎記電影版結尾?鹿鼎記2之神龍教周星馳版覺的還是周星馳版本的韋小寶最經典，我來為大家科普一下關于韋小寶周星馳鹿鼎記電影版結尾?下面希望有你要的答案，我們一起來看看吧!韋小寶周星馳鹿鼎記電影版結尾鹿鼎記2之神龍教周星馳版覺的還是... 2023-02-27
科技冰箱制冷應用原理圖
冰箱制冷應用原理圖?手把手教你空調電路闆維修（變頻定頻），我來為大家科普一下關于冰箱制冷應用原理圖?以下内容希望對你有幫助!冰箱制冷應用原理圖手把手教你空調電路闆維修（變頻定頻）一、普通電冰箱的工作原理1構成普通電冰箱因多采用往複式壓縮機，... 2022-10-15
科技電腦藍屏怎麼重裝系統
電腦藍屏怎麼重裝系統?「辰鴻科普」引起電腦藍屏的原因有很多，如電腦超頻過度引起電腦藍屏，内存條接觸不良或内存損壞導緻電腦藍屏，硬盤出現故障導緻電腦藍屏，以及安裝的軟件存在不兼導緻電腦藍屏等本文将逐一介紹分析出現電腦藍屏現象的原因與解決辦法，... 2023-04-03
科技圓形磨刀神器正确使用方法
中國人燒菜做飯總是隻認那麼一兩把菜刀無論是肉、禽、魚、果、蔬還是剁碎、切片、切絲、斬件、滾刀隻要一把菜刀就能稱霸廚房工欲善其事，必先利其器”想要做好一道菜，刀工是最基本的技能而前提是你要先有把鋒利的刀而各大商場随便一套刀具都要幾百元刀是廚房... 2023-02-13
科技騰訊絕地求生官網上線了嗎
我是台長，關注@遊戲電台，老司機将帶給你有趣的遊戲内容；目前，吃雞遊戲那麼火爆，而自騰訊代理《絕地求生》之後，國内玩家就更加期待上線，目前騰訊《絕地求生》的官網已經正式上線了，這也意味着遊戲上線已經近在咫尺；并且在此前的《絕地求生》發布會上... 2023-03-15

tft每日頭條

> 科技

> 細說回歸分析

細說回歸分析

相关科技资讯推荐

热门科技资讯推荐

网友关注