線性回歸怎麼運用-tft每日頭條

線性回歸怎麼運用

生活更新时间:2025-11-16 06:36:50

線性回歸原理

一般而言，房價會受很多因素的影響而波動，如果我們假設房價隻與房産面積已經廳室數量有關系，可以看到房價、面積、廳室呈現以下數據：

線性回歸怎麼運用（線性回歸綜述）1

房産數據

我們可以将價格y和面積x1、廳室數量x2的關系表示為f(x)=θ0 θ1x1 θ2x2，很顯然，我們的目的是使得f(x)盡量等于y，這就是一個直觀的線性回歸的樣式。

線性回歸的一般形式

假設有數據集{(x1, y1), (x2, y2), ..., (xn, yn)}，其中，xi=(xi1; xi2; xi3; ...; xid)∈n表示變量的數量，d表示每個變量的維度。那麼，我們可以用以下函數來描述y和x之間的關系：

線性回歸怎麼運用（線性回歸綜述）2

y和x之間的關系

如何來确定θ的值，使得f(x)盡可能接近y呢？回歸問題中常用的性能度量是均方誤差，可以表示為如下公式：

線性回歸怎麼運用（線性回歸綜述）3

均方誤差

我們可以選擇合适的θ來讓均方誤差最小化。

極大似然估計

下面我們用極大似然估計來解釋為什麼要用均方誤差作為線性回歸的性能度量。我們可以把目标值和變量寫成如下等式：

線性回歸怎麼運用（線性回歸綜述）4

等式轉換

ϵ表示我們未觀測到的變量的印象，即随機噪音。我們假定ϵ是獨立同分布，服從高斯分布。根據中心極限定理得到如下結果：

線性回歸怎麼運用（線性回歸綜述）5

中心極限定理轉換

我們建立極大似然函數，即描述數據遵從當前樣本分布的概率分布函數。由于樣本的數據集獨立同分布，因此可以寫成如下形式：

線性回歸怎麼運用（線性回歸綜述）6

極大似然函數

我們選擇可以使似然函數最大化的θ，這就是極大似然估計的思想。為了方便計算，我們計算時通常對對數似然函數求最大值，即對兩邊取對數，推導結果如下：

線性回歸怎麼運用（線性回歸綜述）7

推導過程

由上述推導可知，最大化似然函數與最小化紅框部分是等價的（前面的1/2是為了後續計算方便的）。顯然，這一結果就是均方誤差，因此我們證明了用這個式子作為代價函數來優化線性回歸模型在統計學的角度上來說是合理的。

線性回歸的損失函數、代價函數與目标函數

首先明确損失函數、代價函數與目标函數的概念。損失函數度量的是單樣本預測的錯誤程度，損失函數值越小，模型就越好。代價函數度量的是全部樣本集的平均誤差。目标函數則是代價函數和正則化函數，也是模型最終要優化的函數。

從上述概念中可以發現，代價函數已經可以度量樣本集的平均誤差了，那麼我們為什麼還要設定目标函數呢？這是因為當模型複雜度增加時，有可能出現對訓練集模拟得很好，但是對測試集的效果卻不好，也就是我們所說的過拟合現象，我們也稱之為結構化風險。結構化風險最小化就是為了防止過拟合而提出來的策略。定義模型複雜度為J(F)，則目标函數可表示為如下形式：

線性回歸怎麼運用（線性回歸綜述）8

目标函數

其中，λJ(F)我們稱為正則化，其目的就是防止過拟合。當訓練集本身存在噪聲時，拟合曲線對未知影響因素的拟合往往不是最好的。通常，随着模型複雜度的增加，訓練誤差會減少；但測試誤差會先增加後減小。我們的最終目的是使測試誤差達到最小，因此我們需要選取适合的目标函數。

線性回歸的優化方法

常見的優化方法有梯度下降法、最小二乘法矩陣、牛頓法和拟牛頓法。對于線性回歸模型，我們一般選用批随機梯度下降法（與随機梯度下降法不同，但現在我們所說的随機梯度下降往往是批随機梯度下降）來優化模型。推導過程如下：

線性回歸怎麼運用（線性回歸綜述）9

線性回歸随機梯度下降法推導

其中，下标j表示第j個參數，上标i表示第i個數據點。随機梯度下降法的優點是當數據點很多時，運行效率更高；缺點是由于每次隻針對一批樣本更新參數，未必能找到最快路徑達到最優值，甚至有時候會出現參數在最小值附近徘徊無法收斂。如果函數為非凸函數，有可能找到的并非全局最優值，而是局部最優值。

線性回歸的評價指标

線性回歸是典型的回歸問題，對于回歸問題，常用的評價指标有均方誤差(MSE)、均方根誤差(RMSE)和平均絕對誤差(MAE)，但這些評價指标都無法消除量綱不一緻而導緻的誤差值特别大的問題，因此對于線性回歸，我們最常用的指标是R^2，可以避免量綱不一緻問題。

線性回歸怎麼運用（線性回歸綜述）10

R^2評價指标

其中，VAR為實際結果與預測結果的方差，從式子中可以看出，R^2能夠讓回歸模型可以成功解釋數據方差部分在數據固有方差中所占的比例，R^2越接近1，表示可解釋力度越大，模型拟合的效果也就越好。

使用sklearn實現一個簡單的線性回歸案例

sklearn(scikit-learn)是基于Python實現的機器學習工具以及簡單高效的數據挖掘和數據分析工具，其内部集成了常用的所有機器學習模型，線性回歸模型就包含在sklearn的linear_model庫中。因此，在使用時，我們需要将該線性回歸模型導入。

from sklearn.linear_model import LinearRegression

下面我們通過一個簡單的例子來感受一下線性回歸模型的整個流程。首先我們利用NumPy生成數據：

import numpy as np from sklearn.linear_model import LinearRegression # 生成随機數種子使每次産生的随機數都一樣 np.random.seed(49) x = np.random.rand(500, 3) print(x) # 構建映射關系，模拟真實的數據待預測值 # 映射關系設置為y = 2.1 2.8*x1 5.4*x2 y = x.dot(np.array([2.1, 2.8, 5.4]))

這裡生成了一組映射關系為y = 2.1 2.8*x1 5.4*x2的數據，然後就可以利用sklearn的線性回歸模型來訓練模型并将訓練好的模型用于預測。

# 生成模型 lr = LinearRegression(fit_intercept=True) # 訓練模型 lr.fit(x, y) print("訓練的參數值結果為：%s" % (lr.coef_)) # 評估模型 print('R^2為：%s' % (lr.score(x, y))) # 預測目标值 x_test = np.array([2, 4, 5]).reshape(1,-1) y_test = lr.predict(x_test) print("預測值為: %s" % (y_test))

運行結果如下所示：

線性回歸怎麼運用（線性回歸綜述）11

運行結果

由于我們設置的線性回歸模型比較簡單，隻有三個參數，因此它的準确度達到了100%。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活 emba課程有多久
什麼是EMBA？EMBA全稱ExecutiveMasterOfBusinessAdministration，直譯為高層管理人員工商管理碩士。EMBA最早誕生于美國芝加哥大學管理學院，它設立的目的就是為企業的高級管理人員服務的。讀EMBA的學... 2022-12-05
生活羅翔百大up主入圍名單
今年羅翔的百大UP主獲獎感言讓我自愧不如，這就是說話的藝術。羅老師真的好會說啊，每一次都讓人感受到無比的真誠和智慧。“運氣并非成就，是命運之手把我托舉到所不配有的高度，讓人飄然，讓人暈眩，最終，讓人誠惶誠恐。”“一直以來我都覺得自己不過像一... 2022-11-07
生活民航大飛機工程
自然結冰試飛，是通過試飛來驗證在結冰氣象條件下，飛機還能不能安全地飛行。而自然結冰試飛，又是飛機取證中的三大高風險科目之一。美國聯邦航空管理局的統計數據顯示，每年大約有8起因結冰導緻的飛行事故。因此，國際上任何一部适航法規，都不可能忽視結冰... 2022-11-23
生活各種滅火器的有效期和使用年限
不同類型的滅火器維修與報廢年限均不同，你知道嗎？長按識别以下二維碼，學習實用的消防安全知識。, 2023-01-07
生活創意文案
創意文案?不要到處宣揚你的内心，因為不止你一個人有故事，我來為大家科普一下關于創意文案?以下内容希望對你有幫助!創意文案不要到處宣揚你的内心，因為不止你一個人有故事。願十年後我還給你倒酒，願十年後我們還是老友。我們總是發現以前的自己有點傻。... 2022-06-15
生活夢見松鼠什麼意思
夢見松鼠什麼意思?夢見捕捉松鼠，或者把松鼠抓在手裡，預示你會有好事來臨，比如得到意外的收入，找到掩藏的财富，下面我們就來聊聊關于夢見松鼠什麼意思?接下來我們就一起去了解一下吧!夢見松鼠什麼意思夢見捕捉松鼠，或者把松鼠抓在手裡，預示你會有好事... 2022-07-16
生活家裡水表空轉怎麼解決
家裡水表空轉怎麼解決?解決水表空轉的根本辦法就是使用OR自動排氣閥，放出管道内聚積的氣體但具體案例要具體分析，其解決步驟一般如下：，下面我們就來說一說關于家裡水表空轉怎麼解決?我們一起去了解并探讨一下這個問題吧!家裡水表空轉怎麼解決解決水表... 2022-06-23
生活肚腩很大怎麼減
原創内容，擅自搬運者必究！肚腩太大怎麼減？如今很多人出現肥胖問題，而肚腩是大多數肥胖人的煩惱。想要減掉肚腩贅肉，我們要先知道，肚腩是怎麼形成的？肚腩主要是熱量過剩，多餘的熱量轉化為脂肪堆積的結果。而腰腹部位是運動量比較低的部位，也是五髒六腑... 2022-11-09
生活 90後熬夜調查
日前，中國睡眠研究會等機構發布《2022中國國民健康睡眠白皮書》。白皮書調查顯示，44%的19-25歲年輕人熬夜至零點以後，42%的老年人入睡時長超過半小時，失眠率高達21%。19-35歲青壯年是睡眠問題高發年齡段，睡不好漸成年輕人的普遍痛... 2023-02-11
生活李逵的故事簡介
李逵的故事簡介?李逵是古典小說《水浒傳》中的重要人物之一，《水浒傳》是我國四大古典名著之一，作者是施耐庵，也有說法是施耐庵和《三國演義》的作者羅貫中一起寫的李逵在《水浒傳》中有着較大比例的描寫，外型上和《三國演義》中的張飛類似，黑膚，同樣的... 2022-06-24
生活長安深藍sl03的5個優點和3個缺點
在6月25日舉辦的重慶車展上，長安深藍SL03純電版車型正式亮相。此次官方還公布了新車的預售價，預售價區間為17.98-23.18萬元。整體造型上，新車的顔值不輸Model3、比亞迪海豹。動力方面也值得一看，将提供三種動力續航版本。至于新車... 2022-11-17
生活炝藕片的做法
炝藕片的做法?藕切片，清水漂洗一下，瀝幹生姜、蒜瓣、紅辣椒切碎，接下來我們就來聊聊關于炝藕片的做法?以下内容大家不妨參考一二希望能幫到您!炝藕片的做法藕切片，清水漂洗一下，瀝幹。生姜、蒜瓣、紅辣椒切碎。鍋燒熱，放适量油，放入生姜、紅辣椒、蒜... 2022-08-13
生活國有土地上房屋征收與補償認定
國有土地上房屋征收與補償認定?《國有土地上房屋征收與補償條例》?，我來為大家科普一下關于國有土地上房屋征收與補償認定?以下内容希望對你有幫助!國有土地上房屋征收與補償認定《國有土地上房屋征收與補償條例》?第十九條對被征收房屋價值的補償，不得... 2023-01-20
生活緻哀和志哀的區别
緻哀和志哀的區别?綜合幾個版别的漢語詞典的解釋，“志哀”多指在以某種方式表示哀悼之情，如“全國下半旗志哀”；“緻哀”則是緻以哀悼的意思，是一種具有明确指向對象的特定的哀悼行為，我來為大家科普一下關于緻哀和志哀的區别?以下内容希望對你有幫助!... 2022-06-04
生活關于智謀典故的四字成語
【膠柱鼓瑟】[jiāozhùgǔsè]成語釋義：“柱”就是琴瑟上調弦的短木，用膠把琴柱粘上，就不用再費心調音了。"膠柱鼓瑟"用來比喻固執拘泥，不知變通。這典故出自三國·魏·邯鄲淳的《笑林》：“齊人就趙學瑟，因之先調，膠柱而歸... 2022-11-07
生活清理腸胃的食物有哪些
清理腸胃的食物有哪些?花生，花生是我們日常生活中經常會食用的一種食物，很大的人都是比較了解它的，花生對于強健腸道有很好的效果這是因為花生入脾經，有養胃醒脾、滑腸潤燥的作用而且，其中獨有的植酸、植物固醇等特殊物質，也會增加腸道的韌性，使抵抗外... 2022-07-17
生活少壯不努力老大徒傷悲的意思是什麼
少壯不努力老大徒傷悲的意思是什麼?釋義：年輕力壯的時候不奮發圖強，到了老年，悲傷也沒用了，現在小編就來說說關于少壯不努力老大徒傷悲的意思是什麼?下面内容希望能幫助到你，我們來一起看看吧!少壯不努力老大徒傷悲的意思是什麼釋義：年輕力壯的時候不... 2022-06-08
生活張家界天門山全景介紹
本報長沙訊10月4日，國慶假期第四天，張家界迎來客流高峰。遊人賞美景，走999級台階登天門洞，享歡樂假期。“雖然很累，但這風景值得！”來自湖北武漢的遊客劉闖說。随着假期進入中期，張家界天門山國家森林公園遊客流量較前兩日明顯增加，遊人徜徉在絕... 2022-11-05
生活張子楓藝考成績是多少分
7月23日中午，2020年北電藝考成績出爐，因為有不少小演員也參加了今年考試，比如張子楓、周奇等人，所以網友對成績都頗為關注。成績出爐後也令觀衆驚訝，因為第一名和第二名大家并不熟悉，第一名是女生夏夢，不僅如此，小姑娘還是中國傳媒大學表演專業... 2023-01-20
生活藤堂靜孫伊涵在一起嗎
導讀：小“藤堂靜”撞臉楊幂，連王思聰也關注她，年僅9歲能養活整個家如今的網紅大多是如溫婉一般喜歡奪人眼球的人，有點甚至為了成為網紅而整容，但在網紅界也有“清流”，比如章澤天雖然是以“奶茶妹妹”爆紅網絡，但其嫁給劉強東後直接崛起，成為最成功的... 2022-10-27
生活迷叠香的花語和寓意
迷叠香的花語和寓意?迷叠香的花語：永恒的生命、愛與美好的回憶，我來為大家科普一下關于迷叠香的花語和寓意?下面希望有你要的答案，我們一起來看看吧!迷叠香的花語和寓意迷叠香的花語：永恒的生命、愛與美好的回憶。迷叠香的寓意：（1）回憶：迷叠香被定... 2022-06-11
生活法新藍莓品種介紹
法新藍莓品種介紹?形态特征：法新藍莓果實大，表皮深藍色，硬度高，成熟時間一緻，豐收且生産量平穩，是現在最優異的高叢藍莓品種之一，我來為大家講解一下關于法新藍莓品種介紹?跟着小編一起來看一看吧!法新藍莓品種介紹形态特征：法新藍莓果實大，表皮深... 2022-07-03
生活職工醫療保險怎麼查詢
職工醫療保險怎麼查詢?首先我們要找到各地官方的醫保網站然後輸入自己的信息，接下來我們就來聊聊關于職工醫療保險怎麼查詢?以下内容大家不妨參考一二希望能幫到您!職工醫療保險怎麼查詢首先我們要找到各地官方的醫保網站然後輸入自己的信息。打開這個界面... 2022-06-11
生活人會被氣死嗎
人會被氣死嗎?當然會被氣死了古時，楊廣氣死楊素李世民氣死薛萬均趙構氣死韓世忠，接下來我們就來聊聊關于人會被氣死嗎?以下内容大家不妨參考一二希望能幫到您!人會被氣死嗎當然會被氣死了。古時，楊廣氣死楊素。李世民氣死薛萬均。趙構氣死韓世忠。如今，... 2022-08-22
生活注銷微博賬号後可以重新申請嗎
注銷微博賬号後可以重新申請嗎?注銷微博賬号後可以重新申請的微博是基于用戶關系的社交媒體平台，用戶可以通過PC、手機等多種移動終端接入，以文字、圖片、視頻等多媒體形式，實現信息的即時分享、傳播互動，今天小編就來聊一聊關于注銷微博賬号後可以重新... 2022-05-31
生活焊工證都有哪些類型
焊工證都有哪些類型?焊接工證，按字面理解，即為證書焊接工證有哪些種類？各種焊接證書，有什麼區别？怎樣才能做出區别？，現在小編就來說說關于焊工證都有哪些類型?下面内容希望能幫助到你，我們來一起看看吧!焊工證都有哪些類型焊接工證，按字面理解，即... 2022-10-18
生活用補水儀的好處
到很多愛美的女孩子都網上問補水儀真的能補水嗎?身邊的女孩子也在問補水儀會不會有副作用，所以為了大家能更深刻的了解補水儀的效果和安全，深度講解一下補水儀是不是真的能補水?補水儀真的能起到補水的作用嗎補水儀能夠深層補水保濕、減少皺紋、增加肌膚彈... 2023-01-12
生活世界上著名的火山之國
世界上著名的火山之國?，現在小編就來說說關于世界上著名的火山之國?下面内容希望能幫助到你，我們來一起看看吧!世界上著名的火山之國, 2022-11-01
生活莴筍三丁怎麼做
莴筍三丁怎麼做?莴筍250克、胡蘿蔔100克、山藥150克、食油3湯匙、食鹽2克、白糖5克，下面我們就來聊聊關于莴筍三丁怎麼做?接下來我們就一起去了解一下吧!莴筍三丁怎麼做莴筍250克、胡蘿蔔100克、山藥150克、食油3湯匙、食鹽2克、白... 2022-06-13
生活香辣肉皮的做法
香辣肉皮的做法?食材：豬皮、蒜沫、幹辣椒、熟芝麻、鹽、生抽、花椒油，下面我們就來說一說關于香辣肉皮的做法?我們一起去了解并探讨一下這個問題吧!香辣肉皮的做法食材：豬皮、蒜沫、幹辣椒、熟芝麻、鹽、生抽、花椒油。熱鍋入油，放少許鹽，把豬皮爆炒一... 2022-06-15

tft每日頭條

> 生活

> 線性回歸怎麼運用

線性回歸怎麼運用

相关生活资讯推荐

热门生活资讯推荐

网友关注