numpy中用逆矩陣求方程組的解法-tft每日頭條

numpy中用逆矩陣求方程組的解法

圖文更新时间:2025-09-15 01:34:35

Normal Equation

對于損失函數，可以使其導數為零，尋找損失函數的極值點。

一元線性回歸

假設我們的模型隻有一維數據，模型是一條直線，我們共有條訓練數據，損失函數為誤差平方和的平均數：

可以對和分别求導，導數為0時，損失函數最小。

上面兩個公式是損失函數對和進行求偏導。當導數為0時，可以求得損失函數的最小值，即由上面兩個公式可以得到最優解和。

最優解為：

其中，，即為的均值。

以上就是一元線性回歸的最小二乘法求解過程。很多機器學習模型中都需要經曆上述過程：确定損失函數，求使損失函數最小的參數。求解過程會用到一些簡單的微積分，因此複習一下微積分中偏導數部分，有助于理解機器學習的數學原理。

多元線性回歸

更為一般的情形下，特征是多維的：

上面的公式中，我們其實是使用來表示參數中的，将添加到特征向量中，将維特征擴展成維，也就是在每個中添加一個值為1的項。各個向量和矩陣形狀如下面公式所示。

其中，向量表示模型中各個特征的權重；矩陣的每一行是一條樣本，每條樣本中有個特征值，分别為該樣本在不同維度上的取值；向量為真實值。可以用内積的形式來表示求和項：。用矩陣乘法的形式可以表示為：。

一般機器學習領域更喜歡使用矩陣乘法的形式來表示一個模型，這不僅因為這樣表示起來更簡單，也是因為現代計算機對向量計算做了大量優化，無論是CPU還是GPU都喜歡向量計算，并行地處理數據，可以得到成百上千倍的加速比。

注意，公式中不加粗的表示标量，加粗的表示向量或矩陣。

比一元線性回歸更為複雜的是，多元線性回歸最優解不是一條直線，是一個多維空間中的超平面，訓練數據散落在超平面的兩側。

numpy中用逆矩陣求方程組的解法（線性回歸的求解）1

多元線性回歸一般尋找最優超平面

多元線性回歸的損失函數仍然使用“預測值-真實值”的平方來計算，上面公式為整個模型損失函數的向量表示。這裡出現了一個豎線組成的部分，它被稱作L2範數的平方。範數通常針對向量，也是一個機器學習領域經常用到的數學符号，下面公式展示了一個向量的L2範數的平方以及其導數。

對線性回歸損失函數公式中的向量求導，令導數為零：

上面公式是向量的解，這是一個矩陣方程。使用這種方法求最優解，其實是在解這個矩陣方程，英文中稱這種方法為Normal Equation。

這個方法有一個問題，在線性代數課程中肯定曾提到過，是滿秩（Full-Rank）或正定（Positive Definite）時，才能解方程組。“滿秩”或者“正定”到底什麼意思呢？用通俗的話來講，樣本中的數據必須足夠豐富，且有足夠的代表性，矩陣方程才有唯一解，否則矩陣方程會有多組解。如果特征有上萬維，但隻有幾十個樣本來訓練，我們很難得到一個滿意的最優解。

上述方法還有一個問題：公式中矩陣求逆的計算量比較大，複雜度在級别。當特征維度達到百萬級以上或樣本數量極大時，計算時間非常長，單台計算機内存甚至存儲不下這些參數，求解矩陣方程的辦法就不現實了。

前面花了點時間描述線性回歸的求解過程，出現了不少公式，跟很多朋友一樣，筆者以前非常讨厭看公式，看到一些公式就頭大，因此覺得機器學習非常難。不過，靜下心來仔細讀一遍，會發現其實這些公式用到的都是微積分、線性代數中比較基礎的部分，并不需要高大上的知識，理工科背景的朋友應該都能看得懂。另外，複習一下矩陣和求導等知識有助于我們理解深度學習的一些數學原理。

梯度下降法

求解損失函數最小問題，或者說求解使損失函數最小的最優化問題時，經常使用搜索的方法。具體而言，選擇一個初始點作為起點，然後開始不斷搜索，損失函數逐漸變小，當到達搜索叠代的結束條件時，該位置為搜索算法的最終結果。我們先随機猜測一個，然後對值不斷進行調整，來讓逐漸變小，最好能找到使得最小的。

具體來說，我們可以考慮使用梯度下降法（Gradient Descent），這個方法就是從某一個的初始值開始，然後逐漸對權重進行更新，或者說每次用新計算的值覆蓋原來的值：

這裡的也稱為學習率，是梯度（Gradient）。微積分課中提到，在某個點，函數沿着梯度方向的變化速度最快。因為我們想最小化損失函數，因此，我們每次都沿着梯度下降，不斷向降低最快的方向移動。

用圖像直觀來看，損失函數沿着梯度下降的過程如下所示。叠代過程最終收斂在了最小值附近，此時，梯度或者說導數接近0。

numpy中用逆矩陣求方程組的解法（線性回歸的求解）2

回到學習率上，代表在某個點上，我們對梯度的置信程度。一般情況下，。越大，表示我們希望損失函數以更快的速度下降，越小，表示我們希望損失函數下降的速度變慢。如果設置得不合适，每次的步進太大，損失函數很可能無法快速收斂到最小值。如下所示，損失函數經過很長時間也難以收斂到最小值。在實際應用中，經常随着叠代次數變化而變化，比如，初始化時較大，後面漸漸變小。

numpy中用逆矩陣求方程組的解法（線性回歸的求解）3

我們之前提到過，是一個向量，假設它是維的，在更新時，我們是要同時對維所有值進行更新，其中第維就是使用上面的權重更新公式。

接下來我們簡單推導一下梯度公式，首先考慮隻有一條訓練樣本的情況。由，其中，是常數項，不影響最優解的取值，主要是為了方便求導。可以得到：

對單個訓練樣本，每次對梯度的更新規則如下所示：

這個規則有幾個看上去就很自然直觀的特性：

更新的大小與成比例。
當我們遇到訓練樣本的預測值與的真實值非常接近的情況下，就會發現基本沒必要再對參數進行修改了；與此相反的情況是，如果我們的預測值與真實值有很大的誤差（比如距離特别遠），那就需要對參數進行更大的調整。這也與前面所展示的梯度下降動态圖中相吻合。

批量梯度下降法

當隻有一個訓練樣本的時候，我們推導出了 LMS 規則。當一個訓練集有個訓練樣本的時候，。求導時，隻需要對多條訓練樣本的數據做加和。

因此，可以得出每個的導數：

具體而言，這個算法為：

這一方法在每一次叠代時使用整個訓練集中的所有樣本來更新參數，也叫做批量梯度下降法（Batch Gradient Descent，BGD）。線性回歸的損失函數是一個凸二次函數（Convex Quadratic Function），凸函數的局部極小值就是全局最小值，線性回歸的最優化問題隻有一個全局解。也就是說，假設不把學習率設置的過大，叠代次數足夠多，梯度下降法總是收斂到全局最小值。

随機梯度下降法

批量梯度下降在更新參數時要把所有樣本都要考慮進去。當數據量大、特征多時，每次叠代都使用全量數據并不現實；而且全量數據本身包含很多冗餘信息，數據量越大，冗餘信息越多，在求最優解時，冗餘信息并沒有太大幫助。一種妥協方法是，每次更新參數時，隻随機抽取部分樣本。一個比較極端的情況是，每次叠代時随機抽取一條樣本，使用單個樣本來更新本次叠代的參數，這個算法被稱為随機梯度下降（Stochastic gradient descent，SGD），如下所示：

另外，我們也可以每次随機抽取一個小批次（Mini-batch）的訓練數據，用這批數據更新本次叠代參數，這種算法被稱為Mini-batch SGD。Mini-batch SGD是BGD和SGD之間的一個妥協，Mini-batch SGD降低了SGD中随機性帶來的噪音，又比BGD更高效。

梯度下降法努力逼近最優解，求解速度在數據量大時有優勢，但不一定能得到絕對的最優解。在很多實際應用中，雖然梯度下降求解的點在最優點附近，但其實已經能夠滿足需求。考慮到這些因素，梯度下降法，尤其是随機梯度下降法被大量應用在機器學習模型求解上。除了以上介紹的幾種外，梯度下降法有很多變體。

numpy中用逆矩陣求方程組的解法（線性回歸的求解）4

梯度下降法的NumPy實現

前面推導了這麼多，Talk is cheap，Show some code。接下來，我們使用NumPy實現一個線性回歸模型，分别使用批量梯度下降和随機梯度下降。實現過程中我們會發現，有些問題是公式推導不會提及的工程問題，比如，計算過程中的數據太大，超出了 float64 的可表示範圍。工程實現體現了理論和實踐之間的差異，實際上，往往這些工程細節決定着機器學習框架的易用性。

import numpy as np class LinearRegression: def __init__(self): # the weight vector self.W = None def train(self, X, y, method='bgd', learning_rate=1e-2, num_iters=100, verbose=False): """ Train linear regression using batch gradient descent or stochastic gradient descent Parameters ---------- X: training data, shape (num_of_samples x num_of_features), num_of_samples rows of training sample, each training sample has num_of_features-dimension features. y: target, shape (num_of_samples, 1). method: (string) 'bgd' for Batch Gradient Descent or 'sgd' for Stochastic Gradient Descent learning_rate: (float) learning rate or alpha num_iters: (integer) number of steps to iterate for optimization verbose: (boolean) if True, print out the progress Returns ------- losses_history: (list) of losses at each training iteration """ num_of_samples, num_of_features = X.shape if self.W is None: # initilize weights with values # shape (num_of_features, 1) self.W = np.random.randn(num_of_features, 1) * 0.001 losses_history = [] for i in range(num_iters): if method == 'sgd': # randomly choose a sample idx = np.random.choice(num_of_samples) loss, grad = self.loss_and_gradient(X[idx, np.newaxis], y[idx, np.newaxis]) else: loss, grad = self.loss_and_gradient(X, y) losses_history.append(loss) # Update weights using matrix computing (vectorized) self.W -= learning_rate * grad if verbose and i % (num_iters / 10) == 0: print('iteration %d / %d : loss %f' %(i, num_iters, loss)) return losses_history def predict(self, X): """ Predict value of y using trained weights Parameters ---------- X: predict data, shape (num_of_samples x num_of_features), each row is a sample with num_of_features-dimension features. Returns ------- pred_ys: predicted data, shape (num_of_samples, 1) """ pred_ys = X.dot(self.W) return pred_ys def loss_and_gradient(self, X, y, vectorized=True): """ Compute the loss and gradients Parameters ---------- The same as self.train function Returns ------- tuple of two items (loss, gradient) loss: (float) gradient: (array) with respect to self.W """ if vectorized: return linear_loss_grad_vectorized(self.W, X, y) else: return linear_loss_grad_for_loop(self.W, X, y) def linear_loss_grad_vectorized(W, X, y): """ Compute the loss and gradients with weights, vectorized version """ # vectorized implementation num_of_samples = X.shape[0] # (num_of_samples, num_of_features) * (num_of_features, 1) f_mat = X.dot(W) # (num_of_samples, 1) - (num_of_samples, 1) diff = f_mat - y loss = 1.0 / 2 * np.sum(diff * diff) # {(num_of_samples, 1).T dot (num_of_samples, num_of_features)}.T gradient = ((diff.T).dot(X)).T return (loss, gradient) def linear_loss_grad_for_loop(W, X, y): """ Compute the loss and gradients with weights, for loop version """ # num_of_samples rows of training data num_of_samples = X.shape[0] # num_of_samples columns of features num_of_features = X.shape[1] loss = 0 # shape (num_of_features, 1) same with W gradient = np.zeros_like(W) for i in range(num_of_samples): X_i = X[i, :] # i-th sample from training data f = 0 for j in range(num_of_features): f = X_i[j] * W[j, 0] diff = f - y[i, 0] loss = np.power(diff, 2) for j in range(num_of_features): gradient[j, 0] = diff * X_i[j] loss = 1.0 / 2 * loss return (loss, gradient)

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

圖文橘紅種植技術和管理
化橘紅促花保果技術要點化橘紅為芸香科植物化州柚或柚的未成熟或近成熟的幹燥外層果皮，性溫，味辛苦，具有化痰止咳、驅風寒、健胃消滞之特殊功效。化橘紅“被列入國家中藥材GAP産品和保護品種”。2009年化州市被授予“中國化橘紅之鄉”稱号。2016... 2022-10-30
圖文 168最佳體重是多少
據我國《中國居民營養與慢性病狀況報告》顯示（2015年），全國18歲以上成人超重率為30.1%，肥胖率為11.9%，比2002年上升了7.3%和4.8%。6~17歲的兒童與青少年超重率為9.6%，肥胖率為6.4%，比2002年上升了5.1%... 2022-11-23
圖文倡導簡約适度綠色低碳生活方式
倡導簡約适度綠色低碳生活方式?：“取之有度，用之有節”，是生态文明的真谛我們要倡導簡約适度、綠色低碳的生活方式，拒絕奢華和浪費，形成文明健康的生活風尚，下面我們就來聊聊關于倡導簡約适度綠色低碳生活方式?接下來我們就一起去了解一下吧!倡導簡約... 2022-10-19
圖文長安歐尚a600現在賣的怎麼樣
長安歐尚a600現在賣的怎麼樣?作者：孫奇随着時代發展，我們可以發現到，很多汽車在設計是越來越牛，穩中求時尚，國産品牌也是一樣，不論是吉利還是長安等都是有很大進步，着不防要說起一款車，新長安歐尚A600，我來為大家科普一下關于長安歐尚a60... 2022-10-19
圖文石油管道陰極保護措施
随着現在生産生活的發展，防腐材料的應用也變得越來越重要。我們就拿犧牲陽極産品來說，在陰極保護防腐施工應用中的性能也很突出。并且不會污染地下環境。但随着工業生産的不斷需求，陰極保護材料越來越多，應用的範圍也越來越廣。現如今石油管道的類型主要分... 2022-11-25
圖文野生苔藓什麼地方比較多
農村這野草長在“苔藓”上，炖肉煲湯都不錯，價值高，遇到采一點要知道，在城市化、工業化發展的飛速進程中，我國現在的空氣質量已經到了一種很危險的境地了，相對于城市來說，鄉村的空氣确實是很新鮮的了。空氣之所以會顯得良好一些是因為農村能産生得污染物... 2022-11-15
圖文怎樣練一字馬不會痛又簡單
最近被這一個表情包刷屏，網友們都稱它為“辟謠專用表情包”。隻要有謠言，就祭上這張圖，哈哈哈，我不說你們也知道是誰了吧~看了這張圖，我隻想說：連一隻狗狗的柔韌性都比我好！！！它可以給我劈個叉，而我連腿都伸不直！！！不說了，我要跟着我家俞乃西小... 2022-10-23
圖文小學三年級下冊作文植物朋友
在苦悶的疫情生活中，總要找點兒生活的情趣。家人有點兒受不了我唱《蘇三起解》，所以我忍了。今天一大早，開窗通風的當兒，我飽含深情地對窗朗讀了三年級下冊語文課本裡《荷花》，心情非常愉悅，思緒随之翩翩起舞。很多孩子犯愁寫景作文，總覺得沒什麼可寫的... 2022-12-08
圖文會計憑證的審核與填制步驟
會計憑證的審核與填制步驟?高頓财務培訓提供1400多門公開課及網絡課程，下面我們就來聊聊關于會計憑證的審核與填制步驟?接下來我們就一起去了解一下吧!會計憑證的審核與填制步驟高頓财務培訓提供1400多門公開課及網絡課程1、目的：使會計人員能夠... 2022-10-11
圖文迷你世界震撼建築前20名古風
迷你世界震撼建築前20名古風?苦瓜原創，翻版必究《苦瓜電競》--讓你體驗不一樣的電競主播圈，我來為大家科普一下關于迷你世界震撼建築前20名古風?下面希望有你要的答案，我們一起來看看吧!迷你世界震撼建築前20名古風苦瓜原創，翻版必究！《苦瓜電... 2022-10-06
圖文 2022最後一百天見證不一樣的你
越來越覺得時間過得快了。好像前不久才提筆總結2021年，轉眼間，2022年又過去了一半。2022上半年你過得好嗎？走過多少個街頭，看過多少風景，認識了怎樣的人，做過什麼樣的事。又或許對你來說，這六個月過得并不容易。但是沒關系，無論好的壞的，... 2022-11-05
圖文全網最詳細的乘機流程
全網最詳細的乘機流程?乘機流程1.提前到達機場：機場于航班起飛前30分鐘停止辦理登機手續，所以最好在起飛前1-2個小時到達機場2.辦登機手續：找到你航班對應的櫃台，把機票、身份證交給辦理人員，辦好登機手續後，你會得到一張登機牌3.過安檢：随... 2022-10-03
圖文孕期胎動變化過程
胎動是胎兒與媽媽最親密的互動，有人說那是一種說不清道不明的幸福感，是世界上最美的運動，生命的神奇從那一刻開始有了質的升華。胎動這種神奇的運動，也隻有媽媽能時刻感受到。一般在孕18-20周準媽媽就有可能感覺到第一次胎動，這時寶寶的力量還很小，... 2022-12-08
圖文桂圓雖然好吃但建議不要多吃
桂圓，其實就是我們平常說的“龍眼”。吃桂圓的好處有很多，但原來吃桂圓也有壞處的。桂圓雖補，但也要看體質來吃，有的人是不适宜吃、或忌吃桂圓的。吃桂圓的好處有哪些，在食用桂圓前先了解一下吧!吃桂圓的好處有：1、益氣補血，增強記憶桂圓含豐富的葡萄... 2022-11-23
圖文飛盤運動怎麼玩
飛盤社社員在比賽中。令時桢/攝編者按“大學要培養什麼樣的人？”對于這一問題，首都體育學院原校長鐘秉樞曾給出答案：“适應社會發展需要的人。大概包括與人合作、問題解決、創新思維、追求卓越、團隊精神，這是各國培養人才時提倡的核心素養。”“那麼，到... 2023-02-07
圖文中美在apec會議下合作
中美在apec會議下合作?APEC峰會是亞太經合組織級别最高的會議，每年舉行一次，中國則分别在2001年和2014年兩度拿到APEC峰會的主辦權俄羅斯投出否決票後，為何又改變主意支持美國主辦2023年APEC峰會？美國如此積極尋求APEC峰... 2022-10-18
圖文手握22萬選擇suv不妨看看這四輛車
如今國産車遍地開花，什麼款式造型都有，什麼價格都有，不過從目前是車市來看，目前SUV更受到年輕消費者的追捧。當然，如今選擇一台适合自己的SUV也是一件非常困難的事情，為了排除這款難題，我今天推薦的這款SUV也許更适合你，不僅配置高，空間大，... 2022-11-04
圖文來自星星的孩子自閉症女孩
2020年的7月31日，在北京九藝門劇場，為來自“星星的孩子們”發聲，由歌手演員章磊招募，《華語音樂排行榜》創始人合力發起中華慈善總會全力支持的第四屆《華語榜》關注自閉症兒童慈善活動，呼籲全社會的愛心人士們“關注自閉症人群，尤其是自閉症孩子... 2022-10-29
圖文近期qq号被盜
最近幾日，有大量網友反映，好友QQ号不斷被盜号，盜号後會被發布違規内容...據了解，盜号是以團夥作案，他們主要會發布一些鍊接，将其用代碼僞造成聊天記錄，吸引用戶點擊，然而當用戶點擊鍊接後，他們的個人隐私，QQ密碼等信息都會被盜号團夥獲悉。2... 2022-11-21
圖文以色列量子計算研發中心
以色列量子計算研發中心?來源:科技日報以色列謀建“獨立自主”的量子計算能力，我來為大家科普一下關于以色列量子計算研發中心?下面希望有你要的答案，我們一起來看看吧!以色列量子計算研發中心來源:科技日報以色列謀建“獨立自主”的量子計算能力科技日... 2023-03-06
圖文三十萬到三十五萬的越野suv哪個好
三十萬到三十五萬的越野suv哪個好?行走在層巒疊嶂之間、征服各種複雜路段、一覽大地山川之美……這就是越野人的快樂但要想體驗越野樂趣，先得擁有一台能陪伴自己“闖天涯”的硬派越野座駕，面對遍地開花的車市，越野小白應當作何選擇呢？莫慌，身為越野老... 2022-10-15
圖文騰訊QQ回應大量賬号被盜
27日，騰訊QQ回應用戶反饋QQ号碼被盜問題。6月26日晚上10點左右，我們收到部分用戶反饋QQ号碼被盜。QQ安全團隊高度重視并立即展開調查，發現主要原因系用戶掃描過不法分子僞造的遊戲登錄二維碼并授權登錄，該登錄行為被黑産團夥劫持并記錄，随... 2022-11-21
圖文愛意随風起枯葉落滿地
一場未圓的殘夢，一個宛若天仙的背影，自從離去，一等便是千年，一颦一笑早已成空，你可知你從自紅塵深處中漫步而來，凝眸的霎那，本身在亂世中的喧嚣與繁華，卻在你的出現轟然退去，我持筆寫下傷情千百年，隻為等這一場傾心相遇，你可知當你無視的走過，身後... 2022-11-13
圖文 502膠水弄到衣服上怎麼洗掉
相信大家對502膠水并不陌生，日常生活中，經常會用到它來粘合東西。那502膠水粘手上怎麼去除？PChouse帶大家一起了解下吧。1、在膠水還沒有完全幹的時候或者膠水剛滴在手上時，快速将手放進涼水中，泡幾分鐘，這時你就可以看到膠水變成了一種固... 2022-11-04
圖文鐵圓管規格是什麼
圓管是指兩端開口并具有中空同心圓斷面，其長度與周邊之比較大的鋼材。可用于管道、熱工設備、機械工業、石油地質鑽探、容器、化學工業和特殊用途。圓管表示方法圓管的規格用外形尺寸（如外徑或邊長）和内徑及壁厚表示，其尺寸範圍很廣，從直徑很小的毛細管到... 2022-11-26
圖文在海關保稅發貨的商品靠譜嗎
在海關保稅發貨的商品靠譜嗎?來源:經濟參考報近年來，我國跨境電商業務呈現井噴式發展，各大電商平台紛紛開辟了專門闆塊跨境電商業務在很大程度上滿足了消費者以便捷的方式、低廉的價格購買海外産品的需求然而，網購進口保稅産品并不同于一般網購産品，面對... 2022-10-11
圖文雪佛蘭賽歐3車價
賽歐3是雪佛蘭旗下小型車，今年10月銷量為14,292輛，根據規劃，企業将推出新款車型。網通社從上汽通用雪佛蘭經銷商了解到，2018款賽歐3正式上市，共推出4款車型，其售價區間為6.39-7.99萬元。新車外觀與現款車型保持一緻，主要針對配... 2022-12-04
圖文養成這4個好習慣腎髒更健康
腎髒是人體非常重要的器官，我們的腎髒每天都在不停的運轉着，如果不注重腎髒保養，很容易出現負擔過重的現象。尤其是很多男性因為壓力過大，或飲食不當等原因，而導緻腎不好，這時就要從生活的小細節來進行調理。該做哪些事來改善腎不好的情況？1、控制情緒... 2023-01-02
圖文濟南機場航班什麼時候開通
距離2022夏秋航季還有20天，目前各家航司的新航季航線已經基本都已經挂出，航班換季報告要等換季當天寫，今天給大家先做一個2022夏秋航季出港航班的統計彙總表，算是個嘗鮮版吧，不多說，上圖↓2022夏秋航季濟南機場航班航線統計大緻看一下，新... 2022-10-21
圖文工資不高怎樣投資理财
月薪4000元如何投資理财？首先我們要知道的是多少錢都是可以投資理财的，4000元也可以。因為沒有顯露一些具體信息，我就先假設題主年齡在20出頭，剛踏入職場一年左右，題主每個月消費1300左右，确實很省了，那麼餘留下來是2700元，從原意答... 2022-12-04

tft每日頭條

> 圖文

> numpy中用逆矩陣求方程組的解法