深度價值網絡-tft每日頭條

深度價值網絡

生活更新时间:2025-08-10 18:18:09

—— 原文發布于本人的微信公衆号“大數據與人工智能Lab”（BigdataAILab），歡迎關注。

深度價值網絡（大話深度信念網絡）1

讓我們把時間撥回到2006年以前，神經網絡自20世紀50年代發展起來後，因其良好的非線性能力、泛化能力而備受關注。然而，傳統的神經網絡仍存在一些局限，在上個世紀90年代陷入衰落，主要有以下幾個原因：

1、傳統的神經網絡一般都是單隐層，最多兩個隐層，因為一旦神經元個數太多、隐層太多，模型的參數數量迅速增長，模型訓練的時間非常之久；

2、傳統的神經網絡，随着層數的增加，采用随機梯度下降的話一般很難找到最優解，容易陷入局部最優解。在反向傳播過程中也容易出現梯度彌散或梯度飽和的情況，導緻模型結果不理想；

3、随着神經網絡層數的增加，深度神經網絡的模型參數很多，就要求在訓練時需要有很大的标簽數據，因為訓練數據少的時候很難找到最優解，也就是說深度神經網絡不具備解決小樣本問題的能力。

由于以上的限制，深度的神經網絡一度被認為是無法訓練的，從而使神經網絡的發展一度停滞不前。

2006年，“神經網絡之父”Geoffrey Hinton祭出神器，一舉解決了深層神經網絡的訓練問題，推動了深度學習的快速發展，開創了人工智能的新局面，使近幾年來科技界湧現出了很多智能化産品，深深地影響了我們每個人的生活。

那這個神器是什麼呢？那就是“深度信念網絡”（Deep Belief Network，簡稱DBN）。

深度信念網絡（DBN）通過采用逐層訓練的方式，解決了深層次神經網絡的優化問題，通過逐層訓練為整個網絡賦予了較好的初始權值，使得網絡隻要經過微調就可以達到最優解。而在逐層訓練的時候起到最重要作用的是“受限玻爾茲曼機”（Restricted Boltzmann Machines，簡稱RBM），為什麼叫“受限玻爾茲曼機”呢？因為還有一個是不受限的，那就是“玻爾茲曼機”（Boltzmann Machines，簡稱BM）。

下面依次介紹一下什麼是“玻爾茲曼機”（BM）、“受限玻爾茲曼機”（RBM）？

一、玻爾茲曼機（Boltzmann Machines，簡稱BM）

深度價值網絡（大話深度信念網絡）2

玻爾茲曼機于1986年由大神Hinton提出，是一種根植于統計力學的随機神經網絡，這種網絡中神經元隻有兩種狀态（未激活、激活），用二進制0、1表示，狀态的取值根據概率統計法則決定。

由于這種概率統計法則的表達形式與著名統計力學家L.E.Boltzmann提出的玻爾茲曼分布類似，故将這種網絡取名為“玻爾茲曼機”。

在物理學上，玻爾茲曼分布（也稱為吉布斯分布，Gibbs Distribution）是描述理想氣體在受保守外力的作用（或保守外力的作用不可忽略）時，處于熱平衡态下的氣體分子按能量的分布規律。

在統計學習中，如果我們将需要學習的模型看成高溫物體，将學習的過程看成一個降溫達到熱平衡的過程（熱平衡在物理學領域通常指溫度在時間或空間上的穩定），最終模型的能量将會收斂為一個分布，在全局極小能量上下波動，這個過程稱為“模拟退火”，其名字來自冶金學的專有名詞“退火”，即将材料加熱後再以一定的速度退火冷卻，可以減少晶格中的缺陷，而模型能量收斂到的分布即為玻爾茲曼分布。

聽起來很難理解的樣子，隻需要記住一個關鍵點：能量收斂到最小後，熱平衡趨于穩定，也就是說，在能量最少的時候，網絡最穩定，此時網絡最優。

玻爾茲曼機（BM）是由随機神經元全連接組成的反饋神經網絡，且對稱連接，由可見層、隐層組成，BM可以看做是一個無向圖，如下圖所示：

深度價值網絡（大話深度信念網絡）3

其中，x1、x2、x3為可見層，x4、x5、x6為隐層。

整個能量函數定義為

深度價值網絡（大話深度信念網絡）4

其中，w為權重，b為偏置變量，x隻有{0,1}兩種狀态。

根據玻爾茲曼分布，給出的一個系統在特定狀态能量和系統溫度下的概率分布，如下：

深度價值網絡（大話深度信念網絡）5

前面講過，“能量收斂到最小後，熱平衡趨于穩定”，因此：

1、簡單粗暴法

要尋找一個變量使得整個網絡的能量最小，一個簡單（但是低效）的做法是選擇一個變量，在其它變量保持不變的情況下，将這個變量設為會導緻整個網絡能量更低的狀态。那麼一個變量Xi的兩個狀态0（關閉）和1（打開）之間的能量差異為：

深度價值網絡（大話深度信念網絡）6

這時，如果能量差異ΔE大于一定的阈值（比如0），我們就設Xi = 1（也即取能量小的），否則就設Xi = 0。這種簡單的方法通過反複不斷運行，在一定時間之後收斂到一個解（可能是局部最優解）。

2、最大似然法

利用“模拟退火”原理尋找全局最優解，根據玻爾茲曼分布，Xi=1的概率為：

深度價值網絡（大話深度信念網絡）7

訓練集v的對數似然函數為：

深度價值網絡（大話深度信念網絡）8

對每個訓練向量p(v)的對數似然對參數w求導數，得到梯度：

深度價值網絡（大話深度信念網絡）9

跟傳統的神經網絡類似，參數w的更新公式如下（a為學習率）：

深度價值網絡（大話深度信念網絡）10

好了好了，公式就講到這裡了，看上去挺複雜的，沒錯，确實計算很複雜，這個梯度很難精确計算，整個計算過程會十分地耗時。

目前，可以通過一些采樣方法（例如Gibbs采樣）來進行近似求解。

玻爾茲曼機（BM）可以用在監督學習和無監督學習中。在監督學習中，可見變量又可以分為輸入和輸出變量，隐變量則隐式地描述了可見變量之間複雜的約束關系。在無監督學習中，隐變量可以看做是可見變量的内部特征表示，能夠學習數據中複雜的規則。玻爾茲曼機代價是訓練時間很長很長很長。

二、受限玻爾茲曼機（Restricted Boltzmann Machines，簡稱RBM）

深度價值網絡（大話深度信念網絡）11

所謂“受限玻爾茲曼機”（RBM）就是對“玻爾茲曼機”（BM）進行簡化，使玻爾茲曼機更容易更加簡單使用，原本玻爾茲曼機的可見元和隐元之間是全連接的，而且隐元和隐元之間也是全連接的，這樣就增加了計算量和計算難度。

“受限玻爾茲曼機”（RBM）同樣具有一個可見層，一個隐層，但層内無連接，層與層之間全連接，節點變量仍然取值為0或1，是一個二分圖。也就是将“玻爾茲曼機”（BM）的層内連接去掉，對連接進行限制，就變成了“受限玻爾茲曼機”（RBM），這樣就使得計算量大大減小，使用起來也就方便了很多。如上圖。

“受限玻爾茲曼機”（RBM）的特點是：在給定可見層單元狀态（輸入數據）時，各隐層單元的激活條件是獨立的（層内無連接），同樣，在給定隐層單元狀态時，可見層單元的激活條件也是獨立的。

跟“玻爾茲曼機”（BM）類似，根據玻爾茲曼分布，可見層（變量為v，偏置量為a）、隐層（變量為h，偏置量為b）的概率為：

深度價值網絡（大話深度信念網絡）12

訓練樣本的對數似然函數為：

深度價值網絡（大話深度信念網絡）13

求導數：

深度價值網絡（大話深度信念網絡）14

總之，還是挺複雜的，計算也還是挺花時間的。

同樣，可以通過Gibbs 采樣的方法來近似計算。雖然比一般的玻爾茲曼機速度有很大提高，但一般還是需要通過很多步采樣才可以采集到符合真實分布的樣本。這就使得受限玻爾茲曼機的訓練效率仍然不高。

2002年，大神Hinton再出手，提出了“對比散度”（Contrastive Divergence，簡稱CD）算法，這是一種比Gibbs采樣更加有效的學習算法，促使大家對RBM的關注和研究。

RBM的本質是非監督學習的利器，可以用于降維（隐層設置少一點）、學習提取特征（隐層輸出就是特征）、自編碼器（AutoEncoder）以及深度信念網絡（多個RBM堆疊而成）等等。

三、深度信念網絡（Deep Belief Network，簡稱DBN）

深度價值網絡（大話深度信念網絡）15

2006年，Hinton大神又又又出手了，提出了“深度信念網絡”（DBN），并給出了該模型一個高效的學習算法，這也成了深度學習算法的主要框架，在該算法中，一個DBN模型由若幹個RBM堆疊而成，訓練過程由低到高逐層進行訓練，如下圖所示：

深度價值網絡（大話深度信念網絡）16

回想一下RBM，由可見層、隐層組成，顯元用于接受輸入，隐元用于提取特征，因此隐元也有個别名，叫特征檢測器。也就是說，通過RBM訓練之後，可以得到輸入數據的特征。（感性對比：聯想一下主成分分析，提取特征）

另外，RBM還通過學習将數據表示成概率模型，一旦模型通過無監督學習被訓練或收斂到一個穩定的狀态，它還可以被用于生成新數據。（感性對比：聯想一下曲線拟合，得出函數，可用于生成數據）

正是由于RBM的以上特點，使得DBN逐層進行訓練變得有效，通過隐層提取特征使後面層次的訓練數據更加有代表性，通過可生成新數據能解決樣本量不足的問題。逐層的訓練過程如下：

（1）最底部RBM以原始輸入數據進行訓練

（2）将底部RBM抽取的特征作為頂部RBM的輸入繼續訓練

（3）重複這個過程訓練以盡可能多的RBM層

深度價值網絡（大話深度信念網絡）17

由于RBM可通過CD快速訓練，于是這個框架繞過直接從整體上對DBN高度複雜的訓練，而是将DBN的訓練簡化為對多個RBM的訓練，從而簡化問題。而且通過這種方式訓練後，可以再通過傳統的全局學習算法（如BP算法）對網絡進行微調，從而使模型收斂到局部最優點，通過這種方式可高效訓練出一個深層網絡出來，如下圖所示：

深度價值網絡（大話深度信念網絡）18

Hinton提出，這種預訓練過程是一種無監督的逐層預訓練的通用技術，也就是說，不是隻有RBM可以堆疊成一個深度網絡，其它類型的網絡也可以使用相同的方法來生成網絡。

牆裂建議

Hinton 大神寫了一篇關于受限玻爾茲曼機的訓練實用指南（《A Practical Guide to Training Restricted Boltzmann Machines》），非常詳細地描述訓練過程，建議仔細閱讀下這篇論文，肯定大有收獲。

掃描以下二維碼關注本人公衆号“大數據與人工智能Lab”（BigdataAILab），然後回複“論文”關鍵字可在線閱讀這兩篇經典論文的内容。

深度價值網絡（大話深度信念網絡）19

推薦相關閱讀

大話卷積神經網絡（CNN）
大話循環神經網絡（RNN）
大話深度殘差網絡（DRN）
淺說“遷移學習”
什麼是“強化學習”
AlphaGo算法原理淺析
大數據究竟有多少個V
Apache Hadoop 2.8 完全分布式集群搭建超詳細教程
Apache Hive 2.1.1 安裝配置超詳細教程
Apache HBase 1.2.6 完全分布式集群搭建超詳細教程
離線安裝Cloudera Manager 5和CDH5（最新版5.13.0）超詳細教程

參考文獻：K碼農-http://kmanong.top/kmn/qxw/form/home?top_cate=28

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

生活郭曉東年輕
1990年，李雪健憑借電影《焦裕祿》成為國民偶像，此後近十年，提到李雪健都會首先想起焦裕祿這個角色。這就是人物角色賦予演員的力量。2021年，時隔31年《焦裕祿》題材再被演繹，同樣講述勞模人物，不同的是《我的父親焦裕祿》是以焦裕祿二女兒焦守... 2023-03-18
生活太陽星座詳解大全
今天的節目我們來聊一聊春季的另一個代表星座，也是春季星座中較大的星座之一，看一看在這個星座中有什麼美麗的神話故事。室女座作為黃道星座中最大的星座，面積約為1294平方度，在全天88個星座中，面積排行第二位，僅次于長蛇座。那麼，什麼是黃道星座... 2023-03-25
生活春季櫻桃樹的修剪關鍵技術
大櫻桃的修剪原則上主要在生長季進行，但由于生産實際情況的制約，有時生長季修剪工作不到位，就需要通過萌芽前修剪來調整。萌芽前修剪應盡量不動大枝，減少傷口以防止流膠，以疏除過密枝、競争枝為主，少短截。大櫻桃修剪一般要求在3月20号前結束，以便後... 2022-12-08
生活漫步者遊戲頭戴式藍牙耳機哪款好
目前市面上的藍牙耳機數不勝數，各種品牌、款式，真的是讓人眼花缭亂。想要選一款性價比的藍牙耳機真不是一件容易的事，為了找個稱心如意的藍牙耳機，我隻能利用下班時間查看最近出來的各款耳機的參數配置和售價，然後選出一個高性價比的耳機。功夫不負有心人... 2022-10-30
生活白參炖雞的方法
白參炖雞的方法?原料：母雞(柴雞或綠烏雞)1隻，白參50克，黃芪50克，紅棗10克，下面我們就來聊聊關于白參炖雞的方法?接下來我們就一起去了解一下吧!白參炖雞的方法原料：母雞(柴雞或綠烏雞)1隻，白參50克，黃芪50克，紅棗10克。做法：（... 2022-06-06
生活女明星為什麼牙齒那麼好
與其說牙齒不好看影響一個人的容貌，不如說影響氣質。很多牙齒有短闆的人不敢大方展現笑容，在自信這一塊總是差了點意思。但現在随着科技的進步，牙齒不整齊、牙花子大或者四環素牙等都有各種拯救辦法，比如矯正、做烤瓷牙等。早年于正出現在觀衆面前是一個發... 2022-12-13
生活像旋風少女一樣好看的電視劇
你們最愛的小編又來了，今天依然是給大家帶來最有趣的影視趣聞，希望你們喜歡。衆所周知，在大部分電視劇中，咖位最高、人氣最高的才能當女主角。不過我們接下來要說的這部電視劇很有意思，劇本身非常火爆，而劇中的一些女配角也是一個比一個火，這部電視劇就... 2023-03-04
生活大量鮮姜怎麼儲存
大量鮮姜怎麼儲存?可以先把生姜洗幹淨晾幹，再放入鹽罐中埋藏即可，或把生姜切成片，然後放入幹淨又幹燥的旋口罐頭瓶，再倒入白酒淹沒并封蓋即可，現在小編就來說說關于大量鮮姜怎麼儲存?下面内容希望能幫助到你，我們來一起看看吧!大量鮮姜怎麼儲存可以先... 2022-06-22
生活台劇想見你演員表
台劇想見你演員表?台劇《想見你》演員表(主演)：黃雨萱(柯佳嬿飾)、黃雨萱(柯佳嬿飾)、陳韻如(柯佳嬿飾)、陳韻如(柯佳嬿飾)、王诠勝(許光漢飾)、莫俊傑(施柏宇飾)、班長(顔毓麟飾)、陳思源(林鶴軒飾)、吳文磊(張翰飾)、昆布(郭文頤飾)... 2022-06-16
生活北京人很難相處嗎
朋友們大家好，今天我和大家說說北京人的性格特征，北京市中國的首都，而且北京文化方面非常發達，好多的文學作品，影視作品，各種各樣的藝術門類北京都有。難免這裡面就有大量以北京人為題材的作品出現，你像話劇《茶館》，包括好多其他的藝術種類，你都能在... 2023-02-01
生活工齡的計算方法是怎樣的呢
工齡的計算是一項非常複雜的工作，但說起來也很簡單，就是你依據你的個人檔案，判斷工作時間的長短。可能有的時候，你的工作時間并不被認可。所以，我們應當按照有關的法律規定來計算。工齡的最初定義所謂工齡，本身是指職工和用人單位建立勞動關系，以工資收... 2022-12-02
生活變廢為寶手工制作簡單大全
黑河環保志願者馬淩平将生活中随處可見的廢舊物品做成了一件件賞心悅目的手工藝品。5月26日，馬淩平舉辦的“寓舊于新～馬淩平手工作品展”吸引了廣大市民紛紛前來參觀學習，為迎接6.5世界環境日的到來，組織開展了“保護環境，從我做起”的互動活動，孩... 2023-01-10
生活小龜苗沒有飼料怎麼養
喂食，是我們養龜的主要工作，也是我們獲得養龜樂趣的主要來源。在龜苗喂食方面，這幾個常見問題就需要我們仔細斟酌：給龜苗喂什麼？什麼時候應該給龜苗喂食？一般情況下龜苗的喂食量是多少？龜苗的喂食頻率該怎麼控制？什麼情況下最好不要給龜苗喂食？△黃蠟... 2023-03-19
生活植物大戰僵屍2雪人怎麼過
來看看《植物大戰僵屍2》暴走雪人，每個關卡都是有千千萬萬種方法過關的，就看你能不能研究出來，這裡的暴走雪人也算是比較經典的，過關的植物可以選擇火龍草，剛地刺，窩瓜，還有高堅果，雙向射手，是不是感覺很常見，當然向日葵是肯定不能少的。開始的時候... 2023-01-01
生活夾饅頭的肉丸做法和配方
夾饅頭的肉丸做法和配方?饅頭半個、豬肉餡一斤、姜蒜少許、食用油适量、胡椒粉适量、蚝油适量、食鹽适量、醬油少許，今天小編就來說說關于夾饅頭的肉丸做法和配方?下面更多詳細答案一起來看看吧!夾饅頭的肉丸做法和配方饅頭半個、豬肉餡一斤、姜蒜少許、食... 2022-06-07
生活哪些樹葉可以做神仙豆腐
從古至今，人們的吃喝便和各種植物分不開，比如人們吃的五谷雜糧，喝的果汁兒等等，都和植物有着莫大的關系。但我國人口衆多，在曆史上曾發生過多次大的災荒，沒有五谷雜糧吃的人，隻能啃樹皮，吃樹葉等等。但即便是吃樹葉，也有很多講究，首先不能吃有毒的樹... 2023-03-09
生活甯夏黃河生态保護發展
甯夏黃河生态保護發展?甯夏地處黃河上遊，地理和生态地位特殊，在推進黃河流域生态保護和高質量發展中作用重要近年來，經過不斷治理和保護，黃河流域生态環境得到明顯改善2020年7月，甯夏出台《關于建設黃河流域生态保護和高質量發展先行區的實施意見》... 2023-02-10
生活我的世界史蒂夫戰鬥力
很快2018年就要結束了，為了迎接即将到來的2019年，《我的世界》裡的所有生物決定停止一切交戰，開展一場身材大比拼，有不少怪物也慕名而來，想要一展自己的身材，快來和小編一起看看T台上的他們都是什麼樣子的吧。得知這個消息之後，末影人便迫不及... 2023-01-01
生活拉是什麼意思
拉是什麼意思?拉，漢語漢字，拼音：lā，本義是手、立兩範式疊加用手使大駐于一之上是拉之範式，我來為大家講解一下關于拉是什麼意思?跟着小編一起來看一看吧!拉是什麼意思拉，漢語漢字，拼音：lā，本義是手、立兩範式疊加。用手使大駐于一之上是拉之範... 2022-06-15
生活正宗的臭豆腐是拿什麼做的
想到奇特的美食，我相信很多人馬上會想到“臭豆腐”。在每個城市的大街小巷，最能引人注目的味道，就是臭豆腐。那麼，這麼奇特的臭豆腐，你不學學它是怎麼做的嗎？經典臭豆腐全部工藝及湯料密方！一：選擇豆腐要用能炸起來的豆腐、豆泡、油豆腐。那種豆腐一般... 2023-03-26
生活玉米澱粉和澱粉的效果一樣的嗎
玉米澱粉和澱粉的效果一樣的嗎?玉米澱粉和澱粉的效果一樣澱粉是廣泛的指代從不同植物中提取的澱粉，而玉米澱粉則是特指從玉米中提取出來的澱粉，我們把玉米放入0.3%的亞硫酸裡浸漬後再經過破碎、沉澱、幹燥等工序即可得到玉米澱粉，今天小編就來說說關于... 2022-08-13
生活南加州海域瀕危魚類
南加州海域瀕危魚類?人民網堪培拉9月23日電（記者陳效衛）據新西蘭英文先驅網報道，新西蘭奧塔哥大學的一項研究發現，新西蘭南部四分之三的野生魚類體内充滿微小塑料衣服和廢棄的漁網是魚類吞咽的高微塑料的主要來源，下面我們就來聊聊關于南加州海域瀕危... 2022-12-01
生活 u型和v型是什麼意思
陳媽媽，葉酸代謝能力檢查報告中的CC型、CT型、TT型是指的什麼？葉酸代謝能力檢測可以早期預防胎兒神經管缺陷、降低孕婦自發性流産、早産、胎兒宮内發育遲緩、妊娠高血壓等。備孕期補充葉酸已經成為常識，被廣大的女性所接受。因為葉酸是胎兒合成神經管... 2022-12-04
生活最愛吃的涼皮做法
丨夏天不知道吃什麼？不如來一份涼皮！丨-風物君語-炎熱的夏天還有什麼比酸辣的涼皮更開胃呢？火紅的辣子充分打開味蕾涼爽細滑的涼皮趕走暑氣今天風物君就帶大家探索一下涼皮的世界幫大家做好準備迎接日益攀升的氣溫▼▲“三秦套餐”。手繪/壞壞貓涼皮、肉... 2023-01-13
生活為什麼睡得晚卻睡不着
開啟正文之前，先來了解一首關于失眠的詩~不寐四首非關枕上愛哦詩，聊複銷愁片子時。老眼強眠終不夢，空腸暗響訴長迹。翻來覆去體都痛，乍暗忽明燈為誰。隻道晝長無那著，夜長難柰（naì）不曾知。半夏覺得真不愧是“詩宗”啊！真的是不僅體會到了失眠的種... 2022-12-26
生活指南者限時優惠多少
Jeep新指南者，新銳城市實力SUV；領先版/精英版車型有機會免費加裝專屬獵裝外觀套件，随時恭候您到店試駕賞車。【到店禮】電話預約到店賞車可領取精美禮品1份；【金融禮】至高24期，8.2萬0利率；【獲得榮譽】我店開業至今蟬聯五星級經銷商，全... 2022-11-28
生活泰康人壽全新健康保障計劃
泰康人壽全新健康保障計劃?随着國民收入水平的不斷提高,人民對美好生活的向往愈發迫切,民衆對風險的防範意識也随之增強,社會對保險産品的需求,對保險服務的要求都在發生着諸多變化在這種背景下,如何根據外部環境來調整并适應自身的成長,挖掘市場潛力;... 2022-11-01
生活以家人之名播放衛視
《以家人之名》大家看了嗎？還在預告階段的時候，就備受期待。現在劇情才播出了幾集，就被觀衆們熱捧，劇荒的人終于又有好劇可以看了。這部劇看劇名就知道是一部家庭劇，譚松韻、宋威龍、張新成三位年輕演員和塗松岩等老戲骨的加盟，使得這部劇演技方面有了保... 2023-01-16
生活美國簽證拒簽了一次
最近，我總結了2022年上半年美國B1B2類簽證的通過率，總體來說是偏低的，通過率隻有53%。（數據是根據美國移民律師官網提供的，準确性無法去深究，但能作為一個參考數據）從數據以及我個人的經驗來分析得出一個非常嚴重的問題：你如果申請B1B2... 2023-02-10
生活家裝軟裝包括哪些
房屋裝修中的軟裝主要是包括六大方面。(1)家具。軟裝家具包括從進門玄關到客廳、餐廳、卧室、廚房、衛生間以及書房的所有家具。家具的類型主要有支撐性家具，以沙發和床為代表。儲藏性家具，以衣櫃以及各種收納櫃為代表。還有就是裝飾類的家具，單純的發揮... 2022-11-25

tft每日頭條

> 生活

> 深度價值網絡

深度價值網絡

相关生活资讯推荐

热门生活资讯推荐

网友关注