tft每日頭條

 > 圖文

 > 小波神經網絡的建模

小波神經網絡的建模

圖文 更新时间:2025-02-25 14:31:57

由 Mallat教授提出的小波散射網絡是一種結構與卷積神經網絡高度相似的一 種特征提取網絡,散射網絡是以小波濾波器為卷積核,對圖像進行卷積的多層架構網絡,這種架構很大程度上保證了相對來說的平移不變性和形變穩定性, 同時又給了該架構嚴格的數學以及信号處理領域的理論支撐。目前,小波散射網絡在紋理識别等方面表現優秀,而其計算量少、識别效率高的特點則能夠有效填補上那些缺乏訓練數據,需要快速達到識别效果的領域的空缺。

近年來,由 Yann Lecun 教授所提出的卷積神經網絡在計算機視覺領域取得了長足的進展,在廣泛的分類和回歸任務上俱有出色的表現。 面部識别等領域目前的最優算法皆是基于卷積神經網絡建立的。卷積神經網絡以其感受野以及權值共享的獨特設計思想在大大節省算法複雜度的同時保證了有效提取特征的能力。在 2012 年後,計算機算力的發展為卷積神經網絡提供了騰飛的基礎。然而,其理論上的不足使得大多數的卷積神經網絡設計者都沒有明确的設計方向,将其視作一個黑箱來使用,既滿足不了科學研究的需求,也造成了設計決策上的方向不清晰,直接導緻了設計者對于用于特征提取的卷積層數、卷積核的選取皆處于摸索狀态。同時,卷積神經網絡架構在平移不變性與旋轉不變性等性質上的固有不足使得它隻能通過數據增強,定位後檢測等手段來彌補架構的不足,這極大地增加了算法的複雜度,訓練耗時。

由于以上原因,對卷積神經網絡的理論解釋的嘗試也從未停止。目前, 比較盛行的研究方向除了通過圖像研究的可視化手段(中間激活态/特征圖可視化、空間濾波器組可視化、原始圖像中各組分熱力圖)外,還有從生物學角度、信号處理角度來解釋這一框架,并對其形式做出模仿,從而從輸入信号中提取可以被理解、被解釋的特征。以圖像識别為例,特征提取的層次一般分為三個層次:提取信息的概貌、紋理,從信息中抛掉一些冗餘信息, 即圖像的位移、放大縮小、旋轉;提取具體物體的信息,能夠不受圖像中物體的簡單形變、顔色變化、以及位置變化的影響;提取高度抽象化的特征,能夠從圖像裡獲取物體的本質信息,如能夠從不同類型的椅子中提取它們屬于椅子 這部分的共有特征。就目前而言,第二、第三層次的特征提取在可視化中的表現依然是不明晰的,但第一層的特征提取已經有了比較好的解釋理論,小波散射網絡即是解釋之一。

相比于卷積神經網路在小樣本上表現的不足與其理論解釋的缺乏,Mallat教授提出的小波散射網絡在小樣本下表現良好,且有很好的物理解釋能力。 與此同時,絕大多數的卷積神經網絡的前幾層卷積核都是類小波/類Gabor 窗 的,這意味着散射網絡本身的結構與淺層卷積神經網絡高度相似,繼而,淺層的卷積神經網絡的特性在一定程度上可以以散射網絡的結構特性去解釋

在 Mallat 的小波散射網絡的基礎上,諸多研究者開展了進一步的研究,通過對小波核的替換,将散射網絡與其他機器學習、深度學習算法相結合,達到了較理想的識别效果。2018 年,T.Wiatowski等人基于小波散射網絡的數 學性質出發,将小波散射網絡進行了推廣,允許所有具有弱允許性的小波框架皆可作為小波核,推廣了散射網絡的應用範圍。然而,幾乎所有的小波框架都是通過尺度伸縮獲得的,這相當于局限了散射網絡卷積核的類型,相當于限制了每層卷積層的權重取值範圍。考慮到小波散射網絡的架構本身固有的優點, 在保有其理論解釋能力的同時擴充散射網絡的卷積核選擇範圍是有必要的。

小波散射網絡的卷積核一律為小波,是由尺度變換生成的濾波器組,不同的小波代表不同的濾波器組,獲取的特征也不同。本質上來說,卷積核的性質決定了整個網絡獲取特征的能力。在傳統的特征提取思路中,更是以針對某類 圖像的特性來選擇相應的濾波器。因此,選定一個具有優良性質的卷積核非常重要。其中,Gabor型的卷積核有顯著的優勢,而Gabor 窗則可以視作一類理想的卷積核,原因如下:Daugma證明了哺乳動物視皮層中的簡單細胞是通過固定的二維高斯調制來建模的,這與Gabor窗的特性是一緻的。 而 Hinton在他所提出的深度置信網絡的快速算法中将V1視覺皮層的簡單細胞的感受域形容為局部的,定向的,帶通的濾波器,這與 Gabor 濾波器也是類似的。因此,選取時頻Gabor窗來作為卷積核具有生物上的依據。 早于 Mallat 的散射網絡出現之前,就有諸多研究者使用高斯窗口的短傅裡葉變換,即 Gabor 變換作為圖像分類問題的特征提取器。但是這類特征提取器極少用于多層架構的特征提取網絡上,将 Gabor 濾波器作為卷積核的神經網絡也極少能見到。

與卷積神經網絡的相類似的是,小波散射網絡使用的也是非線性與線性相組合的形式來構成每一層的特征提取,即通過取模和卷積的多層架構獲取特征信息。這類多層架構網絡的卷積核是确定的,無需通過BP算法調整權重,也 就是說無需訓練來獲取參數。在涉及信号處理領域的時頻分析,以及計算機視覺方面的各種識别問題(例如:手寫體識别,紋理識别等),甚至生命科學領域 (如生物神經信号的分析、檢測與預測等)方面,它取得了驕人的成果。 在時頻分析領域,Mallat 将梅爾頻率倒譜系數中的離散餘弦變換替換為小波散射變換,在音頻信号分類上有很好的表現。Mallat 又将小波散射理論應用到平穩随機過程,并将其應用于金融時間序列和湍流的能量耗散一類研究上。 2014 年,Mallat 使用能夠計算不變信号描述符的Haar小波散射變換,采用加法,減法和絕對值的深級聯實現、叠代計算正交 Haar小波變換,并将降維的監督分類算法用在加擾圖像上。 2018 年,借助嚴格的數學推導和理論證明,T.Wiatowski 等人證明小波散射的性質以及優越性,并将其理論進行了推廣,把原始的小波框架泛化為所有滿足弱允許條件的框架。

小波散射網絡作為一類新穎且具有深刻理論與應用價值的算法,在近年來的諸多領域都有了成熟的應用。諸多研究者将其與卷積神經網絡、深度置信網絡等機器學習手段相結合,有了成熟的結果,T.Wiatowski 等人更是利用數學工具對小波散射網絡進一步進行挖掘,得到了符合弱小波允許條件的小波框架, 為小波散射網絡的卷積核選取提供了更多的選擇。但是,總的來說,卷積核的選取依然是被局限在了小波這一類型中,對于散射網絡這一框架并沒有進行有效的開發與拓展。

小波散射變換原理

Mallat在小波變換的基礎上建立了小波散射變換,它所使用的濾波器本質上來說就是尺度函數與其相對應的一組小波函數所對應的濾波器組合,可記作

小波神經網絡的建模(小波散射網絡與卷積神經網絡)1

其中

小波神經網絡的建模(小波散射網絡與卷積神經網絡)2

對應的是尺度函數,其對應的濾波器也就是低通濾波器。而

小波神經網絡的建模(小波散射網絡與卷積神經網絡)3

毫無疑問就是小波函數組,對應的是帶通濾波器,理論上來說,這些函數所張成的空間應是相互正交的,而空間的直和也就對應了整個L^2空間。也就是說,這些函數應是整個空間的完備正交基,他們所對應的濾波器應鋪滿整個頻域。小波散射網絡是一個多層架構網絡,而其每

小波神經網絡的建模(小波散射網絡與卷積神經網絡)4

小波神經網絡的建模(小波散射網絡與卷積神經網絡)5

這類的特征并不具有平移不變和微小形變穩定性的特征,為了進一步提取具有理想性質的特征,對它進行平均,即對它進行一個低通濾波,表示公式為

小波神經網絡的建模(小波散射網絡與卷積神經網絡)6

這即是時頻散射變換的表達式。可以看到,當其處于第零層時,可以直接将其理解為對信号進行一次低通濾波,即為

小波神經網絡的建模(小波散射網絡與卷積神經網絡)7

小波散射變換的目的在于獲取第一層次的特征信息, 即免疫平移、輕微形變的信息。而低通的濾波器能夠獲取輸入信号的概貌,獲取反映其整體大尺度特征的信息,以圖像為例,由低通濾波器選取的信号對于圖像的平移、伸縮、旋轉等局部變化有良好的不變性。因此,小波散射變換獲取了這一部分的信息。 相應的,高頻部分的信号則對于信号的平移、伸縮、輕微形變類的變化具有協變性。換而言之,帶通濾波器選取的信号成分受平移、伸縮、旋轉等變化的影響較大,越是高頻處的濾波選取越易受這些變化的影響。高頻信息中包含着對提取共性特征不利的成分。 但是,僅獲取低頻信息就意味着把包含重要信息成分的高頻部分丢棄掉, 這對于特征提取來說是一種損失。可以認為,散射變換最重要的目的就是在獲取高頻信息的同時,丢棄掉其對平移、形變敏感的部分。散射變換對此采取了 如下的形式:

小波神經網絡的建模(小波散射網絡與卷積神經網絡)8

加模的操作使得提取的

小波神經網絡的建模(小波散射網絡與卷積神經網絡)9

損失了相位因素,可以認為這對特征分類是有利的。低通濾波則繼續抽取變化後的信号的低頻部分,保證了信息的平移和形變穩定性。最後,在 W 代表的濾波器組合固定表示一類小波核濾波器的情況,為了更好地在表示公式上體現散射變換的特征,把表示公式改寫為

小波神經網絡的建模(小波散射網絡與卷積神經網絡)10

總的來說,小波散射變換的形式可以歸結為,對信号做尺度不同的小波變換,對其進行取模,繼而對變換結果做一個低通濾波,所得即是所提取的特征。 從數學上的理解來看,由于同一小波的正交特性,不同特征間應是不具有相關性,每一個各代表了圖像一部分的特征信息,所有層特征的組合即可認為是散射網絡從中獲取的特征之和。不同于卷積神經網絡,散射網絡每一層的特征提取器是多個而非單一特征提取器,且每一層用的都是同一套特征提取器。這與其他的多層架構網絡也不同。同時,不同于卷積神經網絡隻用最後一層的輸出,即将經過所有特征提取器的信息來作為最後的特征輸出,散射網絡在所有層都有輸出,最後将這些輸出的特征組合來作為總的輸出特征。最後也是最顯著的一點,散射網絡不是前饋式網絡,它的所有卷積核都是預先選定的,換句話說,在對圖像進行特征提取之前,它所要提取的目标特征就是确定的。這樣做的好處在于,省略了訓練的過程,可以根據理論提取到具有目标性質的特征, 計算量大大減少的同時也具有了結果的理論解釋,這是一種介于傳統圖像識别和深度學習之間的算法

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved