作者:武亭、徐德帥
在日常生活中,聲音是人們進行信息傳遞的重要媒介,為了保證信息的順利傳遞,突破距離的限制,往往需要對聲音信号進行放大,擴音系統應運而生。
擴音系統是指把聲音信号進行實時放大的系統,主要由麥克風、放大器以及揚聲器組成,在演奏廳,大教室,會議室等大空間場所得到了廣泛應用。但是,擴音系統自使用以來,常常伴随着嘯叫問題,極大地影響了用戶的使用體驗感。嘯叫現象是指音頻信号通過揚聲器播放後,經過一定的傳播路徑,再次被麥克風拾取,經過放大器的處理後,最後經由揚聲器播放,倘若在 “揚聲器-麥克風-揚聲器”的閉環電路中,存在某種正反饋導緻某些音頻頻率發生自激振蕩,就會産生嘯叫現象。
嘯叫的産生會掩蓋正常語音,給人的聽感也不好,而且嘯叫頻點能量很高,嚴重時甚至能破壞會議中的擴聲設備,因此我們需要對嘯叫進行抑制。
我們以單通道擴聲系統為例說明嘯叫産生原理,系統模型如下所示:
該擴聲系統由麥克風、功率放大器和揚聲器組成,其中G是功率放大器,F是聲傳播路徑,v(t)和x(t)分别為聲源信号和反饋信号,y(t)是麥克風的輸入信号,u(t)是經過功率放大器處理後的聲信号。
根據奈奎斯特穩定準則,當閉環系統的某個角頻率w的回路響應的幅度和相位同時滿足以下兩個條件時,就會引起系統的不穩定,從而引起嘯叫。
其中G(w)為放大器的頻率響應,F(w)為聲傳播路徑的頻率響應。總的來說,産生嘯叫必須同時滿足振幅條件:反饋增益大于1。相位條件:聲源信号的相位和反饋信号的相位是相同的。因此嘯叫抑制技術實際上就是破壞嘯叫産生的幅度要求或者相位要求。
研究人員針對嘯叫抑制主要提出了兩大類方法,被動抑制的方法和主動控制的方法。
被動抑制嘯叫的原理是減少直達和反射聲,我們可以根據聲場特性,從聲場布局、聲場調整、擴音系統設計、擴音設備選型等方向抑制嘯叫。主要包括:
(1)從室内建築聲學、如室内的裝修,裝修材料的選擇等方向來抑制嘯叫,具體的方法諸如:擺放更多的桌椅,安裝天花石膏吊頂,選擇吸聲材料作為裝修材料等等。
(2)合理地擺放麥克風和揚聲器:将麥克風和揚聲器置于不同的聲場顯然是最好的方法,可以破壞正反饋,避免嘯叫,但這種方法難以實現。因此我們可通過選擇合适的麥克風和揚聲器的擺放位置來抑制嘯叫,如讓麥克風盡量不要正對揚聲器。
(3)選擇合适的擴聲設備,如盡量選用低敏感度、高指向性的麥克風。
但是,這種方法隻是被動地抑制嘯叫,造價和施工難度太大,不具有普遍推廣意義。
相較于被動抑制嘯叫的方法,主動控制嘯叫的方法利用數字設備進行實現,造價低,可複制,能夠普遍推廣。傳統且主流的主動控制方法有三種,分别為相位調制法、增益控制法和自适應反饋抵消法。
相位調制法
相位調制法,簡單來說就是移頻法和移相法,移頻法和移相法進行嘯叫抑制的原理是把輸入信号的頻率分量往前或者往後移動,使得輸入信号與聲反饋信号頻率之間的疊加現象消失,或者使聲反饋相位和輸入信号的相位産生偏差,破壞了嘯叫形成的相位條件,從而達到抑制嘯叫的目的。該方法算法簡單,且對擴聲系統增益有明顯提升,可以快速實現嘯叫抑制,但是對輸入信号進行移頻或者移相的操作,對信号的音質損失很大,會導緻聲信号的音質效果變差。
增益控制法
增益控制法通過降低正反饋環路中的增益,破壞了嘯叫形成的幅值條件,達到嘯叫抑制的效果。根據需要增益值降低的頻帶寬度的範圍,增益控制法分為三類,自動增益控制法(AGC),自動均衡法(AEQ)和基于陷波濾波器的嘯叫抑制法(NHS)。當需要将系統增益降低時,AGC會在信号的整個頻帶範圍内降低增益,有些沒産生嘯叫的頻點幅值也會被降低。AEQ會把聲音信号分為幾個頻段,将嘯叫頻點對應的頻段進行增益衰減,整體受影響不大。而NHS是在特定的頻率點進行增益控制,采用陷波濾波器的嘯叫抑制法隻對自激振蕩的頻率點附近進行增益控制,在嘯叫頻率點檢測準确的情況下,對附近頻率的幅值影響比其它兩種方法小,并且計算複雜度低。
自适應反饋抵消法
自适應反饋抵消法(AFC)根據輸入信号,對聲傳播路徑進行建模識别,從而估計得到聲反饋信号,最後在麥克風的輸入信号中減去估計出的聲反饋信号,從而實現嘯叫抑制。目前AFC的關鍵在于自适應算法的選擇,應用較為普遍的是最小均方誤差算法(LMS)。理論上如果可以精确地估計出聲傳播路徑,AFC可以完全地消除嘯叫。但是揚聲器信号和麥克風信号一般具有一定的相關性,會造成一些估計誤差,利用噪聲信号法、非線性處理法等去相關技術可降低兩種信号的相關性,但是去相關技術會導緻一定的聲信号失真,因此需要根據實際使用場景在去相關和音質之間做一個權衡。
近年來随着深度學習的發展,研究人員提出了基于深度學習的嘯叫抑制解決方案,這類算法包含三個部分,特征提取,學習模型和訓練目标。通過把嘯叫信号和純淨語音信号混合得到的聲信号作為訓練樣本,最終訓練出能夠抑制嘯叫的網絡模型。利用深度學習進行嘯叫抑制的處理步驟通常是首先獲得摻雜嘯叫信号的混合聲信号作為輸入數據,再對混合聲信号提取語音特征,根據期望聲信号的不同提取不同的特征,常用的特征有時頻特征、頻譜、梅爾倒譜(MFCC)、Gamma倒譜(GFCC)等特征,之後建立網絡模型,網絡模型通常是RNN系列的模型及其變種,例如LSTM、GRU等。最後對網絡模型進行訓練得到一個可以将混合聲信号映射為純淨語音信号的網絡模型。目前,利用深度學習進行嘯叫抑制的技術正在快速發展,希望在抑制嘯叫方面能夠達到更好的效果。
總的來說,傳統方法和基于深度學習的嘯叫抑制方法各有優缺點,我們需要根據實際應用場景來選擇最合适的方法。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!