【中國安防展覽網 焦點新聞】2016年的網紅,借變聲器發布短視頻的papi醬備受關注,作為美貌和智慧并存的奇女子,papi醬的火爆程度讓其他網紅無法望其項背。不過今年我們要說的可不是papi醬,而是她的變聲器。或許大家還記得papi将在16年進行的首次直播,并沒有用變身器,而直播效果也因此有所影響。究竟變聲器有多神奇?經過變聲器的聲音,是否還具有監控偵察價值?
變聲器火了papi醬 聲紋識别産業正在崛起
變身器火了
變聲器是通過改變輸入音頻的音色、音調,并将變聲後的音頻輸出的工具。通過自己發音,共振峰頻率的改變是基本重采樣實現的,從重采樣原理知道,這也同時引發了基頻的變化,為保證基頻變化和共振頻率變化的獨立、互不相關,在基頻移動是必須考慮抵消重采樣帶來的偏移,理論上隻要基頻檢測足夠精确,确保可以保證基頻改變和共振峰頻率改變間的互不相關,通過搬移和改變基頻、語速,實現變聲。
根據變聲器材質不同,變聲器分為變聲器硬件和變聲器軟件。變聲器硬件,即通過硬件實現變聲的工具,譬如,知名動畫名偵探柯南中,柯南偵破案件時扮演毛利小五郎時,使用的蝴蝶結,就是一種變聲器,柯南正是通過這一蝴蝶結,模拟成毛利小五郎的聲音,進行案件偵破的,這一變聲器可稱之為蝴蝶結變聲器。目前,市面上還有很多變聲器軟件,即通過軟件實現變聲的工具,在手機、電腦上使用非常方便。
聲紋識别讓“變聲”打回原形
變聲器軟件在網絡KTV、遊戲、語音聊天等中廣泛被使用,它不僅從聲音上聽起來不同,就連性别、年齡等各種聲音都能模仿,粗爺們也能變成美嬌娘,成為大家娛樂和惡搞的工具。但也有人通過變聲軟件進行不法行為,如通過變身進行電話詐騙、綁匪通話使用變聲軟件等。那麼通過變聲器變聲的聲音還能被識别嗎?
其實,“變聲器”改變了語音的物理屬性,并非改變了所有鑒定意義上的聲學特征。變聲器既然是經過一定設定改變了的“檢材”,那麼用相同設定來改變“樣本”即可。目前,聲紋識别技術通過人工智能技術,将計算機難以認知的“高級聲紋特征”,如:方言口音、習慣用語、贅語、言語缺陷、韻律特征一一分辨。
聲紋識别的主要任務包括:語音信号處理、聲紋特征提取、聲紋建模、聲紋比對、判别決策等。相對于其他生物識别技術,在安全性上,聲紋識别的唯一性不說排第一,但也是名列前茅的,縱然模仿聲音類似,但也是能夠分辨出來的。除了更高的安全指數,與其他生物識别技術相比,聲紋識别還有着其他的優勢:
1、蘊含聲紋特征的語音獲取方便、自然;2、獲取語音的成本低廉,使用簡單,像麥克風、通訊設備等皆可;3、适合遠程身份确認;4、聲紋辨認和确認的算法複雜度低;5、配合一些其他措施,如通過語音識别進行内容鑒别等,可以提高準确率。
目前,聲紋識别較廣泛地應用于安防領域,比如門禁、刑偵破案、銀行交易等場景。而在智能家居等領域,聲紋識别技術也逐漸受到重視。2016“科技 金融,啟創銀行未來”高峰論壇暨第十二屆中國電子銀行年會上,清華大學語音和語言技術中心主任,北京得意音通技術有限責任公司董事長鄭方博士表示,對于遠程身份認證,聲紋是最好的,沒有之一。利用語音識别技術對内容進行識别和情感識别技術對情感進行識别,可以防止假冒,可以檢測真實意圖。
聲紋識别産業機遇與挑戰并存
不過,縱然有着這麼多的優勢,但在實際操作中,聲紋識别卻面臨着重大的挑戰:
1、如何建立聲紋庫和特征:從理論上講,聲紋的獲取是極其容易的,但這僅僅是針對國家相關機構,如目前聲紋庫最全的公安。對企業而言,所有的聲紋數據都需要他們自行采集,這是一件相當具有難度的任務。另外,在數據不全面的情形之下,聲紋特征的提取和建立也就受到了阻礙,從而就難以訓練聲紋識别的機器學習算法,以提高識别的準确率。
2、如何降低内外環境對于聲紋的影響:目前,人們對聲紋識别的要求已經不僅僅滿足于靜态檢測,更多的是動态檢測。在外部環境中,首先,聲音是通過錄音設備進行采集的,不同的型号的錄音設備對語音都會造成一定程度上的畸變,同時由于背景環境和傳輸信道等的差異,對語音信息也會造成不同程度的損傷。這些情況的出現為聲紋識别增添了不少的問題。比如外部環境的影響,哪怕是如今發展較為完善、已經實現落地的語音識别技術,降噪以及去混響方面也依然是其運行中的一大難題。
此外,在内部環境中,對于同一個用戶,即便采集到的兩段語音内容都是相同的,但由于情緒、語速、疲勞程度等原因,語音都會有一些差異性。
盡管聲紋識别目前仍面臨挑戰,但其優勢也較為明顯,目前,聲紋識别在全球市場中的占有率達到15.8%,僅次于指紋和掌紋識别,并呈現出不斷上升的趨勢,我們有理由相信,聲紋識别或将成為語音交互的下一個風口。 目前,投身于聲紋識别的企業開始崛起,部分也已取得了不錯的成果。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!