tft每日頭條

 > 生活

 > 林志玲的聲音如何錄入導航的

林志玲的聲音如何錄入導航的

生活 更新时间:2024-10-11 14:40:04

對于有車一族來說,手機中導航軟件必不可少。

不知道各位小夥伴們平時喜歡用哪款導航地圖,反正小黑對高德地圖還是情有獨鐘,因為内置的明星語音導航包确實不錯。比如聲音嗲嗲的林志玲,遊戲玩家熟知的PDD,以及郭德綱、李佳琦等一衆明星。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)1

在衆多語音包中,小黑比較喜歡使用林志玲語音包與小團團語音包,在開車過程中,動聽的聲音可以驅散倦意。“前方五百米下高速”“前方道路擁堵,預計通行時間 7分鐘”,每次聽到語音包發出的聲音,小黑總在想,導航中的聲音成千上萬,應對不同城市道路環境,錄制的語句怎麼也得四五千句。林志玲、小團團等明星錄制這些音頻,恐怕也不容易。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)2

直到小黑了解到 TTS 語音合成技術,才明白絕大多數聲音都不是明星本人錄制,而是依靠語音合成技術憑空“創造”出來的。

搞清楚了明星語音包的真相,小黑突然腦洞大開,普通人是否可以利用語音合成技術,打造屬于自己的導航語音包呢?

高德導航“錄制好聲音”

說幹就幹,小黑拿起手機就在高德地圖中研究起來。沒想到,還真讓小黑發現了高德地圖暗藏的小功能“錄制好聲音”。

打開高德地圖語音包選項,進入導航語音包界面,這裡可以選擇英雄聯盟案例、朱廣權、廣東話等特色語音包。而在右上角,還有一個個小小的“錄制好聲音”按鈕。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)3

進入錄制聲音頁面之後,會有八句提示語,如“準備上路喽,系上安全帶”,“安全到達目的地,下車記得關上車窗”。

錄制完成之後,打開“我的好聲音”按鈕,就可以将自己的聲音插播在駕車導航中了。小黑錄制完成之後,測試了一下,感覺效果并不好。大部分時間依然是林志玲導航語音,自己的聲音根本就聽不到。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)4

在先後錄制了四次聲音之後,小黑總算明白。高德地圖這個功能并不會使用語音合成功能定制個性化語音導航,它隻是将我們的聲音錄制下來,放在固定場景播放。直白點說,高德地圖目前根本做不到定制語音包,小黑想要使用自己語音包替代林志玲語音包,技術上根本做不到。

語音包背後的秘密

高德地圖可以定制明星語音包,為何不能定制普通人語音包?

其實,關鍵在于語音合成技術。高德地圖雖然提供各種明星語音包,但他們本身并不具備語音合成技術,他們的技術源自于科大訊飛。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)5

科大訊飛這個名字,很多小夥伴都很熟悉。訊飛聽見、訊飛語音識别,在很多場合都能看到他們的影子。作為中文語音識别領域的領頭羊,訊飛在語音合成方面的技術同樣數一數二。

在訊飛開放平台,提供在線語音合成功能,可以将文字轉化為自然流暢的人生,并提供100 多種發音人供用戶選擇。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)6

小黑試用了一下訊飛語音合成功能,确實可以看出技術非凡。男聲洪亮、女聲婉轉動聽,還有合肥男聲、山東女聲等個性化聲音可供選擇。

不過,這并不是小黑想要的,小黑想讓科大訊飛利用小黑的聲音,定制出一套獨一無二的聲音庫。就像林志玲語音包、小團團語音包一樣,全世界絕無僅有。

歡迎來到聲音複刻站

科大訊飛真的提供這類服務嗎?還真有。在科大訊飛産品庫中,有一個名為“訊飛留聲”的産品,可以快速、便捷、完美複制我們的聲音。簡單來說,訊飛音庫定制解決方案是為企業量身定做的産品,而訊飛留聲則是它的精簡版,專門為普通用戶打造。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)7

根據科大訊飛的介紹,訊飛留聲可以複刻我們的聲音,為遠在家鄉的孩子講故事;為留守老家的服務讀書讀報;還可以使用妻兒的聲音作為車載導航系統語音包,為我們保駕護航。

具體到應用中,訊飛留聲隻需要自己錄入10句話,5分鐘左右就可以制造完整音庫。

如此神奇的技術,訊飛是如何實現的呢?其實,語音合成有三大要素,分别為信息、音色與韻律。語音信息指的是我們說話的内容,比如與人閑聊、語音朗讀、主持人播報新聞,所有講述的内容都屬于語音信息。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)8

音色是指不同聲音表現在波形方面總是有與衆不同的特性,不同的物體振動都有不同的特點。生活中,每個人的聲音音色都是獨一無二的。平時人們常說的未見其人先聞其聲,指的就是通過聲音音色判斷說話人是誰。

至于韻律,指的是每個人聲音高低快慢特點。比如主持人播報新聞字正腔圓,嗓音中正平和,再比如評書表演藝術家往往“漂、俏、快、脆”,善于運用氣息,說話抑揚頓挫富有韻律感。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)9

針對信息、音色與韻律三個方面,數百年來科學家們做了無數努力。1779年,德國科學家開發了可以發出五個長元音[aː]、 [eː]、 [iː]、 [oː]、 [uː]聲道模型,十二年後加入舌頭與嘴唇模型,可以發出元音和輔音。

可惜,由于當年技術不發達模型建立之後并不能模拟人聲。直到上世紀三十年代,著名的貝爾實驗室發明了電子語音合成器The Voder。

在随後幾十年裡,人們圍繞語音合成這一課題先後提出多種語音合成系統,在2014年以前,語音合成技術已經可以有效模仿人聲,我們小時候聽到的機器人聲音,大多數都是由這些早期語音合成技術提供。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)10

過去的聲音最大的缺點就是蒼白僵硬,輕易可以聽出來人聲與機器聲音的區别。人聲通常飽含情感,語氣語速與韻律都各不相同。因此,現代化語音合成技術都用上神經網絡技術,利用參數合成、情感TTS技術,增加情感線索,讓語音合成出來的聲音更加接近人聲。

科大訊飛參數合成技術,需要走錄音,标注,建模,優化這幾個步驟。首先準備好幾處語庫,語庫通常覆蓋語言中的元音、輔音、音調,然後針對場景錄制語料,接着針對語音語調标注,最後使用 TTS 模型訓練,不斷優化模型,合成獨特的聲音。

訊飛留聲語音合成的過程,其實就是一個深度學習的過程,通過不斷學習,語音合成速度也在加快。早期訊飛留聲語音合成需要一兩個小時,後來隻需要5分鐘。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)11

隻要5分鐘,就可以複制自己的聲音,訊飛留聲這項黑科技聽起來有些炫酷。那麼它的效果如何呢?小黑發現,在論壇上有不少網友體驗過該功能,表示跟本人的聲音有七八成相似度。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)12

▲ 訊飛留聲小程序系統更新維護

然而,等到小黑準備親身體驗一番,卻遇到了阻礙。訊飛留聲官網打不開,訊飛留聲小程序系統更新維護,暫時無法使用。小黑找遍了科大訊飛所有平台,也沒能找到可以正常使用訊飛留聲的方式。

個性語音定制,玩家真不少

或許是因為技術不成熟,或許是因為盈利前景不佳,訊飛目前并沒有開放個性化語音定制。

除了訊飛留聲,業内标準個性語音定制的企業可不少,比如微軟與谷歌。微軟Custom Voice項目啟動時間稍晚于科大訊飛,目前已經可以實現中文、英文等多種語言語音合成。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)13

為獲得優質結果,微軟Custom Voice 要求提供大量真人語句。不同訓練方法需要不同的訓練數據大小,若要使用“統計參數”方法來訓練模型,則需要至少 2000 個不同的語句;“連續式”方法需要 6000 個語句;而“神經”方法需要的最小數據大小為 300 個語句。每一個語句時長不超過15秒,提供的語句越多,合成的語音就越接近真人發音。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)14

與微軟Custom Voice類似,谷歌Lyrebird(琴鳥)也推出了自己的定制語音合成系統,隻需要30個英文聲音,就可以推理并模仿聲音中的情感、語調。

林志玲的聲音如何錄入導航的(如何用自己的聲音來導航)15

琴鳥的神奇之處在于,它不僅能模仿多種其他鳥類的聲音,它還能模仿大自然不存在的聲音,比如說汽車鳴笛聲、伐木用的電鋸聲、相機的快門聲。

從訊飛留聲到微軟Custom Voice,再到谷歌琴鳥,可以看出随着人工智能技術的引入,語音合成技術日臻成熟。隻要掌握足夠多的原始音源,就能将用戶聲音模仿得八九不離十。現階段訊飛留聲無法體驗,或許是在做技術升級。等它發展完善并提供給高德地圖等公司,個性化語音定制可能不是夢。屆時,我們真的不需要林志玲語音導航,用自己家人的語音包導航,豈不是更加溫馨舒适!

圖源:訊飛留聲、微軟Custom Voice

圖源:谷歌琴鳥、pixabay

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved