IT之家4月14日消息 企查查 App 顯示,4 月 13 日,科大訊飛(002230)公開了一項名為 “一種方言語音轉換方法、裝置、設備及存儲介質”的專利,申請日期 2020 年 12 月,公開号 CN112652309A。企查查專利摘要顯示,本申請提供的方言語音轉換方法可将目标說話人的源方言語音轉換為符合目标說話人的說話特色的目标方言語音。
根據專利申請書的内容,中國地域廣闊,漢語的方言衆多,漢族社會在發展過程中出現過程度不同的分化和統一,因而使漢語逐漸産生了方言。随着人口流動性增大,語言不通導緻交流障礙是一個亟待解決的問題。該專利首先獲取目标說話人的源方言語音,然後将所述源方言語音轉換為目标方言文本,并從所述源方言語音中提取所述目标說 話人的說話人信息。最後,根據所述目标方言文本和所述目标說話人的說話人信息,合成符合所述目标說話人的說話特色的目标方言語音。
IT之家了解到,科大訊飛這種方法使用預先建立的語音合成模型,模型的訓練目标還包括:使所述對抗生成網絡中的判别網絡無法判别所述源方言訓練語音對應的目标語言合成語音是合成語音還是真實語音。
該專利還詳細介紹了方言訓練模型的建立方法。官方表示,由于目标方言語音以目标說話人的說話人信息為依據合成,因此合成的目标方言語音具有目标說話人的說話特色。
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!