tft每日頭條

 > 寵物

 > 搜狗輸入法鬥圖不能發微信

搜狗輸入法鬥圖不能發微信

寵物 更新时间:2024-07-30 04:16:08

搜狗輸入法鬥圖不能發微信(在微信裡鬥圖還不夠)1

文 | 闌夕

科幻小說裡的情節走向現實并不是那麼容易的事。1989年上映的科幻電影《回到未來 2》裡,主人公馬丁(Marty McFly)在布朗博士的幫助下,坐着時光機器穿越到未來的目的地——2015年10月21日。

隻是到了電影裡的未來真正到來的那一天,我們也沒穿上自動綁好鞋帶的鞋子,踩着磁懸浮滑闆方便上下班也還是沒平均分配的未來。

關于技術的種種浪漫想象,實現起來卻需要反複的實驗、科技不止一代的突破以及從科研到實用的漫長曆程。

漫畫家青山剛昌1984年在《名偵探柯南》裡提出的變聲器,看起來并不太難,卻一直沒能出現在尋常百姓的生活裡:讓一個人的音色實時變換成另一個人的音色,需要的是語音表征學習、語音合成等領域的技術突破。

搜狗輸入法在最近一版更新中上線了「語音變聲」功能,在微信聊天時切換到搜狗輸入法,就可以換着花樣的「變聲」聊天了。這不僅是機器表征學習、風格遷移技術首次落地到消費級産品中,也是微信語音聊天場景中首次有真正可玩的「變聲」玩法。

變聲的應用市面上已經有了不少,制作短視頻的時候我們也可以借助一些變聲濾鏡呈現不同于本人聲音的效果。不過這些變聲應用基本上隻能完成「變聲」中的「變」,沒法在「聲」上有太多花樣,在日常最常用的語音溝通場景——微信,聲音上的玩法還沒有能打的。

「真正可玩」意味着:使用流暢、切換無感、還原度高。

搜狗輸入法鬥圖不能發微信(在微信裡鬥圖還不夠)2

△ 搜狗輸入法「語音變聲」功能體驗

雖然解鎖過程略有門檻,但是合成的語音逼真度相當高。當你不想用自己的聲線和朋友聊天時,搜狗輸入法提供的數種聲線玩法還是相當有趣的——不同身份、不同年齡、不同性别甚至是不同「次元」的角色,你可以在這些角色中自由轉化無縫對接。

首批上線的聲音有五大類、19種音效,其中光明星聲音有四種:仿林志玲、仿周星星、仿高曉松和仿馬雲,另外還有動漫、遊戲、方言音效等可以選擇。在遊戲分類裡還有王者榮耀中妲己的音色,一開口對方就知道是「老江湖」。

開啟變聲玩法需要一點學習過程:首先在輸入框下方長按小地球圖标,将輸入法切換到搜狗,在最上方的功能欄選擇麥克風圖标,就可以進入「變聲」操作。

選擇「高曉松」之後,按下錄制鍵錄下你要說的話,就能獲得一段從「高曉松」口中說出的語音。點擊微信聊天窗口最左邊的語音圖标,按住說話按鈕,等待播放完畢、放開手指發送,你的朋友就會問你怎麼能讓高曉松替你發語音了。

在分别嘗試了短則幾秒、長達一分鐘的語音之後,除了系統生成語音的時間略有差别,整體使用體驗還算是流暢,如果能刻意學習一下明星本人在平時說話時的停頓習慣,結果更能以假亂真。

當然,在其他可以發送語音消息的地方,比如 QQ、陌陌,這個新功能一樣派得上用場。

輸入法之所以能夠在中國市場成為一門不小的生意,除了鍵盤直接輸入無法滿足非英文語種的表達之外,互聯網公司層出不窮的玩法也是以小見大的重要因素。

時至今日,輸入法産品早已不再局限于文本範疇,從快速分享搜索引擎的全網内容,到集成生活服務的無縫連接,從表情包的關聯和自動化生成,到新奇而想象力豐富的語音定制,這些都讓輸入法的應用場景變得豐富多樣。

或許是因為意識到這個細分市場的無窮潛力,近年以來,連Google都頗有耐心的耕耘起來,Gboard輸入法從快速立項到資源扶持都相當顯眼。

相比之下,包袱愈輕的産品,或許還是可以走得更遠。

搜狗輸入法作為「國民輸入法」,多年來首創了不少輸入新玩法,從輸入法皮膚、花漾字再到鬥圖,圍繞如何讓溝通更有趣,搜狗已經做了不少努力,「語音變聲」的上線則是首次将語音處理的前沿技術應用在了toC領域。

這個功能其實已經由搜狗CEO王小川在極客公園商業峰會現場展示過,他挑選了高曉松的聲音,對着手機說了一段話,很快,高曉松的聲音就出現在了會場裡。

王小川在演講中介紹,把任意用戶的音色變成特定人音色是變聲領域最難的技術,這一次是搜狗首次将變聲能力落實到用戶産品,可以看作語音表征學習、遷移學習方面的重大突破。

搜狗輸入法的「變聲」功能由搜狗知音團隊提供技術支持,從用戶層面上有趣好玩的聲音模拟,背後其實是AI語音領域的深厚積累。到 2019 年 3 月底,搜狗手機輸入法日均語音請求較一年前增長 69%,峰值達 6 億次。

從技術上來說,這樣的變聲技術并不是簡單的語音合成,而是把語音、語調、情感做整體遷移。在經過表征學習之後,算法不僅能模拟出音色,還能調動情感,讓合成的聲音更具真實性。

簡單來說,在用戶幾乎沒有感知的「秒變高曉松」過程中,技術會先學習說話者的音色、内容和韻律三大特征,再将音色特征替換成高曉松的銀色,最後,再通過搜狗知音的端到端語音合成技術,使用内容(來自用戶)、韻律(來自用戶)、音色(目标聲音)三類特征合成最終變聲音頻,達到各個方位的相似和自然。

搜狗輸入法鬥圖不能發微信(在微信裡鬥圖還不夠)3

△ 語音變聲仿蠟筆小新

通過搜狗輸入法這次更新,用戶體驗到的是微信聊天窗口的聲音新鮮玩法。Google 也曾發布過相關技術的研究,但隻停留在研究層面沒有向消費級應用推進。擁有超過4.5億活躍用戶的搜狗将其應用到最多人使用輸入法上,也是搜狗在 AI 語音上的先進性。

在豐富聊天内容、緩解聊天尴尬的應用之外,這項技術未來還有更廣闊的商用空間。如王小川在演講中所說:「通過變聲技術,現在可以把任何一個人 5 毛錢的音色變成價值50元的音色,而且當他找不同的老師或者導遊的時候,産品也能做到非常标準化,因為輸出高度一緻。今天在表達信息和獲取信息上,語音方面已經可以做到非常的突破了。」

2018年年底,搜狗還聯合新華社聯合發布了首個AI合成男主播,這位主播「克隆」于真人主播邱浩,實際新聞播報中,系統基于兩位真實主播的聲音、表情等真實數據生成模型,工作人員僅需要輸入新聞稿,就可以讓 AI形象自動根據文字播報,AI主播可以自動識别語義并配上對應音調及表情,具備與真人主播一樣的播報能力。

比起「變聲」功能的核心技術,AI主播在語音合成的基礎上,還調動了自然語言能力、多模态識别等多領域人工智能技術,以及成熟的雲計算資源基礎。

或許有朝一日,除了在微信裡讓高曉松幫你發語音,人們也能在搜狗輸入法的助力之下,聊出更多花樣。

曾有英國藝術家創建名為「見信如晤」的社交網站,把曆史上精彩紛呈的信件和電報集結展示,一度吸引了大批的文藝愛好者參與朗讀和互動,締造了一個溫度常在的情感收納箱。

而在數字化的未來,這件工作的延續,恐怕就要交給輸入法産品來完成了,當千百年以後的人類回顧過去,發現表達的形勢可以如此腦洞大開,他們又會如何評價這類技術曆史中的壁畫呢?

真是讓人期待。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关寵物资讯推荐

热门寵物资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved