tft每日頭條

 > 生活

 > 人工智能聲音應用實例

人工智能聲音應用實例

生活 更新时间:2024-07-24 20:19:26

人工智能聲音應用實例(AI算法在音頻領域有巨大進化)1

聲網Agora創始人、CEO趙斌

钛媒體App 11月3日消息,全球實時互動雲服務商聲網Agora(NASDAQ:API)主辦的RTE2022第八屆實時互聯網大會正在線上舉行。

相比往年,今年RTE大會更加聚焦實時互聯網技術、人工智能(AI)降噪算法技術突破、安全合規和标準制定、實時互動生态以及“元宇宙”技術落地等。

RTE是“實時互動”的英文縮寫,指用來解決在遠程條件下溝通互動的雙方能夠實時性的真實、無縫還原線下互動的場景和信息傳遞體驗的相關活動,涉及的典型場景包括音視頻通話、直播、實時指令、互動工具、虛拟形象等。

聲網Agora創始人、CEO趙斌(Tony Zhao)在演講中表示,随着行業的發展,RTE概念與邊界已逐步清晰化,更聚焦用戶所需要的共享時空/場景,并能夠達到或者超越線下場景的互動體驗和效果。他還表示,最近一年,AI算法在音頻領域産生了巨大進化,AI 降噪強力能夠抑制超過100個突發噪聲。

早在2015年,實時音視頻技術的布道在國内還處于“三無”狀态,即:無行業會議、無專業書籍、無專業媒體及社區。而剛成立不久的聲網,就在那年就将海外WebRTC大會引入國内。2016年,聲網舉辦實時互聯網大會,并形成一年一會至今。

今年6月,聲網發布2022年第二季度财報,季度營收4100萬美元,比去年同期4230萬美元下降3.2%,主要由于受到“雙減”影響,季度淨虧損為3070萬美元。2022年上半年,聲網總收入達7956.4萬美元,接近8000萬美元,低于2021年全年1.68億美元收入的一半。聲網稱,公司預計2022财年總收入将在1.76億美元至1.78億美元(約合12.97億元人民币)之間。

聲網披露,自2015年誕生以來,RTE大會覆蓋超200個行業場景,累計影響超過200萬開發者。截至今年6月30日,聲網全球注冊應用數量超47.5萬個,同比增長41%。

不過,受到“雙減”等因素影響,聲網部分業務有所調整,并正在尋找新的發展路徑,其中包括通過合規标準占據市場主導和構建生态體系等。

10月下旬的媒體日上,聲網首次披露,其與工信部直屬的中國信息通信研究院建立實時互動聯合實驗室,并且過去一年還參與實時音視頻、SDK安全、智能雙錄、兒童手表、智能電視等多項行業和應用相關的标準建設。

人工智能聲音應用實例(AI算法在音頻領域有巨大進化)2

實際上,當線上會議平台Zoom不再對中國客戶提供付費視頻會議服務後,中國正在加緊制定關于實時互動音視頻體驗的場景标準。

中國信通院泰爾終端實驗室智能産品測評部主任張睿表示,場景标準将首先聚焦在成熟的視頻會議和智能門鈴門鎖的創新場景上,這兩個場景标準也得到了聲網生态夥伴金山辦公與樂鑫的支持。據張睿介紹,實時互動音視頻體驗通用标準4個系列标準将于11月正式發布。

對于“元宇宙”領域,趙斌表示,無論是虛拟形象還是其他玩法,“元宇宙”如果想在社交領域有大的發揮,玩法上還有更多需要突破的空間。因此,聲網把“元宇宙”和API(應用程序接口)能力聚焦在了基礎能力模塊上,并以組合的方式來提供,從而方便合作夥伴靈活選用其中的組件,自行創造不同方式的組合和互動玩法。

趙斌此前接受钛媒體App采訪時表示,聲網希望做“元宇宙”技術服務商,隻專注在實時音視頻領域,幫助解決實際問題,使得他們更快打造相對應的場景。(詳見钛媒體App前文:《聲網Agora創始人趙斌:未來聲網還将做“元宇宙”技術服務商》)

今年是聲網RTE實時互聯網大會的第8年。據悉,本屆RTE大會還邀請了其投資方GGV紀源資本、五源資本等機構,以及思必馳等生态夥伴參與。(本文首發钛媒體App,作者|林志佳)

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved