tft每日頭條

 > 圖文

 > 訊飛ai語音

訊飛ai語音

圖文 更新时间:2024-07-21 00:18:57

對于多數企業而言,真無線藍牙(TWS)耳機早已成為了一片紅海,尤其是當配套産業鍊愈發成熟之後,讓TWS耳機幾乎成為了“人人能做”的硬件品類。

較低的賽道門檻,讓TWS領域的競争變得十分激烈,從目前的市場發展來看,已經有手機、音頻、PC等品牌下場參與。在這樣一個擁擠的戰場中,是否還有依靠場景細分實現突破的可能?

訊飛ai語音(訊飛未來智能将耳機做成一門新生意)1

訊飛未來智能公司CEO馬嘯給出了肯定的答案:“我認為未來的TWS耳機會被分為兩類:一類是作為手機的配件,替代目前的3.5mm耳機以及其他形态的藍牙耳機,滿足用戶的娛樂需求;另一類将會是聚焦應用場景的功能性TWS産品,比如之前大家看到的骨傳導耳機、運動耳機都屬于這一範疇,而訊飛未來智能公司則要打造基于語音交互功能實現應用擴展的‘辦公耳機’品類,滿足用戶的生産力需求。”

做功能差異化的TWS耳機

包括馬嘯在内的訊飛未來智能公司團隊,其中很多員工都有科大訊飛的工作經曆,而這也成為了訊飛未來智能能夠在智能硬件領域站穩腳跟的基礎。得益于科大訊飛此前在語音識别、語義識别方面的技術積累和領先優勢,訊飛未來智能團隊可以在短時間形成對智能硬件賽道的快速賦能,而馬嘯所說的發展機遇,也正是基于TWS耳機便攜優勢的語音場景。

“在蘋果推出Siri之後,我們就注意到了智能語音交互所擁有的發展潛力,雖然早期的智能助手被很多用戶戲稱為‘智障助手’,但我們認為這個問題的症結并不在助手或者說語音交互形态。”馬嘯表示,早期大家對于語音助手的過高期待值,反而成為了其應用普及的最大絆腳石。

從目前便攜智能設備的整體發展趨勢來看,想要用語音完全替代觸控交互,是不切實際的想法。以最簡單的劃動、點擊操作為例,每次動作與結果的交互反饋已經非常高效,這顯然要比說出語音指令要方便的多。

而且語音交互的應用場景也并沒有大家所想象的那麼寬泛,無論是處于公司、咖啡館還是火車上,都并不适合與機器進行語音交互,因為你在發出語音的同時,也會對周圍的人産生影響。因此,訊飛未來智能公司将目光投入在智能語音領域的同時,也對産品使用場景進行了劃分。

訊飛ai語音(訊飛未來智能将耳機做成一門新生意)2

“當你把TWS耳機日常應用的各種場景進行逐一剝離之後,你會看到有一些地方與語音的契合度是非常高的,比如疫情環境帶來的辦公方式改變,在線上辦公、移動開會的時候,語音的溝通顯然要比文字更加高效,而這就是訊飛未來智能公司目前專注的領域,即為這些金融圈精英、白領人士,提供一個便捷的‘工具性’産品。”馬嘯表示。

訊飛未來智能推出的iFLYBUDS系列産品,被其定位為“會議耳機”,與其他TWS主打音質、佩戴或外形設計不同,它主打的功能是通話、會議錄音以及語音轉文字。實際上,在錄音場景,用戶其實有着很強的硬件需求,最早的錄音機、錄音筆再到這兩年的智能錄音設備,都表明了這個市場的發展空間是始終存在的。

另一方面,随着半導體行業的發展,人們身邊智能設備的算力都在提升,具體到TWS領域内,現在的處理芯片性能已經産生了冗餘,即便廠家加入了主動降噪、通話降噪、低延遲優化、多設備連接等功能後,其處理能力依然沒有被完全釋放,因此訊飛未來智能公司才能将錄音、文字轉譯等功能融入其中。

這些功能應用除了在采訪等專業場景,如今很多生活場景也需要錄音進行輔助,但iOS系統在錄音方面有着自己的限制,安卓系統的錄制質量、可錄音應用的覆蓋範圍,也非常地有限。訊飛未來智能公司的TWS産品,則在耳機中設立了兩套工作流,聲音會被分為兩路,一條聲音信息用于用戶通訊,另一條聲音鍊路則會用于聲音記錄及轉寫,形成生産力。

算法、數據成為關鍵“軟實力”

“你可能會覺得,在TWS産品中加個錄音功能,這并不是一件很高門檻的事情,但實際上是需要對芯片層進行深度的二次開發才能實現的。并且這項功能還有很大的場景擴展價值”馬嘯告訴钛媒體App。

對聲音的提取其實隻是産品的基礎功能,而訊飛未來智能TWS耳機的殺手锏則在于“聲音處理”,在線上辦公過程中,電話會議的文字量往往是非常驚人的,以普通人每分鐘120~200字的語速計算,1個小時的電話會議,形成的文字量就會超過1萬字,如果某個産品隻提供給用戶1小時的錄音文件,對于用戶的工作而言幫助是很小的。

訊飛ai語音(訊飛未來智能将耳機做成一門新生意)3

即便用戶通過軟件進行文字轉譯,那麼呈現在其面前的也會是一篇1萬字的文字稿,并且當中不會有任何的段落标識,并且包含大量的語氣詞、重複詞。目前,訊飛未來智能的TWS耳機産品,已經能夠做到在對語音進行文字轉換的同時,自動區分講話者,并且對重複詞、語氣詞進行自動識别與删除。還支持中文、中英混合、英語、日語、等7種語言以及國内12種方言的語音識别,以及針對專業領域詞彙的理解。

除卓越的軟硬件實力之外,訊飛未來智能已經将“數據”變成了自身的護城河。訊飛未來智能已經搭建了一套支持多垂直場景交互的運營平台——未來智能AI平台,平台上累積近100萬小時的電話數據,有效支持了服務平台的場景打磨。

這些數據,讓訊飛未來智能的智能交互平台能夠為用戶帶來更好的服務體驗,本身成為了一道賽道門檻。不同于傳統的耳機廠商,數據的閉環,讓訊飛未來智能的耳機在銷售後仍然能夠連接用戶,從而形成粘性。據馬嘯介紹,iFLYBUDS的用戶APP活躍度始終保持在70%,記錄上雲率95%。

馬嘯在采訪中提到,下一步訊飛未來智能将會進一步訓練強化自己的AI模型,實現對成段文字提取關鍵詞的能力,再向後發展,則有望通過AI智能,直接讓錄音形成紀要形式的文本。而AI的能力,也會是訊飛未來智能公司在TWS領域的核心競争力之一。

當下很多企業在入局TWS行業的時候,都是在利用品牌力破圈,至于産品與技術方面,更多地是用主流的算法、硬件方案組裝而成。馬嘯表示,訊飛未來智能則希望能夠利用自己的“軟實力”實現破局,此前科大訊飛的語音技術基礎,再加上面向會議場景的語音數據積累,這些算法和數據層面的實力,才是他眼中訊飛未來智能公司的核心競争力。

在初代産品發布後,馬嘯也在全國開始了路演,他提到:“我們的第一波用戶群體相對集中,主要是白領人群,尤其是金融從業者、律師、記者等職業。我接觸這些用戶的時候發現,他們一般都有兩個特點:首先,這些用戶往往都已經擁有像Airpods這樣的耳機産品,iFLYBUDS往往是它的第二個耳機,其次,他們接觸到iFLYBUDS基本都是通過主動尋找或圈内朋友推薦而不是被廣告、推廣所吸引。”

這些處于金融圈的精英群體,所需要的就是一個高效、可靠的會議錄音轉寫工具,而iFLYBUDS的出現,則直接解決了他們的痛點,也因此在圈内快速火爆起來。這也就說明了目前訊飛未來智能所處“辦公耳機”領域的特殊性,這部分用戶群體往往有比較高的消費力,同時它們對錄音這樣的特殊應用場景的需求始終存在,訊飛未來智能能夠在早期獲得市場關注也是得益于此。

訊飛ai語音(訊飛未來智能将耳機做成一門新生意)4

未來除了完善目前已經布局的“會議耳機”和“運動耳機”産品線,訊飛未來智能還會針對出國人群、老年人等有特殊需求的用戶群體推出翻譯耳機、老人耳機等有着較強針對性的産品。正如馬嘯所說:“目前公司所在AI智能領域積累的技術,其應用前景是非常廣泛的,對于訊飛未來智能而言,通過專注于垂直應用場景中的新需求,将能夠不斷創造TWS領域的科技新消費品,不斷發現新的藍海市場。”(本文首發钛媒體App 作者/鄧劍雲 編輯/項歐)

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved