tft每日頭條

 > 寵物

 > 搜狗ai錄音筆怎麼直接播放錄音

搜狗ai錄音筆怎麼直接播放錄音

寵物 更新时间:2024-07-04 01:21:35

搜狗ai錄音筆怎麼直接播放錄音?機器之心原創作者:吳昕,下面我們就來說一說關于搜狗ai錄音筆怎麼直接播放錄音?我們一起去了解并探讨一下這個問題吧!

搜狗ai錄音筆怎麼直接播放錄音(聽寫服務升級為錄音筆OS)1

搜狗ai錄音筆怎麼直接播放錄音

機器之心原創

作者:吳昕

老瓶換新酒,搜狗如何推動錄音筆市場升級?

存在于 20 多年的錄音筆市場,幾乎和 MP3 同歲,但後者已經銷聲匿迹。僅限于擴容、續航、外觀改造的傳統錄音筆,在智能手機日益普及後逐漸進入了增長瓶頸期,産品同質化也越發嚴重。

據新思界産業研究中心發布的《2019-2023 年錄音筆行業深度市場調研及投資策略建議報告》顯示,從 2015 年到 2017 年,全國錄音筆銷量以龜速從 425 萬台增至 432 萬台。

錄音筆如何避免步入 MP3 後塵,在市場中博得生機,成了眼下急需解決的問題。

作為一家語音技術服務商,搜狗試圖充當攪動市場的鲶魚。繼今年春天搜狗推出 AI 錄音筆 C1,半年後,搜狗用具體行動進一步深挖錄音筆市場潛力。近日,搜狗宣布開放其核心技術能力「搜狗聽寫」服務,并牽頭愛國者、萬城集團、索尼錄音筆、紐曼四家錄音筆行業頭部企業成立 AI 創新聯盟。

搜狗 AI 交互技術中心總經理王硯峰對「聽寫服務」的角色進行了定位——錄音筆 OS,它不同于市場上衆多同類服務的原因,主要是它既提供轉寫、雲端、智能編輯等強大的中台服務,還憑借搜狗輸入法提供快速接入和硬件匹配的便利。正如 Google 的安卓系統對于手機,微軟 Windows 對于電腦,搜狗希望将開放的聽寫服務打造成錄音筆的「操作系統」,這是 AI 技術實現更大商業化的生态打法。

系統服務如何賦能?

AI 加持或将會為行業迎來新的轉折點,這是近幾年來錄音筆行業内的普遍共識。但傳統數碼錄音筆廠商在 AI 技術的研發上較為欠缺,且語音識别和轉寫技術壁壘較高。

基于搜狗轉寫技術的搜狗 AI 錄音筆 CI 已經得到了市場的檢驗和認可,其具備實時互譯、雲端分享、中英同傳等多種 AI 功能,以及高達 95% 以上的轉寫準确率都備受用戶青睐,上市後極短時間内就在多個電商平台取得了單品銷量第一的成績等。

搜狗決定将聽寫服務體系開放出來,進而推動整個錄音筆行業的 AI 化變革,這也是搜狗踐行其 AI 戰略的一次有效嘗試,或将讓傳統錄音筆行業從單純依靠硬件銷售的模式轉向硬件 軟件雙服務的商業模式。

在開放「聽寫服務」的策略上,搜狗避開了做開放性平台向廠商提供 API 接口的傳統模式,而是瞄準「錄音筆的 OS」——通過藍牙開放協議,讓合作廠商零成本接入,讓用戶通過 PC 和移動端享用搜狗聽寫增值服務。

目前搜狗輸入法語音請求峰值已超 7 億次,穩居全球最大的中文語音應用,依托于此,搜狗聽寫服務背後的轉寫技術已處于行業領先地位,此外開放的轉寫技術方案包括:

1、完善和高準确度的轉寫技術。實時語音轉寫運用了搜狗自研的延遲可控的 Adaptive Attention-based 端到端建模技術,非實時語音轉寫功能使用業界領先的深層 Transformer-based 端到端語音識别技術,語音轉寫準确率可達 95% 以上。

2、接入搜狗輸入法。由于用戶一般會使用同一個輸入法賬号,基于用戶長期使用的數據積累,系統可以為用戶會建立起個人的輸入詞庫,使用戶常用的專業詞彙、人名地名會被輕松識别。

3、多端同步編輯。無論在 PC、安卓還是 iOS 上,用戶都可以同步對錄音轉寫的文字,進行編輯。未來輸入法可以提供錄音文件的導入,導入完了以後進行閉環的管理和編輯等一系列功能,即使用戶沒有帶錄音筆,換一個電腦登錄自己的輸入法,也可以把錄音文件同步過來,進行跨電腦的編輯。同時由于配備了聲紋識别能力,轉寫的文字可自動區分出說話人的角色,進行分段整理文字。

4、智能編輯。搜狗轉寫服務可以通過雲端智能糾錯編輯技術,基于詞圖搜索和輸入糾錯模型,針對置信度低的轉寫結果提供多個候選詞,幫助用戶對轉寫結果進行糾正,同時還具備了良好的自動區分說話人、智能文本順滑和标點預測等能力,可以為用戶提供更多便捷功能。

5、雲存儲服務。用戶的錄音和文字都能作為一種資産,長期保存在雲端。

此外,在語音增強方面,搜狗自研的 Smart Voice 麥克風陣列算法能夠對噪聲和混響進行多重深度優化,确保人聲的高保真還原。

值得一提的是,本次搜狗聽寫服務實現了與搜狗輸入法的打通,這不僅為聽寫服務帶來了流量和數據上的巨大優勢,同時更是搜狗輸入法「表達信息更簡單」使命的延伸,也是搜狗聽寫服務相比其他語音轉寫平台的優勢所在。

目前,搜狗輸入法在 PC 端占有 99% 的市場份額,在手機端用戶日活超 4.5 億,搜狗聽寫服務基于搜狗輸入法的用戶使用習慣,能夠自動構建個性化識别網絡,使用戶常用語錯誤率下降 40%。

搜狗開放聽寫服務後,可以為市場上 90% 以上的錄音筆産品提供接入服務,讓所有有需求的用戶享受「錄音 1 小時,出稿 5 分鐘」的極緻體驗。

搜狗公司 AI 交互技術中心總經理王硯峰坦言,未來 AI 賦能一定會越來越重,搜狗開放服務是做了一件很重的事兒。

一直以來,傳統錄音行業的研發重點都在于人聲保真和場景降噪,錄音音頻的後續生産力轉化一直被行業所忽略。

基于搜狗聽寫服務,搜狗創新性地開拓出一個專業化的錄音文件後期智能處理平台,幫助用戶輕松實現錄音音頻向文字的轉化,有效節省人力和時間成本,使音頻不僅「可聽」而且「可看」,也推動着多年來進度滞緩的錄音筆行業實現創新躍遷式發展。

聯盟意味着什麼?

發布會現場,搜狗聯合愛國者、紐曼、索尼錄音筆、萬城集團成立了 AI 創新聯盟。現在購買合作廠商錄音筆的用戶可以通過兩條路徑享用搜狗聽寫服務:對于市面上的現有産品,用戶将錄音筆 USB 接口插入電腦,搜狗輸入法就能探測到錄音筆的插入,開始按需執行語音轉寫服務;對于 AI 創新聯盟内企業未來研發的新品,在移動端開放藍牙協議後,用戶通過藍牙與搜狗錄音助手相連,就可以實時完成語音轉寫服務。

可以預見的是,這四大錄音筆生産廠商的加盟将為 AI 錄音筆市場帶來一股軟硬融合的推動力量。從以硬件為主的單一收益模式向硬件 服務的多種收益模式轉變,促進錄音筆行業實現全面智能升級,與 AI 創新深度融合。

而在軟件端,通過聽寫服務接入的輸入法,還将為錄音筆市場帶來龐大的流量池。目前搜狗輸入法 APP 端擁有超過 4.5 億的日活用戶,PC 端更是占據 99% 的市場份額。目前該流量池已經與搜狗的智能轉寫服務打通,未來應用這一服務的用戶将會越來越多。

由于打開輸入法時使用具體的賬号,像特定領域和行業以及個性化詞彙都存儲在自己的賬号裡,因此轉錄的時候,轉錄結果也會貼近你的詞庫。

這也意味着搜狗開放給錄音筆在語音識别、智能糾錯等等方面的能力會在反複應用中不斷錘煉提升,層出不斷的新俚語、新術語也能通過雲端同步其中,錄音筆産品技術能力的成長體系得到了保障,長遠來看其工具價值呈現出了一種穩步上升的狀态。

會上,搜狗 CEO 王小川重申了公司的 AI 戰略。他表示,搜狗很少自稱 AI 公司,但作為一家底色是技術型公司的互聯網公司,AI 是我們的技術之一。搜狗的使命是讓表達和獲取信息更簡單,輸入法是幫用戶表達信息,搜索是幫用戶獲取信息。

堅持「自然交互」與「知識計算」雙驅動是搜狗的 AI 發展路徑。落實到具體産品上,主要為語音交互系統知音 OS 和知識計算平台深智引擎。換句話說,落實在信息表達和信息獲取兩個層面。

目前,搜狗輸入法語音請求峰值超過 7 億次。在從文字走向語音的道路上,搜狗一揮手獲得了巨大的市場份額。同時,搜狗的 AI 語音合成功能、搜狗分身都在今年成為 AI 界的重要新聞。

通過 AI 錄音筆創新、開放搜狗語音轉寫服務、建立 AI 創新聯盟,搜狗打通了錄音筆的産品、技術與産業三個層面的鍊條,有望推動錄音筆行業進入 AI 時代。

随着 AI 落地進入深水期,互聯網公司不再滿足于通過單點技術來實現應用功能,而是融合數據、技術和流量池優勢,通過聯合産業、平台開放來打造持續成長的生态以創造更大的價值。

作為錄音筆行業的新勢力與破壁者,搜狗憑借自己的 AI 技術優勢與硬件能力,率先打破僵局的勇氣可嘉。進一步,通過開放聽寫服務并與多家企業達成聯盟,不僅能給錄音筆市場注入新的增長動力,更能夠通過 AI 賦能更多合作夥伴為産品注入 AI 靈魂,同時也使得錄音筆行業的商業模式從硬件收費模式向硬件 服務模式轉變,推動整個行業的 AI 化轉型。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关寵物资讯推荐

热门寵物资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved