乾明 發自 世博中心
量子位 報道 | 公衆号 QbitAI
中國AI語音一哥怎麼看未來?
過去,算法即壁壘,軟件即方案,AI語音缺精進但更缺場景。
現在,算法無限接近極限,場景千樹萬樹梨花開,但如何真正讓AI之能觸達用戶?
科大訊飛的答案:終端硬件,而且是算法定義的硬件。
這也是AI領域競争愈發激烈的情況下,科大訊飛展現出的最新動向。
在2019新品發布會上,這家成立20年的AI公司,一口氣發布5款硬件,并對其核心的語音操作系統進行了升級。
與往年不同的是,今年的新品發布會上,硬件完全成為主角。
不僅有核心級産品翻譯機的3.0版本更新叠代,還新推出了智能辦公本、轉寫機、智能錄音筆、學習機等等應用到工作、生活和學習等場景中的産品。
此外,發布會上,科大訊飛雲端語音操作系統iFLYOS進行了優化升級。在今年3月首次亮相的全球首個多語種AI虛拟主播也現身發布會,作為串場,并用9種語言全程直播本次産品發布會。
一句話總結就是:圍繞語音技術高地,借硬件之手,以軟件為基,加速技術落地,覆蓋更多場景。
“借硬件之手”
新品發布環節的大部分時間,都屬于面向C端銷售的硬件産品,也是科大訊飛近年來發展的重點。
根據科大訊飛2018年年報,2018年,科大To C業務實現營業收入 25.17 億,同比增長96.54%,在整體營收中占接近1/3。
訊飛翻譯機3.0
率先登場的,是訊飛的核心産品翻譯機。截止到2018年底,翻譯機2.0的銷量已經超過30萬台。科大訊飛表示,僅2018年,翻譯服務次數5億 次。
現在,這一産品叠代到了3.0版本。與先前版本相比,在線翻譯可翻譯語言覆蓋全球近200個國家個地區,行業A.I.翻譯拓展到7個專業領域。
3.0版本的翻譯機,支持普通話與粵語、東北話、河南話、四川話等方言之間的翻譯,還新增了維漢、藏漢等民族語言翻譯,翻譯速度也再度提升,達到“0.5秒閃譯”,并提升了圖像拍照翻譯水平。
此外,離線引擎也有了新的升級,采用了新一代離線語音識别引擎、離線翻譯引擎,并内置了高通骁龍八核處理器。
科大訊飛介紹,這些變化直接讓離線語音識别訓練模型規模擴大5倍,中英文識别率超95%;翻譯模型容量增加105%,涵蓋詞庫規模擴大1倍。
這款産品已經開售,價格3499元。與2.0版本相比貴了500元。
訊飛轉寫機
緊跟着的是一款轉寫機産品。科大訊飛将其定位為“面向辦公場景的語音轉寫移動工作站”。
最大的亮點,是内置離線解決方案,轉寫準确率能夠達到95%以上;并支持對講話人進行智能分區、中英文同步展示、字幕實時疊加功能等等。
科大訊飛介紹稱,轉寫速度上,能夠“1小時講話,5分鐘出稿”。并支持中英文混合識别,借助基于生成對抗網絡的數據轉換算法以及多分辨率層次化建模算法,中英混合識别效果從50%提升到85% 。
面對專業的轉寫場景,這款設備還有音視頻同步采集功能,借助“語音 圖像”協同翻譯,能夠将專業名詞錯誤率下降50%。
訊飛智能錄音筆
緊接着,是智能錄音筆産品,這是一款軟硬件一體化的設備。同樣具備“1小時錄音,5分鐘出稿”的能力。訊飛介紹稱,借助其研發的音轉文字引擎,轉寫識别準确率能夠達到98%。
與大部分錄音筆不同,這款錄音筆還帶有獨立的觸摸屏,轉寫結果可以直接看到。并支持翻譯功能,而且,翻譯結果不僅能夠實時可見,也能夠實時可聽。
對于錄音的後期整理上,也有不少針對性的功能,能夠對重點快速進行标記,支持語音便捷搜索,通過4G、WiFi方式連接網絡,能夠實現錄音文本快速分享。
續航能力是:滿電工作10小時。而且支持快充,充電5分鐘,錄音兩小時。
在這場發布會上,科大訊飛一共推出了2款錄音筆設備,分别是:
旗艦版SR 701,弧形陶瓷背闆,3.5英寸觸控屏,内置32G内存和20G雲空間,售價2999元。
标準版SR501,機銑玻璃背闆,3.1英寸觸控屏,内置16G内存和10G雲空間,售價1999元。
訊飛智能辦公本
接下來,是一款号稱“開啟筆記本的新時代”的硬件産品,科大訊飛稱其為智能筆記本。
這是一款墨水屏智能硬件設備,屏幕大小為10.3吋。核心的亮點是,能夠讓你在錄音轉寫的同時,也能夠手寫記錄要點。
手寫關鍵詞也可以做到字音同步,隻要點擊手寫的文字,就能播放手寫文本時的語音。
後期的整理與檢索也内置了語音搜索功能,有語音分析、自動标簽、内容關聯等自然語言處理能能力。
此外,作為一款墨水屏電子設備,也支持電子書閱讀功能,也可以手寫郵件。
現在,這款産品已經上線出售,售價4999元。
訊飛學習機
硬件環節最後登場的是一部學習機。這款設備于今年4月首次亮相,與其他學習機相比,最大的不同點在于“智能推薦針對學”。
訊飛介紹稱,基于智學網随機調研的400萬學生中35億條數據,他們發現學生60%的練習都是無效的。圍繞着這個方面,學習機主要有兩大功能:一是數理化精準學習提升效率,二是英語聽說讀寫綜合提升。
如何實現精準學習?基于知識圖譜系統, 科大訊飛将整個過程拆解成了三個步驟:
首先基于人工智能技術快速測試,找到弱項;然後針對弱項進行精準學習;最後鞏固内化形成學習閉環。
圍繞着英語聽說讀寫綜合提升方面,學習機中具備語音評測和語音轉寫功能。效果怎樣?訊飛說,借助這款學習機,“不會英語的家長,也能檢查孩子背課文”。
此外,作為一款學習機,這款設備還有名師視頻、拍照搜題、同步練習、曆年真題試卷等等功能,也都内置其中,售價3999元。
“以軟件為基”:iFLYOS 2.0
這場新品發布會上,科大訊飛發布了智能物聯網操作系統iFLYOS的2.0版本,主講人為科大訊飛輪值總裁胡郁。
這一次在具體的功能上叠代與升級,主要集中在以下的幾個方面:
首先,新增了21種方言識别、語句中英文混合識别能力,并加入了全雙工能力支持用戶連續對話;
其次,深度集成了訊飛的麥克風陣列算法,整合了AIUI語義能力,提供雲端芯一體化解決方案。
第三,開放了多樣的處理模型,用戶可以定制技能以連接自己的服務;使用自己的用戶體系;并支持用戶級和設備級的自定義喚醒詞,使用自己的發音人,把更多品牌元素結合到自己的産品内,打造屬于開發者自己的操作系統。
胡郁介紹稱,現在的iFLYOS 2.0,已經内置了200 技能,有100 内容合作方,1500萬首正版音樂和1200萬小時的有聲内容。設備方面,已經覆蓋4億智能手機,3800萬車載設備,1400萬智能電視,以及500萬機器人玩具。
他說,借助iFLYOS 2.0平台,原來需要6-12個月開發周期的智能語音應用,現在隻需要5天就可以完成了。
關于iFLYOS 2.0,科大訊飛一共提供了兩個版本。
一是基礎版,雲端支持語音合成、基礎語音識别、基礎語義理解、多場景模式、前後攔截器、技能工作室基礎版功能與基礎内容、基礎技能等服務。終端方面,支持拾音降噪、SDK、API和“藍小飛”語音喚醒。
另外是專業版,除了基礎版所有功能之外,支持自定義賬号體系、麥克風陣列設計、面向專業領域的語音識别、芯片、PCBA、整機硬件參考設計等硬件方案,以及音樂、閑聊等其他收費内容。
科大訊飛二十載,如何兌現AI價值紅利?
科大訊飛成立于1999年,至今已過二十載。從2008年A股上市以來,一直是中國人工智能領域不可多得的AI商業化變現的代表。
如何挖掘人工智能價值?在這場大會上,一手創辦訊飛的劉慶峰給出了最新思考:
“AI唯有跨越技術鴻溝,才能真正兌現價值紅利。”
而訊飛,之所以能夠發展至此,正是跨越了多個技術鴻溝之後的結果。
劉慶峰登場之後,首先介紹的就是科大訊飛在過去一年内跨越的“鴻溝”:
語音合成:語音合成自然度(MOS分)達到4.0,即真人說話水平,業界唯一中、英文語音合成自然度達到并超過4.0分(普通人說話水平)的系統。
語音識别:語音識别準确率全面超過速記員。目前,科大訊飛的中文語音轉寫準确率已經突破98%,英文達到95%。
語音評測:在大規模考試評測中達到國家級測試員水平,業界唯一通過國家語委鑒定并大規模實用的技術成果。
機器翻譯:系統通過CATTI全國翻譯專業資格(水平)測試,達到專業資格合格标準。
認知智能:如“智醫助理”通過國家臨床執業醫師綜合筆試測試,讓醫生“核心能力”推廣成為可能。
這次科大訊飛發布會上呈現出來的産品,基本都是圍繞着上述技術構建,也是其兌現價值紅利的載體。
在科大訊飛的董事長看來,2019年是人工智能規模化應用落地元年,也将開始進入應用紅利兌現年。
劉慶峰認為,判斷人工智能技術價值兌換,有三個标準:
首先,要有真實可見的實際應用案例;
其次,能規模化應用的核心産品;
第三,能夠統計數據的應用成效。
以教育領域為例。在他看來,基于人工智能,可以讓每個孩子獲得更精準的教學,讓因材施教落到實處(實際應用案例)。
現在, 科大訊飛智慧教育産品和應用已經覆蓋25000多所中小學(規模化應用的産品)。
他們透露的成績單也頗為亮眼:學生學習效率提升50%,時間花費減少32%,焦慮情緒舒緩20%(應用成效)。
跨越AI技術鴻溝
此外,劉慶峰也給出了訊飛接下來将要跨越哪些“鴻溝”:多模态拟人交互、常識推理突破、通用人工智能等等。
怎麼跨越?他介紹了三把鑰匙:
第一,算法突破。面對小樣本、無監督、個性化問題的基礎理論持續突破;
第二,腦智同飛。腦科學研究和數學統計建模方法深度結合;
第三,人機耦合。人工智能系統和人類行為協作的人機耦合方式持續探索。
其中,人機耦合是核心,劉慶峰也再次提出了“未來屬于人機耦合的新時代”的論斷。
并以翻譯為例,進一步解釋了這一觀點:
雖然科大訊飛的機器口譯測試全球首次達到專業資格合格标準,但是這并不意味着機器可以替代人類同傳。
他說,人和機器的深度協作才是推動人工智能應用真正落地的關鍵,這也是人工智能時代社會倫理和人文發展的需要。
AI落地再探讨
總之,作為中國AI語音的一哥,也是中國AI的最早探索者,科大訊飛給出了最新的思考和探索結果。
AI算法的壁壘,訊飛一次次用國際競賽獎項突破證明。
AI硬件産品的壁壘,現在更多交給消費者。
他們找到場景,打造産品,用軟件定義硬件,創造更多AI落地場景,讓更多人通過終端産品體驗AI。
當然,這條路上,訊飛也不孤單。
越來越多AI公司認定這條路,越來越多AI技術被以産品化形态進入千家萬戶。
亞馬遜已經在AI音箱領域取得成功。
Google已經在“軟件 硬件 AI”戰略上初嘗勝果。
那麼開AI機器轉寫與翻譯之先的訊飛,現在一口氣推出5款AI硬件新品的訊飛呢?
規律和趨勢,會在這裡有怎樣的延續?
不妨拭目以待。
— 完 —
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公衆号(QbitAI)對話界面,回複“招聘”兩個字。
量子位 QbitAI · 頭條号簽約作者
վ'ᴗ' ի 追蹤AI技術和産品新動态
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!