亞馬遜的語音功能設備Alexa能辨别孩子的聲音,并根據需求在網上訂購商品——這是該設備的一個使用案例。當一家人在電視觀看以上關于亞馬遜設備的報道時,發現他們的亞馬遜設備已經幫他們訂購了這一産品,因為這些設備也聽到了該篇新聞報道——這是該設備的另一個用例。有了語音識别加持的人工智能設備已經越來越強大,其實用性也更是讓人意想不到。
繼60年前貝爾實驗室發明了奧黛麗語音識别系統(Audrey),50年前IBM展示了Shoebox語音識别系統之後,上述案例再次凸顯了語音識别技術的力量。
由于電子革新和人工智能的進步,語音識别在過去幾十年裡取得了巨大改進。然而在某種程度上,即使像語音激活助手之類的奇妙應用程序仍處于青春期,部分原因是人類語言和語音的複雜性。
理解的複雜性
我們要考慮到:語言是人類交往的基本形式,協助我們溝通、表達、發聲、認識、理解、和解釋。但這恰恰就是複雜性的所在:有數千種語言,方言的數量甚至更多。我們每個人都有一套獨特的詞彙:一個美籍巴西項目研究人員發現,以英語為母語的成年人平均能聽懂2.2萬到3.2萬個單詞,每天學習一個單詞。英語不是母語的成年人平均能聽懂1.1萬至2.2萬個英語單詞,每天學習約2.5個單詞。
借助嵌入式粘合層,可以在本地執行捕捉和處理用戶聲音或可視數據,而完全不再依賴雲。嵌入式粘合層最簡單的形式,是作為嵌入式服務與雲基服務合作,實現在本地設備上處理數據。粘合層所慮及的關鍵語音任務(要求實現用戶或企業的安全、隐私和保障)可在本地設備處理,還能确保持續可用。非關鍵任務——如自然講話處理——可以使用低帶寬和文本數據以雙向傳輸模式在雲中處理。盡管嵌入式粘合層是在本地處理,但與雲基服務相比,提供了幾乎相同範圍的服務。
這種語音識别技術不僅會徹底颠覆應用程序,而且會給設備帶來重大變革,它就放在我們的門口,就像那些快遞包一樣,等待着我們敞開大門。
編譯:司馬渡 作者:史蒂夫·韋斯頓
相關閱讀
➤獨家丨畢馬威國際物聯網實踐領導人:敲響物聯網萬億美元機會的大門
➤獨家丨物聯網正在改變制造業創造價值的方式
➤獨家丨人工智能開發者需要物聯網數據集市嗎?
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!