電話的從發明至今已經有上百年的曆史了,在這上百年裡,人類與電話的交互方式也悄然發生了質的改變。直到手機被發明後标志着智能時代的到來。而智能手機交互方式卻變得止步不前,除了觸摸還是觸摸,就沒有點新鮮的嗎?我們每天捧着手機刷朋友圈,打農藥真的以為我們是在玩手機?而不是手機玩我們?
筆者認為,智能手機應該是無時無刻可以聽懂人話,才叫智能。而恰逢此時智能語音助手的出現才讓我們充分感覺到了智能的存在。那麼在了語音交互之前我們還是先來看看從古至今,人類在信息交互上是如何發展的吧。
快搬小闆凳 開始講課了
通訊基本靠吼 傳遞基本靠腿
在古代,人類沒有的傳遞信息方式靠的就是一張嘴,一雙腿。馬拉松的故事大家應該都聽過,一名雅典士兵靠着一雙腿跑回了故鄉告訴部隊勝利的消息。那個年代人類更多的通訊交互方式是靠自身或是以動物為載體來傳達。
人類因電話發明而改變
140年前電話誕生後,人類通訊才真正意義上有了交互。電話的發展曆史就是一篇人類通訊史。電話的出現讓人與人之間變得更近,也讓世界變得越來越小。而最早的電話使用最廣的則是在戰争領域。
手搖式電話機(圖片來自網絡)
手搖電話機在戰場中運用的最為廣泛,前線指揮官在電話上搖兩下就可以接到後方指揮官。那時候的電話機屬于單線聯系,無需撥号但需要人工連線才能幫忙接通。
不過随着改革開放的到來,“樓上樓下,電燈電話”的夢想在千百中國人心中紮根,那些年家裡能有個電話已經是富貴的象征。而那時候電話座機與目前其實模樣相差并不多,采用數字鍵撥号來與電話控制。
1973年美國摩托羅拉發明了第一款推向民用的移動電話,但人與電話之間依然是靠按鍵的形式進行交互,而知道2007年喬老爺子發布第一款iPhone後,交互方式才徹底被改變。
喬布斯發布第一代iPhone
觸摸的交互形式其實并非蘋果首創,但蘋果在當時将觸摸的體驗做到最好。那時候大家才發覺到屏幕還能如此一般的觸摸簡直不可思議,都被那絲滑的流暢和多點觸控帶來的良好體驗所折服。
智能語音不是聊天機器人
縱觀整個手機和電話發展史,人類與電話之間的交互不管是搖還是按,再到觸摸,都沒有離開過我們的雙手。如今智能的功能越做越豐富,而在交互邏輯上除了觸摸還是觸摸,但為了能徹底解放我們的雙手,就需要新的一種交互方式,智能語音。
提到智能語音就不得不提到人工智能,有智能語音的加持,所有的智能設備才可以變得真的隻能。智能設備首先就是要先從聽得懂人話開始。而智能語音可不是單純的聊天機器人,智能語音是通過及時對話完成交互,實現幫用戶解決問題甚至提出一些合理的建議。
說起手機語音助手方面就不得不提蘋果的Siri和谷歌的Google Now。
蘋果Siri
Siri成立于2007年,2010年被蘋果以2億美金收購,最初是以文字聊天服務為主,随後通過與全球最大的語音識别廠商Nuance合作,Siri實現了語音識别功能。
Siri智能語音助手
每年蘋果都會在iOS系統更新上花大力氣優化Siri,一句“Hi Siri”就可以完全激活Sir語音助手。其最大的特色,則是人機的互動方面,不僅有十分生動的對話接口,其針對用戶詢問所給予的回答,也不至于答非所問,有時候更是讓人有種心有靈犀的驚喜,例如使用者如果在說出、輸入的内容包括了“喝了點”、“家”這些字(甚至不需要符合語法,相當人性化...),Siri 則會判斷為喝醉酒、要回家,并自動建議是否要幫忙叫出租車。
Google Now
說完了蘋果那必須就要來說說他的對手Google,Google Now是在谷歌I/O大會上随安卓4.1系統同時推出的一款應用,作為一款語音助手,它會全面了解用戶的各種習慣和正在進行的動作,并向用戶提供相關信息。
Google Now
相比于Siri作為最早發布的個人智能語音助理産品,Siri必定會遇到強有力的競争對手,被超越也屬正常情況。Google Now優于Siri的一個先天優勢在于與Google搜索功能的結合,用戶搜索的關鍵詞被記錄下來,Google Now智能化讀取關鍵詞後,為用戶提供相關的語音服務。除了處理速度快之外,Google Now針對用戶需求“主動”為用戶發出提醒,而不僅僅是回答用戶的提問,産品性能更為人性化。
但是作為中國用戶,在中文語境下兩款的語音體驗都不盡如人意,Siri的語音識别率不高,稍微有點方言就聽不懂,但是人工智能做的比較好,調戲Siri已經它存在的意義,不過搜索引擎夠強大。
網友調戲Siri(圖片來自微博)
Google Now語音識别率很高,但Google Now不像Siri那樣有人情味,比較呆滞死闆,不能調戲。還一個重要的一點,在中國我們壓根就用不了谷歌的任何服務,而且就算可以用還需要将手機界面設置成英語。
中文語音助手不雞肋
話說我們中國語言博大精深,一句話可以就可以有多重含義。
“夏天能穿多少穿多少,冬天能穿多少穿多少”。
有時候我們不得不佩服老祖宗,能把這麼複雜的語言傳承下來實屬不易。在語音識别方面谷歌和蘋果甚至微軟都很難做到準确識别中文,明明識别非常好,可到了中文模式下本是智能的語音助手卻變成了智障語音。
在中文語境裡做的比較好的不得不提一下訊飛,筆者知道訊飛做智能語音應該還是說因為錘子的堅果Pro上的閃念膠囊,孤陋寡聞的我以前并不是很看好語音輸入和語音識别。但在堅果Pro上看到了訊飛語音輸入後才徹底改變了我對這一事物的看法。
随堅果Pro推出的閃念膠囊(圖片來自網絡)
抛開錘子的閃念膠囊,訊飛可以讓中文語音輸入做到如此高的準确率實屬難得,而訊飛推出的靈犀語音助手也針對中文口音問題進行了識别優化。目前在國内成為了代替Google Now的語音助手。
智能語音是強智能還是弱智能?
弱智能,直接開門見山的給出我的答案。目前來看,智能語音助手還處于很基礎的階段,除了可以滿足用戶的查看天氣預報和定鬧鐘以外很難想象得到能有别的什麼用。英文語境下的智能程度多少要比中文高,其中的原因我分析有兩個。
第一是受語言環境所緻,上面也闡述到了,中文的語言表述非常複雜,複雜程度可以說就連我們自己有時候都聽不明白,一句話可以有好幾種表達方法。再加之中國的方言千變萬化,就算是普通話還會分南區北區江浙區之分。
“劉奶奶找牛奶奶買榴蓮牛奶,牛奶奶給劉奶奶拿榴蓮牛奶”這句話讓NL不分的南方同學念出來估計要難為死了。
第二個原因則是大部分掌握智能語音核心技術的都是國外公司,國外公司不願意将主要心思放在中國,而我們國内的智能語音研發公司又比較稀缺,使得國内的智能語音使用率偏低。
不過随着人工智能浪潮的來襲,我們會更加的急需智能語音助手的幫助。在智能家居如果連人話都聽不懂隻是簡單靠兩三個APP支持那還叫什麼智能?在智能汽車中,如果汽車連我要去大栅(shi)欄還是大栅(zha)欄都聽不懂還怎麼導航?
終極交互方式聯想(純屬聯想 隻為娛樂)
智能語音交互可以說是目前最靠譜的未來暢想,而人類的鑽研和進步是永無止境的,此時我們每天用的叫手機,那今後随着技術的不斷更新,手機或許也就不叫手機了。
眼球交互
早在若幹年以前,三星就在Note3上搭載過眼球翻頁的技術,也算得上是當時一項黑科技的存在,但不知道因為翻頁時過于尴尬所以才取消這技術。試想一下如果這項技術在今後可以實現,那麼應該會極大程度上避免鬥雞眼的發病率。
全息投影
手掌投影操作(圖片來自網絡)
手腕上可以帶上一種全息投影裝置,随用随打開,但終究還是靠手指來進行交互操作,所以隻能說是在設備上進行了創新。不過倒是對練練左手很有幫助。
意念交互
意念控制(圖片來自網絡)
使用意念來控制設備應該是人類的最終極狀态,每個人腦中都可以植入一顆電子芯片,通過思想來控制智能設備。開車時用意念控制車輛的行駛,通話時隻需要用意念控制通訊設備撥打電話。到那時人類才算是徹底解放了雙手。
寫在最後
當智能語音剛剛出現在手機當中時,它隻是作為了一款輔助工具來使用,更多的隻是完成一些很機械式的工作。但随着智能家居和智能移動設備的智能化,手機将肯定還是會作為一個智能中樞,來起到與智能設備聯動的作用。
筆者認為隻有智能語音的加強才可以讓設備聽懂我們需要什麼。雖然目前來說智能語音隻是扮演一個助手角色,而作為設備聯動中樞的手機,首先是要先聽懂。所以今後手機交互的将來,最可能實現的就是讓語音助手變成“語音主手”。
不知大家有什麼意見呢?可以随時留言與筆者溝通。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!