今年科技圈最熱的詞是什麼?人工智能(AI)!什麼是人工智能?管他的,反正把我家的産品先包裝出AI功能再說。今年很多硬件産品的産品經理可能就是這麼想的,所以我們看到了許多所謂的智能硬件的新品突然有了人工智能技術加持。
人工智能從後台走向前台,走向風口,是一次利大于弊的轉變。更多的人才,更多的企業,更多的資金被投入到這個領域,讓許多行業的工作方式開始發生變化。不光計算機互聯網領域,人工智能技術的發展對整個社會的推進作用都是明顯的,國務院甚至專門針對人工智能印發了發展規劃。作為中國互聯網的三極,BAT自然不會放過這個風口。阿裡和騰訊在激烈争奪人工智能上遊雲計算市場,百度則高調宣布将轉型為人工智能公司,似乎一夜之間“互聯網 ”都變成了“人工智能 ”。
然而在這種大環境下,真正主打人工智能的消費級硬件産品卻不多見。而每當我們說起AI硬件,Amazon Echo所代表的人工智能語音硬件産品總是第一個被人們所提起。或許這是現階段最容易實現或符合客觀用戶需求的人工智能硬件吧,畢竟無人駕駛什麼的,一般人還無法輕易接觸到。最近什麼值得買3C家電編輯部迎來了阿裡巴巴人工智能實驗室推出的硬件産品——天貓精靈X1智能音箱(産品鍊接,8月8日開售,499元),下面我們以《到站秀》的形式與大家分享一下初步的上手體驗。
注意:針對下文中這台工程版機器遇到的問題,阿裡巴巴工程師表示新版固件已經大部分解決,手裡有天貓精靈的值友可以更新到7月31日晚推送的新固件體驗。本文基于工程版硬件和初版固件測試,不代表面向消費者的天貓精靈X1正式版的真實體驗。
硬件部分迷你精緻的小東西,音質對得起售價。
▼ 我們拿到手的這台天貓精靈X1為黑色版,相比白色版沒那麼引人注意,放在我們辦公區的一角,安靜時大家幾乎感受不到它的存在。
▼ 包裝盒上除了天貓精靈字樣,還有天貓LOGO的元素。
▼ 底部是“天貓精靈”App的二維碼,掃描按照頁面引導操作即可下載。
▼ 兩段式設計的外觀,底部為揚聲器單元,有海綿包裹。上半部分則是類膚質設計,比較容易沾染油漬汗漬,如果你想保證它的幹淨,建議不要讓家裡來訪的朋友們頻頻把玩它
▼ 頂部有三個按鍵,靜音鍵與音量加/減鍵。不過音量鍵隻有觸發亮燈時才可見,觸摸式操作,也可以通過語音來調節音量,這點我們之後再提。
▼ 下面這組圖能夠比較好地體現天貓精靈X1的大小,這是與iPhone 6s Plus的對比,可以看出天貓精靈X1的身材十分迷你,放在電視櫃、茶幾乃至書架上都不是問題。
▼ 類膚質材質對于灰塵污漬的吸引力真是max,如果購入這款産品,建議放在一個不容易積灰的地方,或勤加打理。又或者,你也可以選擇放在一個視覺盲區裡,比如較高處,眼不見為淨嘛~
▼ 天貓精靈X1不具備移動使用的功能,需要持續供電,供電口位于底部,隐蔽性不錯。
▼ 未聯網狀态的天貓精靈X1觸發時會亮橙色燈光,配網過程中則是閃起白色燈光。
▼ 配網進行中,可能是工程版的問題,我們收到的這台天貓精靈觸發配網模式是長按靜音鍵 音量減,與App上的指示略有不同(長按靜音鍵)。
對于一個智能音箱,外觀硬件設計隻是其表,更重要的當然是裡子。作為阿裡巴巴“人機交流系統”AliGenie的首個消費級硬件載體,天貓精靈X1傾注了阿裡巴巴人工智能實驗室的技術與努力,同時也被寄予厚望。但一個普通消費者所關注的并不會是這些,所以我們在智能之外,特意将它作為藍牙音箱使用了一小會。
如果僅僅讨論中頻效果,天貓精靈X1可以說對得起499元的售價,高頻則中規中矩,不過低頻略為不足。而低頻量恰恰是一般使用者最容易聽出的效果,因此其實阿裡的團隊在低頻上多做一些功夫的話,天貓精靈X1的開賣後應該會有非常不錯的評價。當然,這個價位上,對其音質提出太高的要求也許有些過分。簡單的說,天貓精靈X1以這樣的外觀設計和音質,定價499元,是比較有誠意的。
軟件部分AliGenie還需要進化。
了解人工智能概念的讀者應該知道,人工智能技術,拼的不僅是研發能力和算法,對于AI這種本身就具備學習能力和進化能力的産品,數據更加重要。亞馬遜Alexa有先發優勢,通過低價銷售Echo,擁有最多用戶,這些用戶每天的使用,都在幫助Alexa進化;Google有搜索有輸入法,能為自家的AI提供海量的數據樣本,國内的百度、搜狗同理。但阿裡巴巴有什麼現有的技術積累可以實現自然語義處理的高成功率?
懷着這種疑問,筆者開始進行天貓精靈X1軟件部分的使用。
特别聲明:以下所有體驗與截圖,均為7月31日新固件推送之前的初版固件,不能代表7月31日版新固件的使用體驗。
▼ 在發布會上,配網(連接Wi-Fi網絡)就是天貓精靈X1宣傳的亮點之一,号稱10秒快速配網。但由于我們拿到的是早期工程版本,一度卡在這一步,十分尴尬;不得已求助阿裡巴巴的工程師,才知道我這個版本第一次配網不是長按靜音鍵,而是長按靜音 音量減組合鍵
▼ 10秒配網确實不是虛傳,按照操作,用iOS或者Android進行配網,均在讀秒間就完成了。應該是使用了天貓精靈獨有的聲紋技術,這也是天貓精靈X1目前區别于其他智能音箱産品的一大特點。
從天貓精靈App底欄可以看到,有天貓精靈、技能、娛樂、我的四欄。其中天貓精靈為呈現用戶與天貓精靈對話記錄所涉及,可以看到你的語音指令被識别為什麼,以及天貓精靈的回答。技能則是一個教程區,教你使用天貓精靈X1的技巧。在現階段人工智能語音産品還無法理解所有自然語句的意思,因此使用時還是需要一定的提問技巧。筆者另有一台亞馬遜的Echo Dot,同樣有一個這樣的Skills展示區。
▼ 聲紋可以說是天貓精靈X1最大的特色,因為這項技術,安全性和便利性都提升了一個等級。通俗的說 ,聲紋類似于指紋,每個人的聲紋都有獨特性。因此和指紋一樣,可以用作一項加密驗證工具。天貓精靈上,聲紋技術應用在了配網、多用戶區分和支付驗證等場景。在多用戶這一項上,它支持最多6位用戶。
另外,天貓精靈X1允許用戶通過語音來控制家中的智能家居産品,但僅限于阿裡智能陣營的産品,需要搭配阿裡智能App使用。鑒于筆者沒有此類産品,無法演示這個環節。
▼ 一個主打語音功能的智能音箱最重要的是什麼?筆者覺得是拾音的可靠度與語音識别的成功率。那麼天貓精靈X1這方面表現如何呢?就我們手中的這台工程版而言,暫時還不及格。希望面向消費者的正式版在固件上已經修複拾音靈敏度的問題。
發布會上,阿裡巴巴人工智能實驗室負責人淺雪提到天貓精靈X1研發過程中的一個難點:如何在音質與喚醒靈敏度之間做到平衡。最終阿裡通過氣密性設計保證了發聲單元與陣列式麥克風之間的隔離,以避免前者幹擾後者。實際體驗中,這一點得到了體現,在不同大小的音量下播放音樂,用相近的說話音量來喚醒天貓精靈,基本都能成功,可見幹擾被降到了比較低的水平。與之相比,筆者的Echo Dot兩種情況下喚醒成功率差得非常大:安靜時日常交談音量即可喚醒,播放音樂時,則多次大聲嘗試才能喚醒Alexa。
但是,就我們收到的這台天貓精靈X1而言,有兩個基本的功能未優化到位:拾音靈敏度、語音識别成功率。
首先,天貓精靈的拾音靈敏度偏低。經過多人多次測試,我們發現在2米左右距離上,以普通音量與普通語速的“天貓精靈”指令很難喚醒它。使用者需要使用比日常交談更大聲、語速更慢、字正腔圓的語句,才能成功喚醒。辦公室的多名編輯輪番上陣,成功喚醒率不到50%,極大的影響了使用體驗。
▼ 其次,語音識别的成功率與自然語義處理能力都有待提高。經過多天使用發現,天貓精靈X1對于快語速人群不夠友好,如以下圖片,語句應為“給我播放一首李宗盛的歌。
▼ 來自播音系畢業的選手的語音指令,原語句為“廣東人吃不吃福建人。
▼ 筆者帶點塑料味的普通話,識别出來是這樣的;
▼ 下圖,筆者也分辨不出原語句到底是什麼了。
▼ 同無法分辨原語句,從這串混亂的語句跳到譚詠麟的歌曲,關聯邏輯有些簡單粗暴了,天貓精靈内的AliGenie還是要學習一個啊。
▼ 原語句下單,識别為下班。
▼ 原語句應為天貓精靈,明天7點叫我起床,可能是語速過快、連讀的原因,識别出了郭敬明
結語:從上面這幾張截圖可以看出來,天貓精靈離一個好用的語音智能音箱,AliGenie離一個聰明的人工智能語音助手都還有很長的路要走。什麼值得買此次發現的拾音靈敏度問題,應該通過固件升級就能很快解決(7月31日晚本文最後校正時,App提示已有新更新。但語音識别成功率,以及自然語義處理的準确率,都不是一朝一夕能夠達到100分水平的。
阿裡巴巴選擇自己做語音方案、自己做AliGenie、自己做AI硬件,說明了阿裡對AI的重視,以及打造生态圈的野心。隻有AliGenie的智商快速提升,阿裡巴巴才能在人工智能語音方面跟上競争對手們的節奏。或許除了硬件之外,阿裡應該學習對手們,基于阿裡生态圈龐大的用戶,在既有的手機App上做一些文章,降低消費者接觸AI産品門檻的同時,也利用海量的語音樣本來訓練AliGenie。
想了解更多相關内容,點擊下方“了解更多”,你會收獲更多相關優質内容
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!