近年來,智能音箱市場異常火熱。上個月,小米 AI 音箱以 299 元的價格強勢入局,引發業内的廣泛關注。讓我們聽聽小米公司聯合創始人、小米電視負責人王川以及小米探索實驗室總經理唐沐解讀小米為何要布局智能音箱,小米 AI 音箱的優勢以及背後的故事。
撰文 | 高靜宜
2014 年 11 月,亞馬遜智能音箱 Echo 橫空出世,上市後經過不斷的性能優化和産品叠代,目前其内置的 Alexa 語音助手已經擁有 1.5 萬餘項功能,同時銷量一路攀升累計達到 1100 萬台,占市場份額的 70.6%。亞馬遜在智能音箱領域的成功為之後布局智能家居奠定了堅實的基礎,也為後來者提供了一種新思路。在國外,谷歌、蘋果等廠商緊跟其後,緻力于瓜分剩餘的市場。與此同時,國内各家公司在智能音箱的探索道路上也并不寂寞,阿裡、喜馬拉雅、小米、出門問問等公司紛紛投入智能音箱的研發,并相繼推出智能音箱産品。其中,小米 AI 音箱憑借低廉的價格強勢入局,引起了業内的廣泛關注。
7 月 26 日,小米正式發布小米 AI 音箱。在外形上,小米 AI 音箱沿用了小米一貫的純白色簡約設計,高度 21.16 厘米,寬度和厚度均為 8.8 厘米,重 636 克。音箱頂部隐藏着環形陣列的 6 組高精度數字麥克風,360 度收音;同時采用波束成型技術,能夠有效屏蔽幹擾,可實現遠距離聲控。
小米 AI 音箱
在内容上,小米 AI 音箱彙集了喜馬拉雅、荔枝 FM、蜻蜓 FM、庫克音樂、貝瓦兒歌、中國廣播、聽聞新聞、樂聽頭條、拿索斯等音頻服務商内容,涵蓋音樂、小說相聲、兒童故事、廣播電台等多項功能。另外,小米 AI 音箱還支持新聞、天氣、鬧鐘、路況、算數、備忘、單位換算、股票、彙率、留言、查找手機等功能。除此之外,小米 AI 音箱不僅可以控制小米電視、掃地機器人、空氣淨化器等米家生态鍊設備,還能夠通過米家智能插座、插線闆等産品控制第三方家居設備。
小米 AI 音箱支持的功能
8 月中旬小米宣布開啟首輪公測,首輪預約量在 24 小時内就突破 100 萬人次,可以想象之後小米 AI 音箱正式發售時的熱度。那麼,小米為什麼要打造 AI 音箱?這款 AI 音箱有什麼優勢?目前使用體驗如何?現階段研發到什麼程度?為此,機器之心在 8 月 22 日小米舉辦的小米 AI 音箱媒體溝通會上,采訪了小米公司聯合創始人、小米電視負責人王川以及小米探索實驗室總經理唐沐,并在現場體驗了小米 AI 音箱「小愛同學」的功能。
小米公司聯合創始人、小米電視負責人王川與小米探索實驗室總經理唐沐
小米為什麼選擇入局智能音箱市場?
據小米電視負責人王川介紹,在四年前,團隊就開始投入小米電視的研發。當時,團隊發現視聽體驗的重要性,于是在三年前開始研發電視音箱。在這個過程中,小米開發了幾款副産品,相繼推出了小米藍牙音箱和小米互聯網音箱。小米互聯網音箱在藍牙音箱優良音質的基礎上可以通過 wifi 接入互聯網,能夠收聽成千上萬首歌曲以及小說、兒童故事等項目。在這裡,團隊還加入了一個按鍵功能,讓用戶可以通過按鍵用語音搜索歌曲。據悉,當時這個功能的反響非常好,得到了用戶的廣泛認可。之後,為了進一步推進音箱的研發,團隊開始思索下一代産品是否可以讓用戶省去按鍵的環節,直接用語音完成控制。于是,語音識别功能由近場改成遠場,在互聯網音箱的基礎上,使用之前研發的硬件、底層軟件、AI 服務等技術,開發了這款小米 AI 音箱。王川總結道:「本質上,我們的智能音箱是一步一步推進,小步快跑。先做聲學,再做互聯網,緊接着實現内容集成和人工智能語音的集成,有這樣的過程才有今天的『小愛同學』。」
事實上,小米 AI 音箱的誕生離不開之前團隊在小米電視上的技術積累與打磨經驗。今年 3 月 21 日,小米發布了人工智能語音電視 4A 系列,全面采用 AI 技術實現語音的的識别、理解并完成相應的功能。「我認為在電視上語音是一個剛需。」王川解釋道,小米電視聚合愛奇藝、騰訊、搜狐、PPTV 等内容服務商的海量内容。内容豐富的同時,用戶搜索就會成為困擾。相較于用遙控器慢慢翻頁,用語音搜索是非常便捷的。基于深度學習模型以及海量數據,小米電視上市至今的幾個月時間裡,對用戶意圖識别的準确度從 80% 提升至 97%。這個過程中,算法的叠代與數據的積累對開發小米 AI 音箱奠定了夯實的基礎。
技術研發過程中遇到的挑戰?
盡管有小米電視方面的支持,在研發小米 AI 音箱的過程中整個團隊仍然遇到了一些挑戰。小米探索實驗總經理唐沐表示,内容是打造智能音箱要解決的第一個問題。内容不是小米擅長的部分,所以在音樂版權上,小米嘗試與騰訊、百度、蝦米等版權方以及三大唱片公司展開合作。另外,王川作為目前國内最大的 KTV 系統提供商雷石的創始人,在這一方面也提供了相應的支持。其次,數據作為訓練人工智能系統不可獲取的要素,也是各家公司研發智能音箱的過程中都會面臨的問題。「我們需要大量的用戶,這樣通過深度學習方法,系統才能利用語料數據不斷提升。不過,我們也一定要謹慎,需要對用戶體驗負責。我們的目标是無論用戶說什麼,我們的産品都能理解,現在看來距離這樣的目标還有一定的差距。」王川說道,「我們要用互聯網的辦法一步一步進行測試,直到至少 95% 的用戶認為這個産品值得推薦、值得購買了,那個時候我們再真正推出這款産品。」
小米 AI 音箱由小米電視、小米大腦、小米探索實驗室以及米家四個團隊協作研發。到目前為止,小米 AI 音箱在内部員工範圍内開展了接近 3 個月的内測。唐沐回憶,由于團隊的工程師大部分為男性,在内測喚醒詞時小米音箱的效果非常好。但是工程師拿到家中以後卻發現,妻子很難喚醒音箱,這是由于之前沒有針對女性語料進行優化。所以團隊搜集了大量的女性喚醒語料來訓練系統。此後,團隊又發現小孩的喚醒存在問題,于是又在海澱教育局的幫助下搜集了 150 個孩子的語料進行針對性優化訓練。唐沐表示,未來還可能會針對小孩開發單獨的模塊,在孩子喚醒音箱時開啟兒童模式,讓音箱做出适合兒童的内容和回複。「我們整個的内測就是這樣,就是把小問題一個一個地解決掉,我們的系統也每天都在進步。」唐沐總結道。
另外,小米還開放了 1000 台小米 AI 音箱的公測計劃。唐沐表示:「我們希望把音箱放在實際用戶的使用環境中,這樣才能收集到真正有價值的語料來改進産品。」他補充道,在選擇公測用戶的時候會設置一個門檻,盡量選取家裡至少擁有十台以上小米智能家具設備的用戶。這也有助于幫助小米打磨智能家居的控制效果。
王川曾多次在公開場合表示,小米是一家專注做硬件的互聯網公司,隻關注自己擅長的部分。他認為,小米是一家開放的公司,每家都公司都有自己的基因和優勢,在小米無法做到極緻的領域,小米會選擇與垂直領域内的頂尖公司展開合作。目前,小米 AI 音箱已經搭載 40 餘項功能,背後涉及的技術十分廣泛。「我們的 TTS、ASR、NLP 以及喚醒技術都結合采用了不同公司的頂尖技術。另外,遠場和近場識别環境不同,需要大量的語料去進行訓練。好消息是我們并非從零開始,而是融合、集成了多家 AI 廠商的一流技術。所以雖然『小愛同學』還沒有正式上市,但是它的成熟的在國内已經屬于最好的了。」王川如是說。
今年 5 月 18 日,小米啟動了水滴計劃,向第三方開放人工智能語音能力和 SDK,也希望與開發者共同探索人工智能語音應用,打造一個合作共赢的模式,也能幫助小米 AI 音箱擁有更多的技能。
小米AI 音箱在購物方面做了哪些準備?
除了語音交互、智能家居控制,語音購物也是亞馬遜 Echo 所具備的基本功能之一。它不僅支持語音選購商品、語音支付,還支持用戶購買之前購買過的商品。無獨有偶,2017 年 7 月 5 日,阿裡推出的智能音箱天貓精靈 X1 也具備購物、繳費的功能。那麼,小米是如何看待智能音箱在購物方面的能力呢?
唐沐認為,智能音箱購物還有一些比較大的門檻,目前來看有點難以逾越。首先,音箱沒有屏幕,在這樣的情況下讓大家有購物的欲望并不容易。唐沐說:「我們自己的思考是說,其實也許未來音箱購物隻在标品上面有市場、有機會。」所謂标品就是具有明确的規格、型号的商品,比如 250 毫升的水、小米手機 5S 等。用戶經過比較簡單的交互就可以确定買到全網最低價的标品,無需在多個産品中進行選擇,也無需擔心寄過來的物品存在品質上的差異。不過,人們在購物時往往存在到處看看的需求,音箱在滿足這種需求上是比較吃虧的。
唐沐提到的另外一個門檻是支付,也就是安全性問題。如果放置在家裡的音箱綁定了用戶的購物賬号,那麼用戶的家人也可以随意購物。假設用戶的女兒年紀很小,如果她也知道可以通過音箱進行購買行為,那麼就成為一種災難。所以,智能音箱購物首先需要具備類似聲紋驗證這樣的技術,然後才合适去做音箱的标品電商。「當然也有一些垂直場景,比如充話費,這種我們可能會先做起來。在音箱上市之後,我們會逐步推出電商方面的一些嘗試,但是不會是大規模做這樣的事情,目前來看還沒有這個打算。」唐沐解釋道。
王川補充道,小米歡迎京東、天貓将服務内置到我們的音箱上,一起去商讨、去嘗試。「不過目前關于聲紋的部分,小米還沒有看到特别靠譜的方案,現在的聲紋交互要達到安全級别還不太現實。不過,我覺得這也是一個演進的過程,相信未來可能會有一定的發展空間。」王川說道。
如何看待智能音箱領域的激烈競争以及小米 AI 音箱的獨特優勢?
現階段,智能音箱市場異常火熱,對此,王川表示,這個市場還需要時間,智能音箱産品還需要打磨。「我認為這個行業的熱度有點過高。今天亞馬遜 Echo 在美國的成功也是經過兩年内用戶的不斷使用,體驗才不斷提升趨于成熟。我認為隻有用戶用了以後,音箱才會越來越好。」他解釋道,小米也并不是因為這個行業熱才選擇做這樣一款産品的。小米想做的是感動人心、價格厚道的産品,出于這個角度,無論大公司或者别人做不做,隻要小米認為這個産品有價值就會去做。同時,王川還擔心如果智能音箱産品在不成熟的階段就進入市場,那麼如果用戶體驗差,口碑不好,就阻礙了這個行業健康發展,等于毀了這個行業。
在談到小米 AI 音箱在激烈的行業競争中存在的優勢時,王川認為,首先,小米 AI 音箱的音質很好;其次,小米在人工智能方面技術相對成熟;另外,團隊也在持續進行用戶體驗方面的優化與提升;而且音箱 299 元的定價也非常厚道。除此之外,王川表示,小米在上遊供應鍊、渠道方面也具有深厚的積累和沉澱,這也是與友商的一大區别。
唐沐補充道,截至目前,小米已經有 6000 萬台智能家居設備在運行,這使得利用音箱控制職能設備得心應手,具有得天獨厚的優勢。「這是其他競品公司所沒有的特質,也是較難邁過的門檻。事實上,我們也确實花了非常多的精力去讓音箱控制好我們的智能電視、燈、風扇、掃地機器人等智能設備,實現對接,希望可以帶給用戶更加方便舒适的體驗。這也是我們音箱區别于其他音箱的重要一點。」唐沐解釋道。
在成本方面的考量,王川解釋小米定價的邏輯有兩點,一是音箱不虧本,二是追求低毛利率。未來,小米 AI 音箱在變現模式也有很多的可能性。王川舉例小米電視的三種變現模式:第一,會員模式,即用戶付費;第二,廣告模式;第三,通過電視出售産品。遷移到音箱上,小米也會進行各種嘗試。他認為,如果小米的音箱音質特别好,那麼對于用戶的付費轉化率會有很大幫助。「我覺得今天中國的用戶可能不太願意為版權付費,但是會為體驗付費。我們的核心是在保證用戶體驗的前提下再探索變現模式,現在我們的音箱還沒有上市,未來還有很多的可能性有待我們去驗證。」
提到國内外智能音箱市場存在的差異,王川表示,國外對于音箱的需求明顯大于國内。「我認為在中國更重要的一個點在于智能家居。」王川說道,「智能音箱既要是一個好音箱,也是一個好助理,也是智能家居的中心,這中間不存在鴻溝。不過未來智能家居不一定隻有一個語音中心。」對此,唐沐也表示了肯定:「也許有些東西會自然而然成為中心,也許永遠都不會有一個中心,重要的是産品背後的服務與技術,這才是我們關注的重點。」
據王川介紹,之前亞馬遜 Echo 團隊已經來過三次,目前也在讨論共同做國際市場的可能性,不過這并不是小米音箱現階段的重點。據透露,現階段小米把語音研發的重點聚焦于普通話,未來可能會向方言和其他語種發展。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!