李根 發自 一路向南G71
量子位報道 | 公衆号 QbitAI
AI代表的新技術可能不光開拓新領域,也在沖擊固有市場格局。
新技術 舊産品,這樣的趨勢變革正在發生。
語音交互 地圖=?2016年年底,網易北京搬離清華科技園啟迪科技大廈,隔壁的搜狗随即租下兩層,安排搜狗地圖和搜狗語音團隊入駐。半年後,這兩支協同工作的團隊推出完全語音驅動的語音地圖産品,取名“智能副駕”。
這是一款語音驅動的手機導航地圖産品,完全基于手機,完全語音交互。之所以取名“智能副駕”,是因為搜狗希望它在車内充當起“副駕”的作用,有問有答。這算不上是全新的産品,本質還是手機地圖導航。
在這個領域,百度和高德占據了大部分市場份額,在移動互聯網時代厮殺了整整7年,并且在産品細節和體驗上費盡心思,連導航的語音包都花樣百出,希望覆蓋到所有目标群體。
更主要的是,語音為核心交互的地圖導航,在手機之外的終端硬件上早已試水,特别是此前競争激烈的車機和當前愈加火熱的後視鏡上,通過語音驅動拿下車載場景,有巨頭玩家,也有初創廠商,有前裝合作方,也有後裝攪局者。
你可以用語音說出想去的目的地,如果是去一個公園,還能繼續用語音确定抵達哪個門,路線确定後,還能繼續用語音進一步規劃:比方要求不走二環或者中途加油等。這的确與百度、高德地圖的基本語音交互不同。
當然這個功能算不上100%成熟。多輪交互失敗的情況并不罕見,如果要增加一個途經點,有可能會打亂之前的行程規劃。方言識别肯定是不行,即便是普通話也做不到100%。
另有數據稱車載情況下,語音識别準确率隻有90%左右。
這是一個有點冒險的嘗試。
“趟過不少坑”顯然,對于市場份額更大的廠商來說,冒險的成本更大。
一是基于手機的多輪語音交互,識别準确率是個大問題,從硬件方面的麥克風陣列,到手機運算資源消耗的考量,技術挑戰不小。
二是用戶體驗要求高,一旦上線多輪語音交互,内在要求必定是又快又準,一旦識别有誤,或交互“弱智”,用戶體驗就會大打折扣,除了讓人罵娘,可能還會客觀上助攻競争對手。
所以把多輪語音交互帶入手機地圖,多少算是“激進”之舉。但對搜狗地圖來說,包袱要小得多,轉身和嘗試可以快得多,即便技術上的坑不少。
搜狗地圖總經理孔祥來也承認,在産品立項的半年内,“在技術上趟過不少坑”。
首先是語音識别問題。車載環境,手機終端,應用環境接近遠場識别,需要面臨降噪、回聲、糾錯等語音識别方面的技術挑戰,而且導航地圖需求中,隻要一個字、一個詞識别不準,都會造成意圖錯誤,用戶體驗差。
其次是語義理解。車載環境需要盡可能降低眼和手的使用,全靠人機語音對話理解意圖,而多輪交互還會對對話模型和引導模型提出高要求。
最後是數據重構,文字輸入客觀上要求極盡準确,但語音交互卻可能語焉不詳,單如“首都機場”,就可能面臨“航站樓T1、T2、T3”和“出發/到達”等數據的結構關系構建,換而言之是要讓機器模型建立起“知識體系”。
而這次新産品的發布,就是搜狗對上述技術挑戰交出的答卷。孔祥來告訴量子位,主要有三方面:
一圍繞語音識别,針對性做了4000小時車載語音訓練,并專門針對POI(興趣點,包括商家商鋪和标志性建築物等)數據的優化提升語音識别準确率,還要建立語音、語義、地圖概率模型,在多個識别結果中做反向挑選,以此作為準确率輔助手段。
二是在最後産品中準備了10萬個對話路徑,用啟發式對話模型,不斷細分搜索結果類型,通過對話引導,讓機器理解人類的真正意圖。
最後則是POI數據的重構,按照現實世界的隸屬關系,組成父子、容器、區域從屬關系,為語音對話提供相應精準的領域知識,保障播報和上下文理解能力。
孔祥來還說,在三步語音交互方案實現後,目前的搜狗地圖,可能在AI新能力的基礎上,擁有了新的産品形态,産生新模式。
但就此會改變手機地圖競争格局嗎?
難。
換道競争在孔祥來看來,之所以此時上馬“智駕副手”,重點并不在重新搶奪手機地圖市場份額——意義已非常有限。
“現在市場份額搶奪、用戶增長,可能不是最主要的目的。我們現在賦能地圖,希望通過這樣的嘗試去獲得車廠的認可。其實語音交互大方向已經被認可了,但之前車廠嘗試過語音方案後,認為效果一般,所以現在我們相當于通過手機去進行驗證,再進一步獲得車廠認可,比我拿着PPT去車廠硬講,要靠譜很多。”
此外,孔祥來也認為:新的競争已經不再圍繞舊形态展開,即不再圍繞“手機地圖”展開。
“語音交互引入地圖、車内場景後,手機地圖可能要被重新定義了,将不再是傳統的工具軟件。”這位搜狗地圖總經理說。
語音交互 地圖,會構建一種全新的形态和模式。用戶可以在導航中可以用語音說任何事情,不光是導航,可以提供更多服務:問答的能力、搜索水平。這個能力、習慣形成,那遠比在地圖裡做O2O靠譜。
“更加直白地說,相當于得到了一個車内語音交互的入口,就不再是一個地圖軟件 語音,而是在車内的語音助手,隻不過擁有了導航的能力而已,用戶在車内的語音助手,提供車内的任何服務,這跟地圖導航不再是一個維度的事情。”
聽起來像是利用新一代技術,換到了更高的維度參與競争,然後高維打低維,在新場景新模式中完成“彎道超車”。
但事情也并沒有那麼簡單,百度和高德也在利用新技術加碼布局,方向不盡一緻而已。
百度的大方向是車,無論是車聯網、智能駕駛還是無人車,地圖的核心功能是不斷精确的路網數據和搜索能力,把AI、AR等一系列新技術疊加到産品中。
而多輪語音交互方面,實際百度已經在車機産品CarLife、後視鏡CoDriver中引入,何時遷移應用到手機地圖中,可能隻是時間問題。
高德的方向是“數據中心”。在最新闡述的AI應用中,高德的方向是“活地圖”,利用機器模型搭建交通大腦,在實時數據計算的基礎上,把實時路況、動态預測和用戶偏好作為體驗改善的大方向。
目前,語音交互在高德地圖中,被當做了輔助性的搜索手段,技術由科大訊飛提供,這也意味着如果高德在地圖導航中上馬語音交互,多半會與訊飛進一步合作,産品的磨合或許挑戰相對更大。
當然,阿裡集團CTO王堅也曾公開表示,利用阿裡雲的計算力和大數據模型,阿裡自主研發的語音交互也迅速取得了突破,但是否會直接賦能高德,目前難以獲悉。
不過可以确定的是,原本以為競合格局已定的領域,現在又因為AI浪潮的到來,展現出新的可能,新一輪比拼再度開啟,固有優勢帶來的機會,有可能稍縱即逝。
這可能會是很長一段時間内的趨勢。
關于市場格局
最後,量子位補充一點背景資料。
根據搜狗地圖2015年5月公布的數據,在手機地圖市場,激活用戶共計1.5億,排名第三。百度地圖去年6月公布的數據為5億用戶。高德地圖去年10月公布的數據為7億用戶。這些數據,聽聽就好。
實際上,雖然搜狗地圖的知名度,遠不能跟輸入法、搜索和浏覽器相比,但始終是搜狗内部業務中不可或缺的一環,否則很難解釋這樣一個“買來的”業務,已經讓很多用戶忘記了“來路”。
老一輩互聯網從業者和用戶或許有所了解,搜狗地圖也并非完全來自搜狗内部的創造孵化。
它的前身是現任搜狗地圖總經理孔祥來創立的電子地圖服務平台go2map,可追溯至1999年,其後2005年4月,Go2map被搜狐全資收購,成為現在的搜狗地圖,孔祥來也進入搜狗,成為地圖業務的負責人。
在此前的地圖導航競賽中,搜狗地圖一度有機會。在2008年,它是北京奧運的官方合作夥伴,在2011年,它已面向移動端推出了路況導航産品,直至2015年5月,官方披露的數據中,手機客戶端的激活用戶還有1.5億,總量排名第三。
但後來的故事我們都知道了,随着阿裡收購高德,百度加碼O2O,手機地圖的競争逐漸成為B和A的競技場,二者搶占了更多的市場份額,在整個移動互聯網時代,百度和高德為誰是第一,打了整整一個時代。
至今,雙方圍繞市場份額和排名,依舊口水仗不斷,難解難分。
【完】
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!