為了更實際的感受語音交互,前段時間下單了天貓精靈,用了一段時間,除去技術上的限制,覺得它在主要功能上設計還是比較完整的,但是用起來還是不是那麼流暢自然,所以試着從PM的角度寫下自己一些優化想法。
根據VoiceLab 2016年的調研結果,近46.7%的用戶喜歡用Amazon Echo 和 Google Home的原因是可以用來播放音樂和聽書。所以我主要試用了音樂播放這個功能,并結合之前看的 谷歌語音交互設計規範寫了這篇文章。(10分鐘看懂谷歌語音交互設計規範都講了些什麼)
對話式交互設計分三個階段:
- 解決基礎交互問題,讓用戶能開始對話(1-10輪)
- 解決數據和中級交互問題,讓用戶能持續對話(10 輪)
- 解決需求問題,讓用戶能長期對話(超過一周)
目前天貓精靈已經可以支持用戶開始對話了,但是在對話過程中還是不是那麼流暢,但其實為什麼會覺得對話不流暢呢?我覺得主要原因是對話是雙向的,一方的停止都會讓對話被終止,
- 用戶停止:由于缺乏恰當的指引和自然的對話方式,有時候用戶可能試了幾次同樣的功能就失去了對話的興趣(特别是其中還有幾次出錯情況)。所以天貓精靈需要給到用戶指導,和優化自己對話方式,給到用戶信心,以便對話繼續下去。也就是後面講的如何讓對話更自然流暢。
- 天貓精靈停止:因為技術的限制,天貓精靈不可能聽懂用戶說的所有話,目前當識别出錯時,天貓精靈會直接的報錯,從而結束對話。比如“ 對不起,我沒有搜到這首歌“。 但是我們其實可以通過一些對話設計技巧來讓對話繼續下去,也就是後面講的的錯誤情況處理機制。
如何讓對話更自然流暢(避免用戶停止對話)
1、多樣化回答及應答詞
使用多樣應答詞:應答詞是指 “好的” “ 沒問題“, “ Okay“,等等詞語,應答能讓用戶知道系統已經接收識别了來自他們的信息,并讓對話流暢自然。看看我們平時和同事朋友的對話中,當别人提出一個請求時,是不是也會很經常用這類詞?而缺乏應答詞時對話通常會顯得比較冷冰冰。
同樣的,在我們日常的對話裡,一般也不會永遠用同一個應答詞,我們可能會說“好的“ “嗯嗯” 甚至“👌” 來表達确認。 在語音交互裡也是這樣,所以我們可以在系統内配置多歌應答詞表,在回答時随機的提供某個應答詞,以提高我們對話的多樣性。
高頻率對話的多樣化: 我們不需要每個回答都準備N種方式,隻需要對高頻率出現的對話提供多種回答方式就能很大程度提高對話的自然性。 比如在音樂播放的功能裡面,最常使用是播放功能,天貓精靈的回複是“ 即将為您播放#歌曲名詞#“, 如果這句話能用不同的方式表達,那麼用戶會更覺得自己是在跟人對話。
2、主動給出功能引導
在GUI下,用戶可以直觀的看到可操作的功能,但是對話式交互下,用戶不知道産品支持哪些功能,有時候用戶可能試了幾次同樣的功能就失去了對話的興趣。所以天貓精靈需要讓用戶知道自己可以做哪些操作。
我在首次使用的時候,因為在網易雲使用時是“加到我喜歡的歌曲“,所以一直和天貓精靈說的是” 我喜歡這首歌“ 來讓它标記,但是天貓精靈不能識别這句話,我很久後看到文字介紹才知道是用 “收藏“ 這個詞。
所以,由于表達的多樣性,我們需要提前引導,給出具體的例子,來介紹功能和教會用戶該如何表達。比如在用戶首次使用音樂播放的時候,放完幾首歌後,我們可以主動引導用戶“ 如果您喜歡這首歌,可以跟我說“ 收藏這首歌曲””
3、準備用戶表達的多種可能性
亞馬遜的語言設計規範說 “為了确保功能表現的不錯,一個基準是每個意圖都需要30或更多的對話單元,即使是很簡單的意圖”
To make sure your skill performs well, a good benchmark is 30or more utterances per intent, even for simpler intents. You don’t need 100% coverage, but more examples are better. Also, plan to continue adding utterances over time to improve skill performance.
同樣是上面的收藏歌曲的案例,可能隻收錄了“ 收藏“ 這個詞槽(slot),而沒有“喜歡”,但是日常的對話中我們可能更經常的說“ 我喜歡這首歌“,所以我們需要用更口語場景的詞彙,而不要單純的把GUI的詞彙移植過來。同時為了保證功能的覆蓋面,我們需要去想到更多的可能的詞彙, 比如“加星這首歌“ “ 這首歌很好聽“ “
4、處理有歧異的對話
這個我們之前也說過,自然語言處理裡面最基礎的問題就是歧義消解(disambiguation)問題,比如我讓天貓精靈放一首 安靜(周傑倫的),它會播放 安靜的音樂合集 (即歌單)。或者我說 “報警”,它會播放某歌手的《報警》,這些都是對于比較明顯會出現歧異的地方沒有進行處理。 所以在對話設計的時候,除了正常的對話,也要對那些容易産生誤解的對話進行預設。比如在機器無法判斷的時候 ,主動提問“ 你是要聽安靜這首歌嗎?”
錯誤情況處理(避免天貓精靈停止對話)
在對話的時候,我們可能因為技術限制或者用戶的原因出現各種錯誤情況,但是記住“ In Conversation, There Are No Errors“,把出錯當成機會,就像和朋友講話時我們也常常不理解對方的意思呀,所以我們要做的是在出錯後給到良好的反饋,而不是主動停止對話。
在谷歌語音交互設計規範裡我們講到兩種錯誤情況
- 輸入缺失:用戶沒回應,或系統未獲取到用戶輸入,比如用戶突然走遠了沒回複。
- 無法識别:雖然獲取到了信息,但是卻不能識别解析,比如背景噪音或多個用戶一起說話
- 輸入有誤:用戶回答了但技術識别有誤, 比如用戶說的是“陳奕迅” 識别成“ 陳奕慢“
- 無法匹配:用戶回答了,識别也準确,但是沒有對應的功能,比如用戶說幫我叫個順風車
- 錯誤的識别:我們以為識别成功,但是其實誤解了用戶,用戶可能會在下一次對話糾正。
針對這些錯誤有如下優化方式:
(1)智能聯想
我不知道是我沒發現還是怎樣,目前天貓精靈還不支持缺失聯想和錯誤聯想的功能,所以暫時先寫上來了。
- 識别缺失聯想:當系統沒有完全采集到用戶說的話時,可以使用缺失聯想,比如隻識别到 “莫文蔚的如果沒有“,可以通過缺失聯想,問” 您是不是想聽莫文蔚的 如果沒有你“
- 錯誤識别聯想:我在蝦米裡試了下 搜索“ 遙遠的白“,是可以聯想成功的,而且再天貓精靈裡也識别出是音樂這個功能,所以當識别出錯時,可以通過識别聯想,詢問說 “您是不是要聽陳奕迅的遙遠的她“,給予用戶使用的信心,也讓操作繼續下去。
(2)主動提問
試想如果我們日常沒聽清時,是不是會說,“你剛說陳奕迅的那首歌?”,在設計VUI時也是一樣,在無法應對的時候,不用過多的感到抱歉,試着像和朋友說話一樣讓天貓精靈說 “ 對不起,我沒聽清,你要聽陳奕迅的哪首歌?” “ 能再說下你要聽哪首歌嗎” 。
- 無内容的快捷重複提示:“ 您能再說一遍嗎”
- 有内容的快捷重複提示:“ 我沒聽清,你剛說的哪首歌?”
- 重複詢問: 當問了個問題用戶10秒無回應時,可以重複再問一次“您想聽什麼歌呢”
- 更改問題:當問了個問題用戶無回應時,也可以試着換個說法“ 想聽誰的歌?”
- 回答一個沒有明說的請求: “您可以試試讓我放個熱鬧的歌”
- 積極主動詢問:有時用戶無回應,可能是不知道怎麼回複,可以試着主動給出用戶建議,比如在我問是這是誰的歌時,主動詢問“你想要收藏這首歌嗎嗎”。
最後放一個JIBO的 開箱視頻,我們可以看到用戶和JIBO的對話就是相對比較流暢的,甚至某些額外的情況也能處理,比如JIBO問”你喜不喜歡我的舞蹈“ 女生說“ A little” 的時候,JIBO會說“ 喜歡還是不喜歡呀“,非常可愛。
本文由 @少女璐 原創發布于人人都是産品經理。未經許可,禁止轉載。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!