tft每日頭條

 > 生活

 > 語音交互的本質

語音交互的本質

生活 更新时间:2025-01-23 11:26:01

編輯導語:對話設計是語音交互設計中的重要環節,有效的對話設計可以讓用戶擁有更加流暢的體驗,并在幫助用戶解決相應問題時,給予用戶一定的溫度感。本篇文章裡,作者總結了人機交互中對話設計的原則與注意事項,一起來看一下。

語音交互的本質(語音交互對話設計原則)1

為用戶解決問題,建立有溫度的對話交流是設計師的共同願景。對話設計是語音交互中最重要的一環,也是最能體現智能助手智商和情商的一環,它将直接影響用戶和計算機之間的交流。

筆者按照自身經驗,以及Google、亞馬遜和阿裡提供的語音交互設計指南,總結了以下内容供各位設計師作參考。

對話設計前你需要了解的事項:

一、考慮計算機的局限

語音交互設計是設計人類和計算機之間的對話,因此我們在設計前要考慮技術的優勢和不足。

在很多方面,計算機都很容易超越人類,它們可以快速找到并共享信息;不厭倦被問到重複的問題,不會被命令給冒犯到。

但是計算機在很多方面都不如人類。技術的局限性引入了人與人對話中不會發生的場景,例如人機對話時需要以特定的單詞或短語開頭,例如“Ok Google”;用戶說的話需要轉變為結構化數據才能被計算機理解,中途出現一些不穩定因素都會導緻計算機理解失敗,這些局限性應該提前提示用戶。

另外,當你的語音系統還達不到很聰明、随意交流的程度,那麼就不應該讓用戶誤認為它可以達到。提前讓用戶了解到語音系統的局限可以規避用戶問一些千奇百怪的問題。

二、确認用戶場景

為了實現個性化和場景化設計,我們可以通過技術手段獲取用戶地址、時間和用戶身份(包括聲紋、用戶注冊信息)等信息,在設計對話腳本前我們需要考慮以下幾個場景相關的問題:

  1. 用戶在哪裡?所處的環境是怎樣的?
  2. 用戶正在做什麼?
  3. 用戶使用的是什麼設備?
  4. 用戶要完成什麼任務?目标是什麼?
  5. 用戶的期望和意圖是什麼?
三、明确你要設計的技能是什麼?

不同類型的技能面向不同的用戶群體和用戶場景,在設計前明确要設計的技能是什麼。

2019年亞馬遜Alexa的技能總數已經超過100,000項,技能類型包括娛樂遊戲、新聞、教育、生活、趣味搞笑、效率、天氣、音樂影視、智能家居、運動、飲食、财經、當地、旅行交通、電影電視、公共服務、社交、購物、車聯網。而音樂影視、遊戲娛樂、生活和智能家居19種分類,而音樂影視、遊戲娛樂、生活和智能家居技能占絕大多數。所有的技能都可以分為播報型、指令型和互動型三類。

1. 播報型

為用戶提供内容服務,例如音樂、新聞、百科、食譜、故事等等。

2. 指令型

為用戶和生活服務建立一座工具橋梁,幫助用戶解放雙手,通過語音就能控制家居、發送短信、叫外賣等等。

3. 互動型

用戶通過多輪對話的方式與設備交互。主要用于在娛樂領域,如問答測試、情景探險、識圖對話、聽音唱歌等功能。

2019年亞馬遜Alexa團隊針對用戶評論、評分、參與度、用戶體驗和創新性5個維度公布了Alexa十大技能,都屬于播報型和互動型技能,其中七項是遊戲和問答測試類型,另外三項分别是Spotify音樂,導遊冥想和TED演講。

四、明确你要設計的對話類型是什麼?

不同的技能對應着不同的對話類型,從應用場景的覆蓋面看,對話類型可以分為開放域(Open-domain)和封閉域(Closed-domain)兩大類。

開放域對話類型沒有太多限定的主題或明确的目标,用戶和語音助手之間可以進行各種話題的自由對話,它更像一種圖靈測試,難度很大,需要大量的知識庫和複雜的模型,一般用于閑聊場景。

封閉域對話類型通常會限定在一定場景之下,有若幹明确的目标和限定的知識範圍,目标也更加清晰明确,例如正常人不會和電商導購交流情感問題。

正因如此,封閉域對話類型對對話的質量要求更高,錯誤的容忍度更低,它需要一個垂直領域建立的模型和知識圖譜。封閉域對話類型一般用于任務、問答或者娛樂場景。

基于以上的總結,對話類型主要分以下四種,它們有各自的特點。

1. 任務類型

任務類型的對話指在特定條件下為帶有明确目的的用戶提供信息或者服務。

在智能家居場景下,一般可以通過單輪對話實現設備的操控。如果用戶的需求需要多輪互動,那麼任務類型的對話需要通過詢問、澄清和确認來幫助用戶明确目的。

任務類型的對話主要用于智能助手應用上,例如Siri、小愛同學和天貓精靈。

  • 特點:設計起來比較複雜,非常依賴意圖識别技術,通常使用意圖識别 多輪對話 對接内容提供商的API和知識圖譜。
  • 目标:用最短的對話輪次來完成用戶的任務,通過對話所獲取的信息轉換成需要的參數。比如“明天北京天氣怎麼樣”。地點是北京,時間是明天,意圖是天氣。這些都要在意圖設計時提前設計好。

2. 問答類型

問答類型的對話需要回答“怎麼設定鬧鐘”、“什麼是巡航系統”等問題,而這些問題也是一種任務,所以問答類型和任務類型的對話有一定的相似性。

問答類型的對話一般用于客服機器人上,例如京東的JM客服機器人和阿裡的雲小蜜客服機器人。它們能和用戶進行基本溝通并自動回複用戶有關産品或服務相關的問題,當問題回答不了時可以轉向人工客服,降低企業客服運營成本的同時兼顧用戶體驗。

  • 特點:意圖設計非常簡單,一般抓住關鍵詞“為什麼”和“是什麼”即可,然後通過FAQ 對接内容提供商的API和知識圖譜回答用戶的問題。
  • 目标:用最短的對話輪次來回答用戶的問題。

3. 閑聊類型

前面提到閑聊類型的對話屬于開放域類型,因此它是一種沒有明确目的的對話,語音助手不知道用戶下一句話會說什麼,主要根據用戶對話中出的關鍵詞進行回複。閑聊類型的對話一般用于智能助手應用上。

  • 特點:不精準,不可控。機器的回複會在閑聊庫當中,通過檢索給出相應的回複。
  • 目标:對話輪次越多越好,一直聊下去就行。

4. 遊戲/娛樂類型

遊戲/娛樂類型的對話結合了任務和閑聊類型的特點,還要結合遊戲類型、趣味性等因素進行設計,一般用于智能助手應用上。

  • 特點:腳本分支多,遊戲型還需要考慮故事線,設計起來比較複雜。
  • 目标:讓用戶放輕松。
五、提前定義好智能助手的人物設定

智能助手的人物設定會影響回複話術的設計,所以提前确認好智能助手的核心關鍵詞和畫像可以避免後續回複話術的修改。

六、了解對話的關鍵因素

Google的設計師通過解構那些我們習以為常的自然對話中的規則和慣例,挖掘出一個好的VUI對話的關鍵因素。

在語音交互設計指南Actions on Google Design中提到,構建一個好的VUI對話需要考慮以下4個部分。

1. 話輪轉換(Turn-taking)

在對話交流中,我們會在一些往返的微妙信号中輪流說話。如果沒有有效的輪換,會導緻對話過程中雙方同時說話,或者對話内容會不同步并且難以被理解的情況。

因此輪到用戶說話時,智能助手應該發出清晰的信号,例如音效提醒。用戶說話時智能助手不要貿然強行打斷。如果是詢問用戶問題,那就不要在用戶回答的時候又突然插入一些其他問題或者指令。

2. 對話線索(Treading)

在自然交流中,對話中的上下文、對話随時間演變的方式等對話元素都會連貫地交織在一條主線上。對話中的對話線索可以幫我們更容易跟上對話流的節奏。

3. 利用語音固有的效率

人們經常使用較為簡短的口頭表達方式,因為他們能夠洞察出大家在說什麼。基本上我們都可以感知出一個對話中的“言外之意”,也知道有些東西是不需要被直接說出來的。但是VUI中的隐喻必須能夠彌補人類語言中看似不合邏輯、非理性的部分。

4. 預測不同的用戶行為

人們會用不同的詞語和風格去描述同樣的事情,這取決于他們自己的情景語境和自己早前經驗産生的對 VUI 的預期,因此 VUI 應該支持這些差異,用戶才能擁有一個無損的體驗。

七、遵循會話“合作原則”

有研究表明,人們對技術的反應就像對另一個人的反應一樣。這意味着用戶在和智能助手交互時,也會依賴他們現有的人與人對話方式。

美國語言哲學家格萊斯(Paul Grice)認為,在人們交際過程中,對話雙方似乎在有意無意地遵循着某一原則,以求有效地配合從而完成交際任務。因此,格賴斯提出了會話中的“合作原則”,語音交互可以考慮跟從對話合作原則進行設計。

  • 量的準則:所說的話應該滿足且不超出交際所需的信息量。
  • 質的準則:不要說自知是虛假和缺乏足夠證據的話。
  • 關系準則:所說的話要貼切, 要與交談目的和方向有關系,不說不相幹的話。
  • 方式準則:所說的話要簡潔明了,别拐彎抹角産生歧義。

然而,人們在實際言語交際中,并非總是遵守“合作原則”,有些時候人們會故意違反合作原則。格萊斯把這種通過表面上故意違反“合作原則”而産生的言外之意稱為“特殊會話含義”,它是需要依賴特殊語境才能推導出來的含義。

舉個例子:A和B在談論一部電影。

A:“你覺得這部電影怎麼樣啊?”

B:“場面倒是很壯觀,服裝也很耀眼。”

表面上B并沒有回答A的問題說出這部電影怎麼樣,但是不可否認的是,B的話語有自己的内在意義。B的回答暗指除了耀眼的服裝和壯觀的場面,電影本身并沒有什麼吸引人的地方。這内在意義需要通過語境推斷出來,這樣的含義就是特殊會話含義。

盡管大部分的幽默源于特殊會話含義,但我們在設計腳本過程中,盡量避免使用這種對話方式,避免用戶一時半刻理解不了這句話的意思。

八、對話不存在“出錯”的概念

邏輯和準确性不是萬能法則,人類口語表達通常會呈現出各種毫無道理的話。用戶任何請求都是有目的的,他們總是希望完成某些任務,即使沒有明确說出來。

這時候,不要管用戶說了什麼,不要把它當成是一個錯誤來處理,而是考慮如何把它轉變為一個機會,把它當做是對話中的轉折點,用新的方式來處理,從而推進更順暢、更自然的溝通。

以下方法有助于把“錯誤”轉化為對話交互中自然的一部分:

  1. 不要把技術上的“出錯”當做用戶的錯誤。
  2. 對于不同類型的“出錯”提供對應适合的處理方式。
  3. 通過提供幫助來避免出錯。
  4. 要知道在什麼情況下放棄。
  5. 使完成任務的路徑更強,來掩蓋錯誤。

#專欄作家#

薛志榮,薛志榮,人人都是産品經理專欄作家。暢銷書《AI改變設計-人工智能時代的設計師生存手冊》作者,全棧開發者,專注于交互設計和人工智能設計。

本文原創發布于人人都是産品經理。未經許可,禁止轉載

題圖來自 Unsplash,基于CC0協議。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved