tft每日頭條

 > 圖文

 > 簡單的語音交互實現方法

簡單的語音交互實現方法

圖文 更新时间:2024-07-24 04:19:19

簡單的語音交互實現方法(語音交互設計的流程及方法)1

随着移動智能終端和雲計算的快速發展,人工智能的浪潮正在悄然颠覆着我們生活的點點滴滴,VUI(Voice User Interface,語音用戶界面)作為一個新的領域也在快速發展,并對用戶體驗提出了更多關于語言學、情感塑造、邏輯搭建等方面的新要求。

本文結合參與的項目,将語音交互設計的發展、特征、流程、設計方法和大家進行分享。

一、VUI的發展

那麼首先來說一下,在原有 GUI(Graphical User Interface,圖形用戶界面)如此豐富的情況下,為什麼要新增加一種交互方式呢?

它們兩者之間最大的差異就是:輸入方式不同。

最顯著特性就是「解放了雙手」,在獲取我們關注的信息時,可以用最自然的語言進行溝通,眼睛和手可以同時處理其他的事情。

1. VUI的第一個時期

20世紀90年代,誕生了第一個可行的、非特定的(每個人都可以對他說話)的語音識别系統,交互式語音應答(Interactive Voice Response,IVR)系統的出現代表了 VUI 的第一個重要時期。

人通過電話線路進行交互并執行任務,如機票預訂、銀行轉帳、業務查詢等。相信大家都用12306電話訂票訂過火車票,我們通過輸入數字命令,與系統進行語音交互。

它的主要特點如下:

  • 優點:擅長識别和播報長字符。
  • 缺點:用戶很少有機會暫停系統,系統占主動地位。

回想一下那個過程,我們必須不斷地與系統進行交互,如果中間出現錯誤,隻能挂斷重來,因此整個交互過程會容易讓用戶處在謹慎、局促的狀态下。

2. VUI的第二個時期

我們現在所處第二時期的初期,目前很多像 siri、Google 這類集成了視覺和語音信息的 APP,以及 Amazon Echo 這類純語音的設計産品,逐步發展并成為主流。

簡單的語音交互實現方法(語音交互設計的流程及方法)2

二、VUI與GUI相比的優勢與劣勢

以目前我們TXD團隊沉澱的 GUI 設計原則為檢驗标準,進行橫向切割,縱向對比 VUI 的優勢劣勢。

簡單的語音交互實現方法(語音交互設計的流程及方法)3

1. 主要的優勢

簡單的語音交互實現方法(語音交互設計的流程及方法)4

2. 主要的劣勢

簡單的語音交互實現方法(語音交互設計的流程及方法)5

因此,通過對比我們發現:GUI 在清晰、高效、通用方面更具優勢,這也恰恰是人們獲取信息的關鍵,能夠準确給用戶提供幫助,且具有很好的延展性和通用性,相對于「一問一答」點狀獲取信息的方式,更為高效。

VUI 則是設計所要追求的一種最自然、最親切的交互方式,是「帶有情感、溫度的交互體驗」,真正的從用戶角度出發。

從我個人角度來看,在目前技術發展的階段,VUI 更多是一種輔助,至少短時間内不會完全取代 GUI。

簡單的語音交互實現方法(語音交互設計的流程及方法)6

三、設計流程

日常設計工作中,大家都會按照一定的設計流程開展工作,通用的流程一般有:探索調研 > 分析聚焦 > 設計策略 > 測試驗證。

同樣,這個流程可以複用到語音交互設計中,隻是設計對象的媒介和我們産出的設計原型發生了改變,但我們發現問題、解決問題的思路應該是類似且可複用的。

具體的設計流程與環節如下圖:

簡單的語音交互實現方法(語音交互設計的流程及方法)7

1. 探索調研

(1)明确需求

筆者所參與的項目是「公司機房服務的工業機器人」 的語音設計,這類産品的功能比家用設備的更為強大,除了語音外,它支持:行走、人臉識别、任務解析、數據采集等,同時場景也更為複雜。

首先機房環境聲音嘈雜、環境複雜;它的性質又決定對人員的安全要求極高,需要準确的識别與判斷,這些在了解需求階段是必須明确的環節。

機器人的主要功能就是輔助參觀人員、維修人員、駐場工程師更好的完成機房工作,實現機房業務管理智能化,提高運維管理效率和準确率。那麼作為體驗設計方,則是通過各場景、各環節的體驗設計,讓人與機器人、與系統的交互高效、自然、流暢,讓智能化的機房日常運維管理更加完善。

(2)了解業務場景及目标用戶

不同的場景,意味着用戶不同的需求和目的,對語音交互的要求也不相同。下面就針對機房環境進行場景分析與設計難點的介紹。

簡單的語音交互實現方法(語音交互設計的流程及方法)8

通過團隊的調研,收集到在整個數據中心有5類用戶,其中會進入機房與機器人直接發生交互的主要有三類:訪客、廠商、數據中心駐場。

簡單的語音交互實現方法(語音交互設計的流程及方法)9

(3)技術水平

硬件。目前的語音産品包括:純語音(天貓精靈)和語音及界面結合(iphone 的 siri)兩種配置。

在設計之初,我們需要了解語音産品的基本硬件配置,這其中也包括麥克風、攝像頭、聽筒、設備聯網程度等,因為,産品的配置會影響我們後期的設計策略與體驗。

例如:問語音産品:「世界十大旅遊勝地都是哪些?中國56個名族都有什麼?」,即便語音助手可以準确的告訴我們答案,但無疑是一個沉重的認知與記憶負擔,如果配合屏幕來顯示,情況會好很多。

最好的人機交互形式是混合型的,即 GUI VUI。(圖像交互 語音交互)如圖 echo show,如果你所設計的是純語音産品,那麼在設計時則需要考慮更多的引導、容錯、提示等。

簡單的語音交互實現方法(語音交互設計的流程及方法)10

本次項目中所涉及的機器人不帶顯示屏幕,并且語音不聯網,這就意味着所有對話都需要提前預設好,設計師需要根據可能出現的情況,将對話内容完善,并且做必要引導,讓用戶按照系統期望的流程進行,确保工作順利、安全的開展。

如下圖:通過設計去盡量規避機器人硬件的缺陷,減少「答非所問」的錯誤發生率和用戶回答的發散,提高語音交互流程的順暢。

簡單的語音交互實現方法(語音交互設計的流程及方法)11

算法。算法方面,則需要通過機器「深度學習」,不斷完善語音識别、語音理解及語音合成的水平。

目前,語音識别方面還面臨很多技術挑戰,如:

  • 噪音:恒定噪音(公路上、機房中) 和突發噪音(突然異常大聲)。
  • 多人講話:多人講話,設備能否識别其中一條信息;同樣多設備時,如何辨别自己的主人在說話。
  • 兒童:兒童說話邏輯性較弱,容易出現口吃、長時間停頓等現象。
  • 短句:「是」、「不」這種短句提供的數據信息較少,會造成識别率低。
  • 多音字:比如人名,同樣的音會有多種書寫文字「清」「輕」,會影響語音識别的準确性。

更多關于機器人「深度學習」的内容大家可以自行了解,這裡不展開讨論。

2. 分析聚焦

具體在分析聚焦階段,圍繞與機器人相關的機房工作人員,洞察并提升他們在工作中的服務體驗,确保順暢、安全、高效的工作流程。

(1)用戶畫像

針對定位的三類用戶,我們通過問卷,進⾏用戶訪談,旨在了解各個不同角⾊的用戶他們工作的内容、需求,以及有哪些痛點可以抽取出來由機器人替代。

共計訪問10位用戶,包含各個角色。訪問之後,我們對用戶訪談的結果進行整理,在此基礎上,完成用戶角色建模。

以駐場工程師為例,具體的用戶角色卡如下圖所示:

簡單的語音交互實現方法(語音交互設計的流程及方法)12

根據用戶畫像和調研中收集的問題進行聚類分析,得到用戶訴求,即對機器人應用場景下的機房服務的「服務主張」,圍繞「安全」、「規範」、「高效」三個方面。這三個機房服務的體驗目标,也是作為後續機器人語音設計所要達到的基本要求。

(2)體驗地圖

與機器人交互的環節涉及到線上、線下,從線上任務的提交到線下與機器人真實交互,再到過程中機器人收集信息的回傳,整個閉環鍊路構成機房機器人服務體驗的核心。

以其中導覽場景為例,介紹整體流程,線上的主要觸點:任務申請 > 任務生成 > 任務确認 > 任務存檔;線下的主要觸點:任務下發 > 機器人喚醒及用戶身份驗證 > 任務執行 > 任務結束。

具體的觸點詳情及語音流程見下圖:

簡單的語音交互實現方法(語音交互設計的流程及方法)13

經過體驗地圖的梳理與流程規劃,去構建合理、有序的流程,在任務執行過程中保證人機交互「自然、親切、可靠」的體驗。在語音交互設計中也會利用适當的引導與必要的提示,以更自然的方式消除異常時的尴尬,快速做到工作銜接。

3. 設計策略

(1)定義角色人格

VUI 産品是一個虛拟的人與用戶直接溝通,因此,溝通對象的語氣風格、性格等則是用戶接觸的第一感受,為了提升真實性,定義一個符合自己産品調性的角色至關重要,也是着手真正語音設計的第一步。

這裡的角色,是通過應用程序的語音及語言選擇,塑造一個符合品牌服務特征,并且具有人格或心理的形象。

角色人格包含:

  • 公司所傳達的态度;
  • 産品的個性特征;
  • 期望别人如何看待它。

在設計時,我們可以用「真實的人物」來定義聲音特征與溝通基調,分析、了解真實人物模型的個性特征。例如:兒童早教類語音産品,可以以大家熟知的「金龜子」為人格原型進行定義,溝通中模仿她的語氣、用詞,讓兒童感到親切并符合服務對象的特征喜好。

但這裡值得注意的是,現在很多語音助手支持語音選擇,如男聲、女聲、少年等。我們要知道,「改變聲音的同時,就意味着換了不同的人格」,他們的語音交互特征、形式等應該發生相應變化。

簡單的語音交互實現方法(語音交互設計的流程及方法)14

(2)語音交互設計

語音設計的原型更像是「劇本設計」,需要考慮在哪個場景下,包含什麼角色、他們如何對話、如何過度銜接、具體的語言如何等。如下圖:就是在此次項目中輸出的語音設計原型,具體内容涉及到信息隐私,這裡就不展開了。但是整個語音交互腳本中,對場景、角色、對話腳本備注圖例、腳本正文等都做了明确定義與設計。

簡單的語音交互實現方法(語音交互設計的流程及方法)15

簡單的語音交互實現方法(語音交互設計的流程及方法)16

(3)語音交互引導

在設計語音腳本内容時,需要特别考慮 VUI 與人對話過程的語言銜接、對話内容的順暢,并且能夠自然的完成設想的任務。例如:當詢問用戶信息時,最好給出一些示例,而不是說明。

以下兩句話大家可以明顯感受到體驗的差異,對于用戶來說,參照示例填寫信息,比理解一個通用指令更加容易。

  • 「請告訴我你的出生日期,如2017年12月12日」;
  • 「請告訴我你的出生日期,包括年月日」;

(4)語音交互反饋

在 GUI 界面中,「确認反饋」随處可見,點擊一個按鈕、進行一個編輯操作,設計師會設計不同重要程度的交互反饋;在 VUI 中,同樣有不同程度的「确認反饋」,本文主要将他們分為三種:顯性确認、隐形确認、視覺确認。

簡單的語音交互實現方法(語音交互設計的流程及方法)17

(5)語音交互異常處理

語音可能存在的異常情況主要有以下四種:

  1. 未檢測到語音 (明确告訴用戶「我沒聽清」);
  2. 檢測到語音,但沒有識别(「我不明白你的意思」);
  3. 語音被正确識别,但系統無法處理(「出現異常」);
  4. 部分語音識别錯誤(答非所問)。

在設計中,我們可以按照不同的異常情況,設計多種播報腳本,提高産品容錯性,緩解異常時候的尴尬,在此例舉些常見的用戶語音輸入錯誤的回答,如下圖。

簡單的語音交互實現方法(語音交互設計的流程及方法)18

4. 測試驗證

(1)語音原型測試

以項目中團隊采用的兩種腳本測試方式為例,分别是:劇本朗讀和語音轉換工具。通過劇本朗讀,體驗對話的流暢程度,确認是否存在對話呆闆、重複、不自然的情況;通過文字轉語音工具,如QQ語音轉化,可以較真實的感受機器将對話說出來的效果。

簡單的語音交互實現方法(語音交互設計的流程及方法)19

(2)設備測試調優

設計交付後,功能開發完成,進入語音設備可運行階段,這時系統具備測試功能。

測試調優的方法同樣給大家列舉兩個:

  • 一是可以通過開發、設計人員,進行實際人機測試,了解語音功能是否穩定、任務完成率如何、整個體驗流程是否自然順暢;
  • 二是可以通過用戶觀察的方法進行調研,找到符合特征的目标測試用戶,利用機房的監控攝像頭,觀察「自然狀态下」的用戶如何工作,這樣不會幹擾用戶,更貼近真實的使用情景。

簡單的語音交互實現方法(語音交互設計的流程及方法)20

四、總結

語音交互設計僅靠書本上的知識是不夠的,需要設計師在實際項目中不斷的探索與學習,除了要像 GUI 了解需求、業務場景、目标用戶以外,還要了解語音設備的技術水平、設備配置等,從而有的放矢的展開設計。

以上是筆者首次接觸語音交互設計的設計經過,對 VUI 設計中的知識點、流程、方法進行的總結,仍有很多不全面之處,後續随着項目的疊代和設計的深入,逐步去完善體驗,總結沉澱。

本文由 @阿裡TXD 原創發布于人人都是産品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved