tft每日頭條

 > 生活

 > 确保語音交互的好處

确保語音交互的好處

生活 更新时间:2024-11-23 11:18:55

編輯導語:随着互聯網的發展,語言交互融入了我們的日常生活中。那麼,關于語音交互規範,你又了解多少呢?本文從AI語音交互發展談起,總結了一些語音交互規範内容,供大家參考,希望對你有所幫助。

确保語音交互的好處(語音交互規範)1

一、AI語音交互發展

語音交互的發展經曆了三個階段:

第一階段是上世紀80年代,語音交互能夠實現一問一答,前後回答并不具有内容的相關性。随着人工智能和深度學習的發展,機器的理解能力越來越強。

自從2009年開始,随着iPhone手機siri的出現,進入第二階段,語音的對話能做到有問有答,能夠理解上下文,但是這種應用場景還比較局限。

第三階段,2014年Amazon Echo的出現,實現了應用領域的革新,拓展了語音交互的場景,智能語音交互的爆發則在2017年智能音響的發展,語音交互得到巨大的突破,語音和語意的理解更加準确,具有代表性的産品有小愛音響、天貓精靈和小度音響等。

二、什麼是AI語音交互?

AI語音交互通俗的理解就是:人與機器的對話。語音交互在技術方面講主要包括:聽(ASR)、語義理解(NLP)、說(TTS)。

聽(ASR):用ASR技術把語音識别成文字。

語義理解(NLP):使用NLP技術,把文字輸入轉化為文字輸出。通過語法判斷、上下文理解、關系理解、知識圖譜等技術。就是理解文字的含義後,把想反饋的回答以文字表達出來。

說(TTS):使用TTS技術把文字合成為語音。

三、為什麼要建立AI語音交互規範?

在公司角度:有統一的交互規範便于公司内部産品形成統一的共識,減少溝通的成本,提升工作的效率。

在設計師角度:對外有了統一的交互規範便于與産品、開發等人員的溝通,對内便于組織内的成員學習與提高。

在設計管理者的角度:對内能達成設計共識,對外提升設計組織的影響力。

在我看來交互規範是一個内部産品,它随着産品的生命周期叠代演進;交互規範是一套内部共識,它不僅僅解決了設計問題,更是組織協同的解藥;交互規範是一種思維方式,不僅産品設計,甚至自己的生活都可以借鑒設計系統來提升效率。

四、AI語音交互規範主要内容是什麼?
  1. 語音交互原則
  2. 語音交互框架
  3. 語音邏輯規範
  4. 語音控制原則
  5. 多模态交互
  6. 彈框機制
  7. 操作反饋
  8. 界面架構
  9. 情感化設計
五、語音交互的原則

1. 通用原則

及時反饋原則。用戶在與系統進行語音交互的過程中,系統要給予及時的反饋。

合适的速度。語音的播報速度、結果呈現速度、IP形象展示的速度、文字展示及糾錯的速度都在一個合适的範圍内。

易取原則。盡量減少用戶對操作目标的記憶負荷,交互動作和結果都是可見、可聽的。

人性化幫助原則。在用戶需要幫助的時候提供必要的幫助說明和引導。

靈活高效原則。語音交互可以跨越層級,直接高效的觸達目标。

防錯原則。在用戶意圖不明确的時候,可以向用戶詢問,還可以預測用戶的可能的意圖提示用戶。

消除歧義。交互的形式和内容不會讓用戶感到困惑,當用戶的命令存在歧義時,通過交互的形式消除歧義,幫助用戶達成目标。

适應當地文化。語音的形象IP和話術的提問及回答都要符合用戶所處的文化背景和地域文化。

2. 交互的可用性要素

輪流對話。在對話中基于信号的傳遞, 進行輪流的表達。回答的機制是一問一答。

上下文串聯。在對話的語言中需要結合上下文的語意串聯起來進行回答,這樣有助于提升對話的準确性。

多樣性。對于具體的場景,應該多樣的問與答,結合情景多樣性的回答。

理解行為。在對話的過程中盡可能的真誠、詳實和有效的理解對話的内容。

反饋。對于用戶的請求應給予反饋,無論是聲音、文字還是圖像。

語音的效率。在對話的過程中往往有一些隐晦的潛台詞,在對話的過程中要理解口語之下的更深層次的意圖,并給予準确的回答。

3. 人性化的表達

語言是人類表達情感的重要方式,在語音交互的過程中,人性化的設計必不可少的。狀态可見原則。在整個語音交互的對話過程中,對于場景、角色都需要從人與人對話的角度出發。

對話的邏輯。語言對話邏輯應該遵循人類語言的本能,不應該強迫用戶為了适應機器對話而采用層級遞進的邏輯思維,用戶隻需要正常的表達就可以。

情感化。語音交互需要人格化、情感化。需要與産品的品牌調性相契合。語音人格方向特征具有:有趣、正能量、機智和溫暖等特點。

口語。口語化的交流,同時也需要避免說顯而易見的内容,對話需要多樣性,使體驗更加自然。

環境貼切。使用簡單易懂和約定俗成的表達,盡可能的貼近用戶所在的環境。

地方語言。語言的本身要有地域的特色,語音的表達要有廣泛的群衆基礎,其中方言識别也是語音交互中重要的技能。

六、語音交互框架

1. 語音交互流程

一次完整的語音交互流程,包括:喚醒—ASR—NLP—Skill—TTS語音應答/界面結果展示(如下圖所示)。

确保語音交互的好處(語音交互規範)2

2. 語音交互框架

1)根據蘋果公司的全品類設備的特點,在語音框架需保持一緻,兼顧mac、paid、手機大小屏和橫豎屏。Siri交互包括:Siri的狀态、ASR内容/話術、語言TTS反饋。

确保語音交互的好處(語音交互規範)3

3. 遠場與近場

遠場應用比如Siri。直接說:“Siri”喚醒語音助手,喚醒後可以遠程進行語音交互。

近場應用比如智能電視。使用遙控器,按住語音鍵,對着遙控器進行語音近距離語音交互。

設計用例:

User:“Siri,定個鬧鐘”。

語音助手:“你要定什麼時候呢?”

User:“明天早上8點”。

4. 正常/異常狀态

正常狀态:

語音交互的過程中,通過TTS和Siri狀态(包括:等待與加載),來滿足及時反饋。

異常狀态:

語音交互過程中,判斷外網終端->提示:待命 網絡異常,請檢查網絡。

注:無界面時,直接TTS反饋:【網絡異常,請檢查網絡】(要求TTS寫在本地)。

5. 對話澄清

指語音主動與用戶的對話,達到意圖的确認。

說明 :

① 澄清應用于用戶意圖不清晰,必須進行再次對話才能進行意圖确定,否則導緻機器執行的任務錯誤。

② 假如在遠程的交互中,澄清的過程中,需要語音一直處于待命狀态(也就是無需再次喚起即可對話)。

③ 在澄清的過程中,需要關鍵詞引導,以便于用戶表達明确的意圖。

④ 為了讓用戶能自然的回複和應答,同時也防止自然口語化,語音的澄清話術需要采取封閉式關鍵詞引導。

⑤ 關鍵詞的引導,根據人的記憶及聽力的規則,每次小于等于3個,且近倆個每句話術文字在7±2之間。

設計用例:

User:“幫我定下明天鬧鐘?”(意圖不明)

語音助手:“你要定幾點鬧鐘?”(幾點鐘為關鍵詞)

Uesr:“明天早上8:00”(意圖明确)

6. 多倫對話

多輪對話指語音助手與用戶進行一輪(一問一答)以上的對話。

說明:

① 應用于意圖雖然清楚、可執行,但任務執行結果不清晰。如:結果的集合過大,用戶沒有找到具體的内容。

② 多輪的引導,應能幫助用戶完成任務,同時防止用戶自然語言的發散。

③ 多輪對話的輪次意味着用戶與智能設備的多次交流。在搜索工具語言中,語音交互較快的達到目标是關鍵,輪次越多代表執行的效果不理想,通常以小于3輪較為合适。但是在閑聊類型功能中,輪次越多,代表用戶聊天的意願越強。

設計用例:

User:“能幫我找一下好看的電視劇嗎?”(意圖清晰,任務集合過大)

語音助手:“你要看中國的?還是國外的?”(關鍵詞引導)

User:“中國的”(意圖明确)。

7. 話術

話術指用戶與智能設備對話的形式。

說明:

① 話術來源:a 語音産品中需要互動交流産生場景話術;b基于人與人對話的原則撰寫而成的話術。

确保語音交互的好處(語音交互規範)4

設計用例:

确保語音交互的好處(語音交互規範)5

8. 話術(TTS)設計

語音話術指在語音交互過程中語音助手通過語言與用戶進行互動,包括文字話術和語音話術。

說明:

① 顯示的文字話術與語音助手的形象關聯,并配合出現。

② 顯示話術與當前語音邏輯相呼應。

③ 語音話術:用戶發出請求後,需要給予語音應答。比如:“定今天下午3點鬧鐘”,反饋;“好的,已經定好下午3點鬧鐘”。

④ 聲音及文字:引導過程中,根據業務的需要進行聲音與文字的引導。

聲音引導:引導澄清用戶的意圖。

文字引導:語音域中的引導話術。

聲音 文字引導:比如問題及内容的搜索結果。

⑤ 運營類話術:針對高頻詞的結果及當前熱門的内容,定制化的話術,目的是增加産品的情感,更加貼切用戶的反饋。實現的方式:由運營後台配置。

9. 用戶對話引導

語言具有自然性,為了避免用戶語言的随意泛化,導緻用戶指令無法識别,需要在語音中進行話術規範性引導。

說明:

引導話術結構-“喚醒方式 需引導的技能話術”。

① 全局性引導。由話術平台統一部署,引導分為3類:

② 相關域引導。在語音交互過程中,提供當前領域的相關話術引導。分為兩類:

③ 運營類的引導。專門為運營類産品定制的語音話術引導。

10. 情感表達機制

語音交互人性化,是語音交互重要特征之一。

說明:

基礎狀态:

基礎情緒:

  • 歡呼;
  • 陪伴;
  • 安撫;
  • 幫助;
  • 其他(更多的類型根據業務需要進行添加)

基礎情緒的表達(如圖所示):

确保語音交互的好處(語音交互規範)6

七、小結

語音交互規範主要内容分為:

  1. 語音交互原則
  2. 語音交互框架
  3. 語音邏輯規範
  4. 語音控制原則
  5. 多模态交互
  6. 彈框機制
  7. 操作反饋
  8. 界面架構
  9. 情感化設計

本篇僅寫了:(1)語音交互原則(2)語音交互框架,後續分為3篇完成,謝謝大家閱讀,後續内容敬請期待!

本文由 @東哥的設計分享 原創發布于人人都是産品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved