怎麼用嘿siri喚醒siri-tft每日頭條

怎麼用嘿siri喚醒siri

圖文更新时间:2025-07-04 18:56:43

怎麼用嘿siri喚醒siri?人工智能技術迅猛發展，人機語音交互更加自然，搭載語音喚醒、識别技術的智能設備也越來越多語音喚醒在學術上稱為 keyword spotting(簡稱 KWS)，即在連續語流中實時檢測出說話人特定片段（比如：叮當叮當、Hi Siri 等），是一種小資源的關鍵詞檢索任務，也可以看作是一類特殊的語音識别，應用在智能設備上起到了保護用戶隐私、降低設備功耗的作用，經常扮演一個激活設備、開啟系統的入口角色，在手機助手、車載、可穿戴設備、智能家居、機器人等運用得尤其普遍，現在小編就來說說關于怎麼用嘿siri喚醒siri?下面内容希望能幫助到你，我們來一起看看吧!

怎麼用嘿siri喚醒siri

概述

人工智能技術迅猛發展，人機語音交互更加自然，搭載語音喚醒、識别技術的智能設備也越來越多。語音喚醒在學術上稱為 keyword spotting(簡稱 KWS)，即在連續語流中實時檢測出說話人特定片段（比如：叮當叮當、Hi Siri 等），是一種小資源的關鍵詞檢索任務，也可以看作是一類特殊的語音識别，應用在智能設備上起到了保護用戶隐私、降低設備功耗的作用，經常扮演一個激活設備、開啟系統的入口角色，在手機助手、車載、可穿戴設備、智能家居、機器人等運用得尤其普遍。

喚醒效果好壞的判定指标主要有召回率(recall，俗稱喚醒率)、虛警率(false alarm，俗稱誤喚醒)、響應時間和功耗四個指标。召回率表示正确被喚醒的次數占總的應該被喚醒次數的比例。虛警率表示不該被喚醒卻被喚醒的概率，工業界常以 12 或者 24 小時的誤喚醒次數作為系統虛警率的評價指标。響應時間是指用戶說出喚醒詞後，設備的反應時間，過大的響應時間會造成較差的用戶體驗。功耗是指喚醒系統的耗電情況，多數智能設備都是電池供電，且需要保證長時續航，要求喚醒系統必須是低耗能的。一個好的喚醒系統應該保證較高的召回率、較低的虛警率、響應延時短、功耗低。

喚醒技術落地的難點是要求在低功耗下達到高性能要求。一方面是目前很多智能設備為了控制成本，搭載的都是一些低端芯片，計算能力有限，需要喚醒模塊盡可能的減少計算計算量以減少能源消耗；一方面用戶使用場景多種多樣，設備也常沒有經過專業聲學設計，遠場、大噪聲、強幹擾、高回聲、高混響等情況下仍然面臨召回率低、虛警率高的問題。

針對此問題，騰訊 AI Lab 近期發表一篇論文，針對複雜聲學環境，特别是噪聲和幹擾人聲場景，對送給喚醒模型的聲學信号進行前處理，以提升其語音信号質量。本論文已被 Interspeech 2020 接收。

很多智能設備安裝有多個麥克風，因此多通道的前端處理技術被應用到喚醒的前端信号處理中。當目标說話人與幹擾聲源分布在不同方向時，多通道的語音增強技術，例如波束形成(beamformer), 能夠有效的增強目标說話人，抑制其它幹擾聲源。但是這一做法依賴較準确的目标說話人方向定位。在實際環境中，由于有幹擾聲源的存在，使得很難從帶噪數據中準确估計目标說話人的方位，特别是當有多人在同時說話時，也無法判斷哪一個是目标說話人。因此本文采用“耳聽八方” （多音區) 的思路，在空間中設定若幹待增強的方向（look direction)，然後區别于傳統的波束形成做法（這個做法已發表于 ICASSP 2020 [1]），本文提出了一個基于神經網絡的多音區（multi-look）語音增強模型，可同時增強多個指定的方向聲源。這些多個方向增強輸出的信号再通過注意力機制進行特征融合送予喚醒模型。由于前端的增強是通過神經網絡處理的，這樣多音區的增強模型與喚醒模型可以進行聯合優化，實現真正的前後端一體的多音區語音喚醒。

基于神經網絡的多音區語音增強模型是首個完全基于神經網絡的多音區語音增強模型。相比于特定方向的語音增強，本文提出的模型可同時增強多個方向聲源。同時這種基于神經網絡的方法，在性能上顯著優于基于傳統的波束形成做法。完全基于神經網絡的多音區前端，與喚醒模型聯合訓練，前後一體的做法進一步提升模型的魯棒性和穩定性。此模型适用于多麥克風設備的語音喚醒。

以下為方案詳細解讀。

方案詳解

傳統的多音區語音處理的思路，是在空間中設定若幹待增強的方向（look direction)，每個方向分别應用一個波束形成，增強這個方向的聲源，最終本文将每個方向增強輸出的信号輪流送給喚醒模塊，隻要有一個方向觸發喚醒，則喚醒成功。這種基于多音區的多波束喚醒技術大大提高了噪聲下的喚醒性能，然而需要多次調用喚醒模塊，因此計算量較單路喚醒也成倍增加，功耗變大制約了應用。針對這一情況，作者在早前一點的工作中[1]将注意力(attention)機制引入到喚醒框架下，如圖 1 所示，多個 look-direction 增強的信号提取特征後通過 attention 層映射成單通道輸入特征，再送入單路喚醒網絡層，與單路喚醒相比僅僅增加了一層網絡，既保證了喚醒性能，計算量又大大降低。

圖 1：基于多波束特征融合的喚醒模型[1]

以上介紹的基于波束形成的多音區喚醒[1]，前端的信号處理（波束形成）和喚醒模塊還沒有做到聯合調優。因此本文提出了一個基于神經網絡的多音區語音增強模型。該模型讀取單個通道的語譜特征和多通道的相位差特征，同時根據預設的若幹音區方向（look direction），作者分别提取對應的方向特征(directionalfeature)。這些方向特征表征每個時頻點是否被特定音區方向的聲源信号占據，從而驅動網絡在輸出端增強距離每個音區方向最近的那個說話人。為了避免因為音區和說話人的空間分布導緻目标說話人經過多音區增強模型處理後失真，實驗中使用一個原始麥克風信号與多個方向增強輸出的信号一起通過注意力機制進行特征融合送予喚醒模型，由于前端的增強是通過神經網絡處理的，這樣多音區的增強模型與喚醒模型可以進行聯合優化，實現真正的前後端一體的多音區語音喚醒。完整的模型結構在圖 2 中描述。

圖 2: 本文提出的基于神經網絡的多音區語音增強和喚醒模型[2]

圖 3 是一個多音區增強的實例。兩個說話人分别位于圖(a)所示位置，麥克風采集的兩人同時說話信号譜如圖(b). 作者設定了 4 個待增強的方向（0 度，90 度，180 度和 270 度）。多音區增強模型将會在 0 度和 90 度方向增強藍色說話人，180 度和 270 度方向将會增強黑色說話人, 增強後的 4 個方向語譜如圖(c)。

圖 3: 多音區增強網絡輸出實例

在圖 4 中，作者對比了基于神經網絡的多音區增強喚醒模型與基于波束形成的多音區增強喚醒模型和基線的單通道喚醒模型。可以看出特别是在小于 6dB 的信幹比聲學環境下，本文提出的做法顯著超越其它方法。不同方法喚醒率測試均在控制誤喚醒為連續 12 小時幹擾噪聲下 1 次的條件下進行的。

圖 4:多音區喚醒模型的性能對比

總結及展望

本文提出的多音區語音增強和喚醒的做法，大幅降級了喚醒前端語音增強與喚醒結合使用的計算量，在未知目标聲源方位的情形下，同時增強的多個方向聲源信号的特征融合可保證目标語音得到增強，給準确的喚醒提供了保障。在論文中測試的多說話人帶噪聲的複雜聲學環境下，喚醒率達到 95%。

多音區的語音增強模型已經與聲紋模型結合，形成多音區的說話人驗證，提升聲紋系統在複雜遠場聲學環境下的魯棒性。未來這一工作可與語音識别等其它語音任務相結合。

參考文獻：

[1] Integration ofMulti-Look Beamformers for Multi-Channel Keyword Spotting,Xuan Ji, Meng Yu, JieChen, Jimeng Zheng, Dan Su, Dong Yu, ICASSP 2020

[2] End-to-EndMulti-Look Keyword Spotting, Meng Yu, Xuan Ji, Bo Wu, Dan Su, Dong Yu, Interspeech2020

延伸閱讀：

深度學習與大數據系統融合是dead direction嗎？-InfoQ

關注我并轉發此篇文章，私信我“領取資料”，即可免費獲得InfoQ價值4999元迷你書，點擊文末「了解更多」，即可移步InfoQ官網，獲取最新資訊～

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

圖文南通上海共建共享重大基礎設施
來源：交彙點新聞客戶端交彙點訊金秋十月，碩果累累，是豐收的季節。10月29日，鎮江市海工裝備産業（上海）招商會暨産業聯盟與中船協知識産權分會成立大會在上海成功舉辦。鎮江市部分海工裝備企業、研發機構負責人，與海工船舶領域的專家學者雲集在黃浦江... 2023-04-04
圖文教你學畫畫從零基礎開始
我是ENZO，畫學的策劃人。實力派的畫學，成就實力派的你。在初學素描的時候，很多人的第一印象就是素描裡的排線，覺得要想學素描就要先學會排線。這句話對，但是不完全對。排線這件事在素描裡的确很重要，但是不一定在剛開始接觸畫畫的時候就學會，在初學... 2023-02-01
圖文小孩流鼻血的正确止血法
對于南北方的朋友來說，秋天是不一樣的感受，南方空氣潮濕一點，所以即使是在秋天，也不會感到特别幹燥，而在北方天氣本來就很幹燥。所以秋天剛到，空氣裡就已經幹得不行，拿秋天來說，成年人在秋天就已經非常幹燥了，小孩子就更不舒服了，因為孩子的免疫力差... 2022-11-30
圖文長安歐尚x7隔音效果
随着順利舉辦2022冬奧會，北京成為了世界上唯一一座既舉辦過冬奧會，又舉辦過夏奧會的“雙奧之城”，它能反映出一個國家從貧窮到富裕的壯闊曆程，也折射出我們的國家已經走過了站起來和富起來的階段，現在則是強起來了。近10幾年，我們的汽車工業也随着... 2022-11-06
圖文 csgo一些實用小技巧
上期我們分析了如何在T連敗的時候該如何分配經濟，今天我們接着往期來繼續盤點一下csgo中那些你可能不知道的冷門小知識。1.拔手雷道具有沒有聲音？有人做過一個測試，在拉手雷的時候其實别人是聽不到聲音的，雖然自己會聽到聲音所以很多玩家覺得有聲音... 2023-01-18
圖文頓悟人生的禅意昵稱
不知不覺2020年隻剩下一個月了，有不少孕媽媽趕在2020年末生了鼠寶寶。新生兒降生是一件讓全家人都暖洋洋的喜事，下一步就是為寶寶取名字這樣的大事，一家人都卯足了勁，各種翻看古籍經典，希望為寶寶取一個有内涵又新穎别緻的好名字。于女寶寶而言，... 2022-12-11
圖文國外奧密克戎變異株最新消息
1月13日下午，國務院聯防聯控機制召開新聞發布會，主題為“介紹優化中外人員往來管理措施有關情況”。外交部、海關總署、國家移民局、民航局相關司局負責同志及中國疾控中心專家出席。人民日報記者：此前發布會也介紹到奧密克戎變異株BQ和XBB的相關情... 2023-03-01
圖文怎麼用簡單的材料做無硼砂
怎麼用簡單的材料做無硼砂?小提示：很多親們私信問我做出來的史萊姆粘手怎麼辦？在這裡小編告訴大家，粘手時，可以增加少量硼砂水并揉勻就能解決此類問題，下面我們就來說一說關于怎麼用簡單的材料做無硼砂?我們一起去了解并探讨一下這個問題吧!怎麼用簡單... 2022-10-03
圖文死神友哈能力
上一期中總隊長山本開全力，以為幹掉了友哈巴赫，但其實是其手下，之後友哈巴赫現身奪走了總隊長的卍解，然後就領便當了，這一期繼續聊一聊第七集。這一集的片頭用灰色色調回顧了千年前山本和友哈巴赫的一站，那時候的初代13番隊似乎更加強大，山本也更強，... 2023-03-05
圖文魔獸世界偵查突破口任務
我，涼酒，帥，不接受反駁。艾澤拉斯為期一周的兒童周于今天（5.2）正式開始，一周後的5月9号結束。這一期攻略将會帶大家一起了解兒童周的玩法和獎勵，以及成就的獲取。點開介紹，讓孤兒看看英雄的生活是怎樣的！擺放暴風城的孤兒院監護員奈丁佳爾，奧格... 2022-11-08
圖文王勁松和周冬雨的電視劇
由北京電影學院表演學院副院長王勁松首執導筒的電影《憤怒的兔子》昨日在無錫開機，主創陣容首次曝光，彭豆豆脫穎而出擔綱女主。此前王勁松稱，該片的全部演員将從他的2000名學生中挑選産生，究竟誰能從占據娛樂圈半壁江山同時又競争激烈的北電人才中勝出... 2023-03-24
圖文司藤開播時間
哈哈哈哈，《司藤》昨天晚上更新了兩集，開心的我今天中午沒睡覺去追了。新的劇情好好笑，司藤和秦放兩個人冷戰，可是苦了顔福瑞，是個出氣筒沒錯了，兩邊挨怼。坐個飛機好不容易可以坐頭等艙，還被換了，又自己一個人陪司藤在住的地方，大晚上的去找白英屍骨... 2022-12-08
圖文暗黑地牢dlc包括哪些
暗黑地牢最新的DLC鮮血宮廷終于正式發布了，和原版遊戲一樣遊戲中也是有很多地方可以進行物品互動的。今天小編為大家帶來的便是玩家“死亡循環IsMe”整理分享的DLC鮮血宮廷部分物品互動攻略，不清楚什麼地方可以進行物品互動的玩家不妨點擊進來記下... 2023-03-25
圖文魔女之泉4第三章攻略
魔女之泉4支線任務怎麼過?具體的通關方法是什麼?任務的流程有哪些?魔女之泉4是一款策略養成類的rpg遊戲，熱門ip魔女之泉系列作品的第四代，在遊戲中有很多的劇情内容可以讓玩家去解鎖，很多玩家都想知道遊戲中的支線任務的完成方法是什麼，下面給大... 2023-03-30
圖文最稀少的黃金血型
審核專家：金濤沈陽市紅十字會醫院血液科主任醫師前段時間小編看到一個新聞，江蘇一家醫院接診了一名女性患者，在做血型檢查時發現，她竟然是罕見的“黃金血型”！來源丨微博截圖黃金血型是什麼？難道是常說的熊貓血？還是“萬能血型”O型血？今天我們就來好... 2023-03-17
圖文天空出現神秘黑雲
又是遼甯，又出現了神秘天象！北京時間12月4号，在遼甯撫順，下午五點多，上空出現了神秘天象，無邊無際的烏雲遮天蔽日，猶如逐漸矗立起來的一座連綿不斷的高山非常壯觀。一時間很多人紛紛停下來拍照發朋友圈，由于天空出現的是一半烏雲一半晴天，很像是傳... 2023-02-19
圖文常見的馄饨餃子餡
做了二十多年的餐飲生意，每天與廚房共處，與食材為伴，對一些面食品的制作流程也是了解甚多，早些年無意中考取了面點師的資格，也算是個專業人員了，那時還在經營快餐店，所以餃子，馄饨，包子等這些面制品銷售的比較多，對與餃子餡的調制，也有自己的一些經... 2022-11-23
圖文楊堅善待北周皇室了嗎
楊堅代周幾乎是曆史上所有篡位中最輕松的了，清代史學家趙翼認為：“自古得天下之易莫如随文帝也”，近代史學家岑仲勉認為楊堅沒什麼顯赫功績，但是能完成篡位計劃，幾乎全靠劉昉、鄭譯矯诏。目前主流觀點幾乎都認為楊堅代周是最容易的，事情真的如此嗎？江郎... 2023-03-02
圖文火花塞怎樣選
火花塞的作用是将高壓線圈傳導過來的上萬伏的高壓電引入燃燒室，并産生電火花點燃混合氣，與點火系統和供油系統配合使發動機作功。因此，火花塞的性能在很大程度上影響着發動機的性能。那麼，要換火花塞究竟要怎麼選擇呢？在要選擇火花塞之前，應該先了解清楚... 2023-03-05
圖文甲方土建工程師屬于什麼部門
甲方土建工程師屬于什麼部門?很多人說，施工員跟甲方土建工程師能有什麼區别？大緻應該差不多吧？不都是在現場操作麼？這話聽起來就外行了那麼，施工員跟甲方土建工程師到底區别在哪個地方，我們一起來看一下，下面我們就來說一說關于甲方土建工程師屬于什麼... 2022-12-11
圖文推薦幾種牙齒美白方法
編輯／Amanda圖／翻攝pexels，IG@sachi_fujii_official、@zawachin__0816很多男生都說喜歡愛笑的女生，笑容不僅能拉近人與人間的距離，還是增加魅力的武器，擁有一口潔白亮麗的牙齒更能為笑容加分，且現在... 2023-02-08
圖文江西糕點有哪些
每當臨近年關總會被各種各樣的年味所吸引除了新衣服、壓歲錢還有着各種糕點讓人怎麼吃都吃不夠今天大表哥就給大家推薦那些吃過後讓人忘不掉的糕點都是江西的傳統特色也可以嘗試着自己動手試試哦~九江酥糖九江酥糖的曆史悠久，唐宋文人曾稱贊其為：“茶罷一塊... 2023-03-30
圖文 711便利店生意如何
在全國有很多全家和711便利店，當然，其他便利店更多，全家和711商品相對于其他便利店都貴，但是生意卻比其他便利店都好，為什麼？難道是因為對口啤的信任？大家甯願貴點買放心？現在的便利店已經完全不是以往的模式了，不論是從店面的裝修還是食品種類... 2023-03-22
圖文扁豆怎麼做不需要肉
扁豆很多人都很愛吃，當然扁豆的做法也很多，最常見的就是炖扁豆！當然如果做法不得當的話我們吃了也會中毒拉肚子呢，所以我們一般都是慢慢煮熟，但是做着做着變爛了不好吃。那怎麼做扁豆顔色好看口感還爽脆呢？（視頻觀看更詳細）今天我們用扁豆進行切絲，然... 2023-01-22
圖文每日一字喜
我們都知道“喝”今天就是指把液體或流質的食物咽下去。而這個意義，在古時使用的卻并不是喝字。上古的時候，人們用飲表示喝，如飲水思源、飲鸩止渴等成語至今還保留了飲的用法；唐代的時候開始用喫，表示吃酒、吃茶，杜甫的《狂歌行，贈四兄》寫詩人的生活場... 2023-02-01
圖文打印機噴頭一直流墨
打印機噴頭一直流墨?購買打印機能終身送墨水？這麼一件看似不靠譜的事情居然在很多電商平台真實存在這究竟是給消費者的福利還是巨大的圈套，我們今天一探究竟，下面我們就來說一說關于打印機噴頭一直流墨?我們一起去了解并探讨一下這個問題吧!打印機噴頭一... 2022-10-14
圖文物流運輸領域存在的痛點問題
中國青年報客戶端北京5月11日電（中青報·中青網記者趙麗梅）當前，我國交通大動脈基本打通，但上海等部分涉疫地區的城市配送和郵政快遞末端微循環不暢的問題仍然存在。今天，在國務院政策例行吹風會上，交通運輸部運輸服務司負責人韓敬華表示，交通運輸部... 2023-01-15
圖文城固德國門德爾松鋼琴
《乘着歌聲的翅膀》是一首描寫愛情的經典藝術歌曲。詞作者海涅是德國偉大的愛國詩人。曲作者門德爾松是德國浪漫主義作曲家。其作品風格，溫柔舒适，優美恬靜，結構完整嚴謹，矛盾沖突少，富于詩意般幻想。1834年，門德爾松在杜塞爾多夫擔任指揮，并完成了... 2023-01-18
圖文當你感覺累了的時候聽什麼歌
beyond，一個傳奇的樂隊，寫下了許多脍炙人心的歌曲，不僅僅許多人将他們視為偶像，他們更是激勵了一代人。下面就來說說在小編心裡Beyond幾首勵志，滄桑但卻振奮人心的歌曲1:《不再猶豫》誰人定我去或留，定我心中的宇宙隻想靠兩手，向理想揮手... 2022-12-08
圖文滿天飛的螞蟻
滿天飛的螞蟻?我坐在陽光下，看一隻螞蟻掠過草叢，爬過花壇，在色彩斑斓的地磚上奔跑一塊地磚被踩塌了半邊，形成一個水窪，螞蟻剛好掉進裡邊，現在小編就來說說關于滿天飛的螞蟻?下面内容希望能幫助到你，我們來一起看看吧!滿天飛的螞蟻我坐在陽光下，看一... 2022-10-07

tft每日頭條

> 圖文

> 怎麼用嘿siri喚醒siri

怎麼用嘿siri喚醒siri

怎麼用嘿siri喚醒siri

相关圖文资讯推荐

热门圖文资讯推荐

网友关注