語音識别原理-tft每日頭條

語音識别原理

科技更新时间:2025-08-01 16:13:30

　　首先，我們知道聲音實際上是一種波。常見的mp3、wmv等格式都是壓縮格式，必須轉成非壓縮的純波形文件來處理，比如Windows PCM文件，也就是俗稱的wav文件。wav文件裡存儲的除了一個文件頭以外，就是聲音波形的一個個點了。

　　在開始語音識别之前，有時需要把首尾端的靜音切除，降低對後續步驟造成的幹擾。這個靜音切除的操作一般稱為VAD，需要用到信号處理的一些技術。要對聲音進行分析，需要對聲音分幀，也就是把聲音切開成一小段一小段，每小段稱為一幀。分幀操作一般不是簡單的切開，而是使用移動窗函數來實現，這裡不詳述。幀與幀之間一般是有交疊的。

　　每幀的長度為25毫秒，每兩幀之間有25-10=15毫秒的交疊。我們稱為以幀長25ms、幀移10ms分幀。每幀的長度為25毫秒，每兩幀之間有25-10=15毫秒的交疊。我們稱為以幀長25ms、幀移10ms分幀。

　　分幀後，語音就變成了很多小段。但波形在時域上幾乎沒有描述能力，因此必須将波形作變換。常見的一種變換方法是提取MFCC特征，根據人耳的生理特性，把每一幀波形變成一個多維向量，可以簡單地理解為這個向量包含了這幀語音的内容信息。這個過程叫做聲學特征提取。實際應用中，這一步有很多細節，聲學特征也不止有MFCC這一種，具體這裡不講。

　　至此，聲音就成了一個12行（假設聲學特征是12維）、N列的一個矩陣，稱之為觀察序列，這裡N為總幀數。觀察序列如下圖所示，圖中，每一幀都用一個12維的向量表示，色塊的顔色深淺表示向量值的大小。

　　接下來就要介紹怎樣把這個矩陣變成文本了。首先要介紹兩個概念：音素：單詞的發音由音素構成。對英語，一種常用的音素集是卡内基梅隆大學的一套由39個音素構成的音素集，參見The CMU Pronouncing Dictionary。漢語一般直接用全部聲母和韻母作為音素集，另外漢語識别還分有調無調，不詳述。狀态：這裡理解成比音素更細緻的語音單位就行啦。通常把一個音素劃分成3個狀态。

　　語音識别是怎麼工作的呢？實際上一點都不神秘，無非是：第一步，把幀識别成狀态（難點）；第二步，把狀态組合成音素；第三步，把音素組合成單詞。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技華為随身wifi免插評測
現在的手機卡一般都是無限量套餐了，因此流量很多時候都是用不完的狀态。但手機上是夠用了，可平闆電腦，筆記本電腦卻是無流量可用的狀态。因此，有一個随身wifi在這時就顯得尤其重要了。尤其是出門旅遊的時候，一個随身wifi就可以搞定所有親朋好友的... 2023-02-06
科技弱電機房建造方法
1目前在設計中沒有考慮到的通信機房問題從運行部門反饋信息的統計中，總結目前通信機房普遍存在的問題主要有四個方面：a)機房間隔，包括機房空間、門、窗的設計，機房的防熱輻射和密封性的考慮等;b)電源布線系統，包括交流配電箱、配電開頭、電源線的布... 2022-11-04
科技華為公司出現的問題
摘要：在全球軟件大會上，華為雲工程師深度分析了網站在各類極端重大災難場景下，如何快速恢複的高可用保障方案和工程化實踐。最近，某CDN服務故障，導緻海外大批知名新聞網站無法正常訪問或加載，一石激起千層浪。确實，随着越來越多的業務上雲，一個網站... 2022-11-02
科技和平精英為什麼遇不到主播
和平精英作為一款吃雞類的手遊，可以說每一次的吃雞都異常艱難，畢竟遊戲中有100位玩家，想要站到最後難度可想而知，而正因為遊戲的難度高，也因此誕生了一大堆的技術主播，他們擁有最穩的壓槍，最快的反應，最好的意識以及如同透視一般的預判。很多玩家在... 2022-11-30
科技美的舒适星無風感空調3匹
之前家裡的老房子裝的空調用着感覺十分不舒服，夏天使用的時候冷風直吹，家裡的老人都不敢開，感覺胳膊腿都受不了。所以這次新家買空調我還是比較看重舒适性的，想買一款不直吹的空調。經過多方對比，最終入手了這款美的舒适星智能空調，它的無風感功能讓我很... 2022-12-28
科技 mac電腦錄屏用什麼軟件
很多小夥伴喜歡使用蘋果電腦來進行工作。在工作時，需要使用到電腦錄屏，卻發現自己并不會使用蘋果電腦進行錄屏。蘋果電腦Mac怎麼錄屏？本篇文章，小編分享兩個超級簡單編輯的方法，一起來看看吧。一、使用系統自帶的錄屏功能使用蘋果電腦的時候還不會錄屏... 2023-02-27
科技 opporeno十倍變焦定制版背面
今天，OPPO官方繼續為Reno8系列手機進行宣發預熱，并且正式公布了OPPOReno8系列手機的外觀設計。根據圖片以及宣發視頻來看，OPPOReno8系列整體造型較為簡潔，背面采用一體成型工藝據悉為玻璃熱鍛打造。機身正面除Pro版本外，屏... 2023-02-27
科技谷歌地圖現可與手機共享位置信息
9to5Google消息，上周，谷歌發布了安卓版谷歌地圖的9.11.0版，該版本界面與之前相同，但其增加了一個很好的新功能：用戶可将位置信息、導航指示和方向直接發送給安卓手機。要想使用功能，隻需用戶在安卓手機上下載最新的谷歌地圖應用，并且在... 2022-12-09
科技海信變頻櫃機空調内外機不啟動
故障說明：海信KFR-26GW/27BP交流變頻空調器，用戶反映不制冷，上門檢查，遙控開機，能聽到室内機主控繼電器觸點吸合的聲音，說明室内機已向室外機供電，到室外機檢查，室外風機和壓縮機均不運行，測量室外機接線端1号L和2号N端電壓為交流2... 2023-01-13
科技中建八局實例教學
中建八局實例教學?魯網9月9日訊近日，中建八局一公司安裝公司第二屆“五小成果”大賽在濟南順利舉行，比賽采用線上＋線下相結合的方式，中建八局一公司副總工程師張憲柱，安裝公司質量總監栗祥、機電設計分院BIM總監劉益安及各部門經理、片區總工等參與... 2023-01-20
科技 word無法打開文件因為内容有錯
解決辦法：打開word，【選項】-【保存】-【自動恢複文件位置】，把後面的路徑複制一下在【此電腦】中【導航欄】裡粘貼這個路徑，就可以找到這個文件夾把出問題的word文檔複制到這個文件夾下把word文檔後綴.docx改為.doc雙擊打開，就可... 2023-01-16
科技香港雲服務器哪個穩定
香港雲服務器哪個穩定?對于剛接觸互聯網，并且開始學習與互聯網相關訊息時，容易被網絡上大量概念混淆，但每個行業中把握基礎概念知識都十分重要今日快速雲小編給您普及何為香港服務器，香港服務器的組成部分為哪些？，我來為大家講解一下關于香港雲服務器哪... 2023-02-01
科技華為v9如何升級鴻蒙系統
華為v9如何升級鴻蒙系統?工具/原料：華為首先打開華為手機，點擊“設置”選項，我來為大家講解一下關于華為v9如何升級鴻蒙系統?跟着小編一起來看一看吧!華為v9如何升級鴻蒙系統工具/原料：華為。首先打開華為手機，點擊“設置”選項。再點擊進入“... 2022-08-12
科技寒冷地區藍莓花青素含量高嗎
分子保鮮科技中所采用的磁場保鮮最初起源于日本冷食行業，通過磁場控制影響微生物和細胞分子的代謝，實現對海鮮、牛肉和蘑菇類食品的高質量保鮮。由于結構複雜、空間溫度變化、磁場精确控制和調節、能耗和成本等因素，此前僅在日本一些大型工業制冷設備中使用... 2022-12-12
科技 qq手機版超級qq秀怎麼關
早在11月初，一則"騰訊正式下線PC版版QQ秀"話題登上微博熱搜。該消息稱，在最新的PC版QQ9.5.2版本中，騰訊正式下線PC版QQ秀，用戶将無法再看到自己的QQ秀裝扮形象。不過騰訊QQ官方很快便辟謠稱，"PC端Q... 2022-11-24
科技快餐桌材料怎麼選
很多快餐店會使用快餐桌椅，現在的快餐桌椅材質有很多種，尺寸也有大有小，如果購買的話到底選擇什麼樣的快餐桌椅呢，很多廠家會根據快餐桌椅的技術參數來生産，現在的快餐桌椅有哪些技術參數呢，隻有詳細了解快餐桌椅的參數，掌握一下它的尺寸，遵循參數尺寸... 2022-12-11
科技手機5g是sa還是nsa
近日各大電商平台都已經進入到了雙11電商大促的預熱階段，這也意味着又一輪的剁手狂潮馬上就要到來了，而5G手機則成為了今年雙11期間不少消費者的關注重點。目前三大運營商的5G套餐預約量已經突破了一千萬，由此也可以看出大量消費者對于5G手機都非... 2023-03-03
科技造夢西遊4手機版白猿技能介紹
今天97973小編給大家帶來的是造夢西遊4手機版中寵物龜系列的資料介紹，我們來說說金甲龜。那麼它的技能怎麼樣呢？趕緊來看看吧。金甲龜金甲龜寵物簡介鐵甲龜的進化形态。獲取方法鐵甲龜進化獲得。寵物技能刃甲嘲諷：開啟後嘲諷周圍敵人強制攻擊自己同時... 2022-11-19
科技消防噴水裝置是什麼控制系統
濕式自動噴水滅火系統的組成：濕式自動噴水滅火系統是指準工作狀态時，管内充滿用于啟動系統的有壓水的閉式系統。濕式自動噴水滅火系統适合在環境溫度不低于4℃并不高于70℃的環境中使用。主要由閉式噴頭、濕式報警閥組、水流指示器、壓力開關、控制閥和末... 2022-12-08
科技蘋果國産oled屏幕和原裝oled區...
OLED和LCD屏有啥區别？拿蘋果這兩部手機對比，原來差距這麼大現在蘋果全系都在用OLED屏，不再使用LCD屏，許多人大為遺憾，認為LCD屏是優于OLED的。甚至喊出了“LCD永不為奴”的口号。那到底是OLED屏好還是LCD屏好？接下來小編... 2023-01-11
科技進電子廠上班時間能帶手機嗎
作為一個初進電子廠的新手來說，内心是有些忐忑的，不知道進電子廠之後做什麼工作，也不知道電子廠上班累不累？同時還想知道電子廠上班可不可以帶手機？同時還不知道廠裡的住宿條件怎麼樣？更不知道工資能不能拿到手裡，這樣想來，真的有很多擔憂的事情，内心... 2022-12-08
科技發電機勵磁是什麼原理
, 2022-12-08
科技售價4998元起
易車訊今日，2019款别克GL6上市，包括三款互聯版車型，售價為14.19-16.89萬元。新車搭載叠代升級的别克eConnect互聯技術，新增手機遠程操作車輛功能，并提供遠程升級、全新車載APP、SuperID個人賬号等全新車聯應用，以及... 2023-03-09
科技蘋果手機的拍照小技巧很簡單有用
用過蘋果手機的朋友都知道，拍出的照片成像效果比較真實，所以很多人覺得不如安卓手機拍出來的好看。如果你用的是蘋果手機，不開啟下面這5個功能，難怪你拍的照片不好看。一、HDR模式手機拍照時，将頂部的HDR功能給打開，将會拍出三張不同曝光程度的照... 2022-12-02
科技現在系統門窗主要有哪些品牌
系統門窗作為這幾年熱度最高的産品，無論是價格還是産品品質都是消費者一直讨論的話題，比如消費者在選購産品前都會提前在網上搜索系統門窗哪家好，系統門窗價格等等，今天就給大家揭曉一下系統門窗十大品牌排名上榜有哪些？系統門窗十大品牌：1皇庭金門門窗... 2022-12-09
科技華為手機怎麼設置成鈴聲
華為手機怎麼設置成鈴聲?華為手機能将視頻設置成來電鈴聲原來方法這麼簡單，學到了，下面我們就來聊聊關于華為手機怎麼設置成鈴聲?接下來我們就一起去了解一下吧!華為手機怎麼設置成鈴聲華為手機能将視頻設置成來電鈴聲！原來方法這麼簡單，學到了華為手機... 2022-10-19
科技球球大作戰隐藏名字代碼
球球大作戰隐身代碼，小編為大家分享球球大作戰隐身代碼怎麼弄，希望這篇球球大作戰攻略可以幫助到大家。Q：球球大作戰隐身代碼是什麼A：隻需要在ID欄輸入[00],在名字中加上這個别人就看不到自己的名字了，看起來就和孢子一樣，如果需要将球球大作戰... 2022-12-10
科技手機投屏電腦最簡單方法
打遊戲的過程中，你永遠都不會知道對面是什麼操作，别在打不過的時候說到“嗯，一定是外挂”。資深遊戲大神教你高招，克制一切風騷走位，那就是手機投屏電腦打遊戲！絕地求生-刺激戰場（吃雞）：王者榮耀：方法1：安卓蘋果通用這種方法需要借助win10系... 2023-03-03
科技 pdf文件怎麼編輯删減
工作中，你們是不是經常會遇到一些關于PDF編輯的問題？1、客戶給的PDF文件，打開有亂碼；2、需要删減或者增加頁數；3、字體丢失；等等，各種各樣的關于PDF編輯的問題，而你苦于沒辦法編輯。今天我給大家解決這個問題，讓你不用AI、不用PS，編... 2022-11-15
科技天文望遠鏡看深空天體
不知道大家有多久沒有好好看過星星了，對于現在的我們來說除非借助天文望遠鏡，要不然别說宇宙中的星座了，就連天上的星星都難以肉眼看清。畢竟現在的空氣質量遠不比以前，想看見小時候那樣滿天肉眼可見的星星，真的成為了一件"奢侈"的事情... 2023-01-21

tft每日頭條

> 科技

> 語音識别原理

語音識别原理

相关科技资讯推荐

热门科技资讯推荐

网友关注