本文為大家總結了人臉識别技術在安防領域應用的完整流程,以及産品設計的細節。其中包括:如何獲取最佳圖像,如何進行設備對接等經驗。
圖像獲取是人臉識别的第一步,人臉識别項目中圖像來源主要依靠各類監控相機,圖像質量很大程度會影響人臉識别的準确率。當算法無法短期内優化時,可以從提升采集圖像的質量入手提高人臉識别的準确率。圖像質量與采集設備和采集環境密不可分,本文圍繞相機選擇與架設、相機接入兩個主題展開,撰寫了圖像獲取的相關要點。
一、相機選擇與架設
1. 選擇合适的相機
相機的性能決定了圖片質量的上限,因此相機的選擇作為人臉識别的第一步至關重要。需要根據不同的使用場景來選擇。
戶外遠距離人臉識别,建議選擇具有逆光調節(寬動态)、200萬像素以上的一體相機,需要考慮到相機的防雨、防霧、夜視能力。
如果項目對人臉抓拍圖片質量要求較高,則可選擇專業的人臉抓拍機。
2. 鏡頭的選擇
相機鏡頭焦距決定了相機的成像距離,大多數項目型相機需要自配鏡頭,下圖展示了焦距大小與識别範圍之間的關系。注意焦距與識别範圍成正相關。
圖1
3. 相機的架設
即使選擇了效果最佳的相機和鏡頭,也需要架設得當才能發揮其最佳效果。于是我們需要事先計算出最合适的架設高度和俯視角。
圖2
從圖2不同角度拍攝的人臉效果對比可知,不同的拍攝角度獲取的人臉效果互有差異,而按照人臉采集的慣例,通常是采用水平拍攝的方式最大程度獲取目标人員的正臉,如身份證照片的采集。
俯仰角
人臉攝像機在安裝時要求水平面上位于通道中軸線上(水平無偏轉),并垂直面上有一定的俯視角度以照顧不同高矮人員經過時能正常抓拍,避免一前一後通過抓拍區域時後方人臉被遮擋,俯視角度α 要求保持在 10°±3°。
架設高度
圖3
如圖3所示,推薦俯視角α為10°,攝像機視角中軸線延伸到人臉下颌位置,保證人臉處于畫面中心區域,取成年人下颌以下的平均高度為 1.5 m(頭部長 0.2 m),可得:
L=tan(10°±3°)×D(4)·1
H=L 1.5=tan(10°±3°)×D 1.5 (5)
例:室内相機可視距離為6m,則算得H為2.5m,即相機應該架設的高度為2.5米,如圖4所示。
圖4
架設環境
- 攝像機鏡頭至人員通道出入口中間空曠、無遮擋;
- 聚焦清晰,光照均勻,特别注意避免逆光、側光,必要時進行補光;
- 人臉大小80像素以上(雙眼距離大于40像素);
- 人臉的俯仰角度在15度以内,左右角度在30度以内。
調整鏡頭
調整鏡頭的目是獲得合适的觀察寬度。攝像機像素的大小決定了設備可觀察畫面寬度的範圍,觀察寬度過大會導緻人臉抓拍圖片模糊,所以一個合适的觀察寬度十分重要,人臉寬度像素宜大于120,瞳距像素宜大于40。
如表1,統計了不同像素的最佳觀察寬度:
表1
例:按照人像識别要求,人臉橫向像素點宜在 120 以上,1080P 攝像機全幅畫面橫向像素點為 1920,成年人臉的橫向平均寬度為 0.16 m,場景寬度(V)計算公式為:
圖5
二、相機接入
大部分人臉識别的場景,是建立在對實時視頻流(圖片流)的基礎之上,例如你想檢測一個攝像機實時畫面中的人臉,平台就需要先獲取相機的實時視頻流(圖片流),這就涉及到了平台與相機等設備對接的問題。
前端相機與平台之間是通過網絡連接的,如果想實現對接,就需要平台滿足相應的網絡協議。
1. 什麼是網絡協議?
網絡協議為計算機網絡中進行數據交換而建立的規則、标準或約定的集合。
例如,網絡中一個微機用戶和一個大型主機的操作員進行通信,由于這兩個數據終端所用字符集不同,因此操作員所輸入的命令彼此不認識。
為了能進行通信,規定每個終端都要将各自字符集中的字符先變換為标準字符集的字符後,才進入網絡傳送,到達目的終端之後,再變換為該終端字符集的字符。
2. 網絡協議的結構
網絡協議分為很多種,例如TCP/IP協議、IPX/SPX協議、NetBEUI協議等。相機對接用到的是基于TCP/IP的四層網絡,下三層由網卡、驅動、操作系統實現,研發隻需要依據設備的用途開發應用層的協議。
圖6
3. 通過協議接入相機
平台對接相機的目的是獲取相機的實時視頻流(普通相機)或圖片流(人臉抓拍相機),所以需要開發相應的流媒體服務協議,常用的視頻流媒體協議有RTP、RTSP、RTCP等,一般相機通用的協議為RTSP,人臉抓拍機一般支持FTP。
除此之外還需要在應用層設計添加相機的入口,需要用戶手動填寫相機的IP地址、端口、用戶名稱及密碼等。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!