精品論文賞析
2022年電子技術應用第7期
楊 戈1,2,鄒武星1,2
1.北京師範大學珠海分校 智能多媒體技術重點實驗室,廣東 珠海519087;2.北京師範大學自然科學高等研究院,廣東 珠海519087
摘要
過去幾年,視頻行為分類從手工選擇特征方式逐步向采用深度學習端到端網絡模型方式轉變。讨論了傳統手工選擇特征的行為分類方法以及基于深度學習的行為分類方法,着重對包括基于卷積神經網絡、長短期記憶網絡和時空融合網絡等不同的深度學習方法進行了論述,并對常用視頻行為分類數據集做了概述,對視頻行為分類方法的發展進行總結和展望。
關鍵詞
視頻行為分類,數據集,深度學習
引言
視頻行為分類的目的是根據視頻内容将視頻行為歸類為預設類别。随着數字攝像機、智能手持終端等各種視頻拍攝設備的普及,網絡上視頻産生數量出現飛速增長。截至2019年6月,中國網絡視頻用戶規模近7.59億,中國短視頻用戶規模為6.27億[1],最新興起的短視頻業務用戶規模以及用戶日均短視頻移動應用(Application,APP)停留時長均出現爆發式增長。圖像本身就包含大量信息,而視頻是圖像在時間維度的擴展,每秒往往包含24幀左右的圖像,所占存儲空間較之圖像可以說是呈數量級倍數關系。存儲、分析這些視頻内容需要花費巨大的财力和人力,在計算機自動分析視頻數據得到廣泛應用前,視頻内容的行為分類一般依靠人工實現,不僅效率低而且誤判、漏判率高。自動化視頻内容分析技術推廣的現實意義廣泛而深遠。
計算機視頻行為分析技術不僅可以同時自動監控多路信号,且不會産生疲勞,降低誤判的可能性;在視頻内容檢索領域的應用更是将極大減輕公共安全從業人員的視頻檢索工作量,提高他們的檢索效率,降低漏檢率。自動化視頻内容分析技術推廣的現實意義廣泛而深遠,深度學習在視頻分類的應用主要有以下方面。
原文下載
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!