随着計算機技術的發展,科學技術的不斷進步,圖像識别技術的應用日益廣泛,例如:在一些公司中,通過人臉識别或指紋識别進行員工考勤打卡;支付寶通過人臉識别的方式進行支付;在交通管理系統中,通過采集汽車牌照來識别車輛是否有違規違章行為;在無人監考的考試中,通過識别考生的肢體動作來判斷考生是否有作弊行為;在農業方面的種子識别技術、食品品質檢測技術;在醫學中的心電圖識别技術等。
圖像識别已經融入在我們的日常生活中,并随着社會實踐中越來越豐富的應用場景,被識别的對象内容也越來越複雜。近年來人工智能、深度學習等科學技術的快速發展,圖像識别技術也日趨成熟,并在工業、農業、交通、醫學等各個領域發揮着至關重要的作用。
一、圖像識别技術的發展
圖像識别的發展經曆了三個階段:文字識别、數字圖像處理與識别、物體識别。
文字識别的研究是從1950年開始的,一般是識别字母、數字和符号,從印刷文字識别到手寫文字識别,應用非常廣泛,并且已經研制出了許多專用設備。
數字圖像處理和識别至今也有近50年曆史了,數字圖像與模拟圖像相比具有存儲,傳輸方便可壓縮、傳輸過程中不易失真、處理方便等巨大優勢,這些都為圖像識别技術的發展提供了強大的動力。
物體的識别主要指的是對三維世界的客體及環境的感知和認識,屬于高級的計算機視覺範疇。它是以數字圖像處理與識别為基礎的結合人工智能、系統學等學科的研究方向,其研究成果被廣泛應用在各種工業及探測機器人上。簡言之,圖像識别的發展經曆就是從簡單到複雜的識别過程。
二、圖像識别問題的方法
在圖像識别的問題中,其數據本質是模式空間到類别空間的映射問題。目前主要的識别方法有三種:統計模式識别、結構模式識别、模糊模式識别。統計模式識别是結合了統計概率論的貝葉斯決策系統進行模式識别,首先根據待識别對象的所包含的原始數據信息,從中提取出若幹能夠反映該類對象某方面性質的相應特征參數,并根據識别的實際需要從中選擇一些參數的組合作為一個特征向量,根據統計決策的原理對特征空間進行劃分,從而達到識别不同特征對象的目的。
主要的分類方法有判别函數法、非線性映射法、K-近鄰分類法、特征分析法等。結構模式識别是根據識别對象的結構特征,将複雜的模式結構先通過分解,劃分為多個相對更簡單的且更容易區分的子模式,若得到的子模式仍有識别難度,則繼續對其進行分解,直到最終得到的子模式具有容易表示且容易被識規的結構為止,通過這些子模式就可以複原原先比較複雜的模式結構,主要用于需要對識别對象的各部分之間的聯系進行精确識别時。
而模糊識别則是對統計方法和結構方法的有用補充,對模糊事物進行識别和判斷,其理論基礎是模糊數據。它根據人辨别事物的思維邏輯,吸取人腦的識别特點,将計算機中常用的二值邏輯轉向連續邏輯。模糊識别的結果是用被識别對象隸屬于某一類别的程度,即用隸屬度表示。可簡化識别系統的結構,更廣泛、深入地模拟人腦的思維過程,從而對客觀事物進行更為有效地分類與識别。
識别圖像對人類來說是件極容易的事情,但是對機器而言,這也經曆了漫長歲月。
在計算機視覺領域,圖像識别這幾年的發展突飛猛進。例如,在PASCAL VOC物體檢測基準測試中,檢測器的性能從平均準确率30%飙升到了現在的超過90%。對于圖像分類,在極具挑戰性的ImageNet數據集上,目前先進算法的表現甚至超過了人類。圖像識别技術的高價值應用就發生在你我身邊,例如視頻監控、自動駕駛和智能醫療等,而這些圖像識别最新進展的背後推動力是深度學習。深度學習的成功主要得益于三個方面:大規模數據集的産生、強有力的模型的發展以及可用的大量計算資源。
對于各種各樣的圖像識别任務,精心設計的深度神經網絡已經遠遠超越了以前那些基于人工設計的圖像特征的方法。盡管到目前為止深度學習在圖像識别方面已經取得了巨大成功,但在它進一步廣泛應用之前,仍然有很多挑戰需要我們去面對。與此同時,我們也看到了很多具有未來價值的研究方向。
喜歡本文的話,歡迎關注活在信息時代哦:)
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!