目前,手機的掃一掃功能可以幫助我們識别商品信息,識别花的名稱,識别各種動物。這背後有一系列的技術支持。物種識别需要什麼樣的技術?識别的過程中用到哪些核心算法和理論?這都是大多數人不知道的。不過,物種識别理論與算法多種多樣,針對不同的東西用到的識别算法也不相同,因此本文着重帶大家了解其中一種算法和理論。即利用神經網絡進行動物的識别。
動物識别涉及生物分類,隻有生物學家已經把生物的類别分好了,計算機才能在此基礎上進行物種的劃分與識别。
不過,生物分類學降低了我們對生物多樣性的理解。我們知道幾乎所有分類信息都存在大量的高級專業知識和詞彙,這讓人不易理解,造成知識傳播困難,尤其那些熱愛科普的但不是專業科學家的人一看到到專業詞彙就會頭大。
因此,生物分類知識被局限在有限的地理區域内和有限數量的分類學家中。缺乏向公衆提供分類學知識的機會被稱為“分類學危機”。
計算機要出來解決這個分類學危機了。分類學家一直在尋找更有效的方法來滿足物種識别的要求,例如開發數字圖像處理和模式識别技術。目前,研究人員擁有昆蟲,植物,蜘蛛和浮遊生物的識别技術。這種方法可以進一步擴展到基于現場的生物識别,例如魚類。這些方法有助于緩解“分類危機”。
計算機科學家也設計了一種簡單有效的算法,并定義了一系列将特征識别與人工神經網絡設計(ANN)結合使用的新功能。
那麼這個算法可以識别哪些物種呢?可以識别魚類,植物,和蝴蝶。
基于模式識别理論和典型的自動物種識别系統中使用的基本計算機處理路徑,計算機科學家設計了一個用于物種水平自動個體識别的系統。該系統将預處理和提取組件與訓練和識别過程共享。
訓練圖像的特征用于在特征提取之後建立分類進度模式的模型。然後将這些特征和經過訓練的模型記錄在數據庫中,并結合到後續照片的分析中。該過程使用兩種類型的數據對圖像特征進行建模,從而獲得更好的物種識别結果。
當用這種算法去訓練如何識别一個動物時,計算機首先會去除圖像背景,并轉換為灰度。之後應用各種濾鏡消除圖像噪聲來改善圖像,然後将圖像縮小。接下來,将處理後的圖像輪廓化,然後繪制骨骼。上面這些步驟都可使用MATLAB語言中的圖像處理模塊完成。
處理完圖片後,就會對圖片中的動物進行特征提取。這些特征包括幾何,形态和紋理特征,這些特征可以通過圖像處理有效地提取,并且對于物種而言是唯一的。必須确保這些特征是該物種唯一的特征,這樣才能提高識别精準度。
幾何特征提取就得用到數學的功力了。基本上進行4步計算。分别計算樣本區域的像素總數,圖像像素周長,圖像直徑,圖像緊密度。下面的圖中展示了這4步數學公式,不過讀者隻需了解無需深究。
随後,算法需要處理圖像的紋理。紋理是用于均勻描述區域的重要視覺圖案。直觀的度量提供諸如平滑度,粗糙度和規則性之類的屬性。紋理取決于圖像的分辨率,可以遵循兩種方法:統計和頻率。這個算法則使用統計近似值,其中統計值被分析為一階和二階。
從圖像的灰度直方圖獲得統計一級。每個值除以像素總數,就會得到一個新的直方圖,該直方圖表示在需要識别的區域中顯示确定的灰度級。
當然這也需要大量數學公式支持,考慮到不想讓大家頭大,直接跳過。不過我們最好知道處理圖像紋理時用到了哪些公式,這些是方差公式,中位數公式,均勻度公式,同質公式,慣量公式等。有興趣的可以自行了解。
形态特征是那些集中于像素組織的特征。它們分為兩類:二維笛卡爾矩和歸一化中心矩。
分析圖像的特征結構對于物種級别的識别非常重要,因為人眼區分物種的直觀感受就是物種的特征,而算法要做的就是代替人眼完成這些過程。
接下來就用到人工神經網絡了。
先來講講什麼叫人工神經網絡,人工神經網絡簡稱神經網絡或類神經網絡,在機器學習和認知科學領域,是一種模仿生物神經網絡結構和功能的數學模型或計算模型。
神經網絡由大量的人工神經元聯結進行計算。大多數情況下人工神經網絡能在外界信息的基礎上改變内部結構,是一種自适應系統,通俗的講就是具備學習功能。神經網絡目前也具有情感功能,用到極其複雜的數學計算。
神經網絡可以解決很多問題,例如機器視覺和語音識别。這些問題都是很難被傳統基于規則的編程所解決的。本文讨論的物種識别就是如此,普通編程無法解決。
單層神經元網絡是最基本的神經元網絡形式,由有限個神經元構成,所有神經元的輸入向量都是同一個向量。由于每一個神經元都會産生一個标量結果,所以單層神經元的輸出是一個向量,向量的維數等于神經元的數目。
同時神經網絡還有多層神經網絡等等。
神經網絡被定義為由大量自适應處理單元組成的并行計算機模型,這些單元通過互連與變量進行通信。多層網絡具有一層或多層神經元,這些層通過從輸入圖像圖案中逐漸提取更有意義的特征來學習複雜的任務。
與其它機器學習方法相比,神經網絡學習速度較慢,但預測速度更快,并且具有非常好的非線性數據模型。簡單的感知器被分配了多個輸入,但是生成了一個輸出,類似于依賴于輸入權重的不同線性組合并生成了線性激活函數。
多層感知器由一組包含一個或多個輸入層的源節點和一組隐藏節點輸出組成。輸入信号通過網絡逐層傳播。
神經網絡結構由N個輸入N = [ N 1,N 2,…,N n ],一個隐藏層h和一個輸出向量S = [ S 1,S 2,…,S m ]組成。通過轉換向量S,評估每個S i二進制信号[0,1]。在反向訓練算法的基礎上,有監督的訓練階段(即S型激活)是根據權重和偏差在負梯度的方向上進行更新,然後在相反的方向上進行更新。隐藏層和輸出層的S激活函數由以下公式确定。
輸入神經元的數量由每種模式中可用的描述符數量确定,輸出神經元的數量由每個數據庫中分類的物種數量決定。為了确定給定數據圖像的最佳神經元數量,研究者已經探索了識别成功率與神經元數量之間的關系。顯然,需要大量的神經元和世代來處理每個集合中圖像的信息。随着物種數量的增加,識别也變得更加困難。
神經網絡使用了來自圖像數據的分類物種。但是,大多數其它研究僅使用物種豐富度較低的數據庫,這些數據庫通常跨越許多不同的學科,并且由于形态特征的巨大差異而易于分類。而神經網絡以這些網絡的工作為基礎,并且所需的操作員專業知識,成本和響應時間都很低。神經網絡的物種識别準确性和可用性,可以有效識别魚類,植物,蝴蝶。
不過,物種之間的高表型相似性也會影響人工神經網絡的識别能力,這是由于某些物種的表型差異較小,這些差異僅在細微的細節上有所變化,例如牙齒或鳍半徑,這會影響分類。不過總體上。系統的總體性能達到了高精度和高精确度。具有較低物種數的物種的鑒别成功率較高,這可能由形态特征非常不同的物種而非實際物種的數量導緻的。
算法會根據分類關鍵字,區分物種的字符是形态結構,顔色圖案和大小。這些觀察是個體的分類學特征。因此,某些分類學家可能會偏向任何給定特征的值,因此,可以通過使用基于機器的分類來消除人的主觀性和時間限制。
特征提取方法并不取決于人們觀察每個物種的個體标本的方式的變化,因此消除了人類的主觀性。但是,仍然需要人類分類學家來訓練定義物種的神經網絡,并減少主觀性或不确定性。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!