tft每日頭條

 > 圖文

 > 總是判斷不了球的落點

總是判斷不了球的落點

圖文 更新时间:2024-07-21 13:17:57

編者按: 智顯未來,洞見新知。中科院之聲與中國科學院自動化研究所聯合開設“智言智語”科普專欄,為你介紹人工智能相關知識與故事,從最新成果到背後趣聞,帶你徜徉AI空間,看人工智能如何喚醒萬物,讓世界變得更美好 。

如果有人朝你扔過來一個球,通常你會怎麼辦?——當然是馬上把它接住。

這個問題是不是很簡單?但實際上,這一過程是最複雜的處理過程之一:首先,在複雜的背景環境下,球進入人的視野,被視網膜捕捉到後,經視覺通路發送到大腦處理視覺信息的腦區,進行更加徹底的圖像分析。同時,視皮層與其他腦區協作,判斷物體的種類,預測它的行進軌迹,最終通過傳出神經控制肌肉的運動,決定人的下一步行動:舉起雙手、接住球。上述過程隻在零點幾秒内發生,幾乎完全是下意識的行為,也很少會出差錯。

為了讓計算機模仿這一過程,首先需要讓計算機做到像人類那樣“看”,尤其是在嘈雜背景下像人類那樣快速準确的“看”,成為了近年來視覺感知這一研究領域備受關注的關鍵問題之一。日前,自動化所聽覺模型與認知計算團隊模仿刻畫視聽覺系統神經元側向作用的數學模型動态神經場,将其與脈沖神經網絡(SNN)相結合,嘗試實現這一目标,構建出具有噪聲魯棒性的仿生計算模型——LISNN。

SNN是一類使用比人工神經網絡更拟合生物神經元機制的模型來進行計算的神經網絡,最初由Wolfgang Maass于1997年提出。

相較于生物體内其他細胞,神經元和一些肌細胞具有可興奮膜。膜上有負責維持和調控膜内外的離子濃度差的特殊結構,使得膜兩側帶有不同的電荷,形成電位差。多數情況下,膜電位處于能使電場作用和擴散作用平衡的靜息狀态。

神經元受到刺激,膜電位發生變化并超過阈值後,膜對離子的通透性快速改變,引發膜電位變化。電位反轉到最大值後,膜對離子的通透性再次改變,膜電位回複至靜息電位。可興奮膜受到刺激産生動作電位,這種脈沖形式的信息在生物神經系統中傳遞,使神經系統能夠完成其最基本的功能。

脈沖神經元模拟的就是生物神經元的這類過程,不僅使得由其構成的網絡具有更加低的能耗,還使得網絡具有更強的生物合理性,能更方便地與生物學中發現的機制相結合,就比如生物神經系統中的側向作用機制。

在生物神經系統的感受器中存在着臨近神經元間的相互抑制和相互激勵。其中,側向抑制最初為解釋馬赫帶效應而提出,即人們在明暗變化邊界上常常會在亮處看到一條更亮的光帶而在暗區看到一條更暗的線條(見圖1)。這種側向作用後來在鲎(鲎的複眼由許多小眼組成,小眼之間由側向神經相互聯系,較易觀測側向抑制現象) 、貓等多種動物的不同感覺系統中被證實并應用在仿生的計算模型中。

總是判斷不了球的落點(讓計算機看清一顆球)1

圖1 馬赫帶效應示意(圖引wiki)

LISNN的結構如圖2所示,前端是兩層具有卷積感受野的脈沖神經元層,每層後面有一層平均池化層,後端是兩層全連接的脈沖神經元層。具有卷積感受野的脈沖神經元在模型中承擔特征提取的功能,類似于感受器的作用,因此隻在這層結構中使用側向作用。在側向作用機制下,每個脈沖神經元的膜電位都額外受鄰域内的其他神經元上一時刻狀态的影響。在目前已有的使用側向作用的計算模型中,側向作用系數往往是固定的和神經元間距離相關的函數,而LISNN中的側向作用系數則可以通過反向傳播進行學習。

總是判斷不了球的落點(讓計算機看清一顆球)2

圖2 LISNN模型結構示意圖

在靜态數據集MNIST與Fashion MNIST、動态數據集N-MNIST上的實驗表明,與傳統的神經網絡算法相比,所提算法能取得較好的性能并自然地實現對噪聲幹擾的抗性,具有一定理論研究價值和工程實用價值。

參考文獻:

Xiang Cheng, Yunzhe Hao, Jiaming Xu, Bo Xu. LISNN: Improving Spiking Neural Networks with Lateral Interactions for Robust Object Recognition. IJCAI, 2020.

來源:中國科學院自動化研究所

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved