點擊上方音頻按鈕,為您語音播報本文
模式識别研究如何使機器模拟人的感知功能,從環境感知數據中檢測、識别和理解目标、行為、事件等模式。模式廣泛存在于各種形式的信号和數據中,模式識别是人和機器感知環境、從環境獲取知識的主要途徑。機器學習由模式識别和計算學習理論演化而來,通過在數據上訓練優化而自動建立數據分析和模式識别的模型。
20世紀50年代以來,模式識别的理論和方法得到了巨大的發展。特别是近20年來,随着大數據和高性能計算的飛速發展,以深度神經網絡為代表的深度學習方法在視聽覺、語言、規劃、控制等方面取得了突破性進展,模式識别與機器學習普遍被認為是實現人工智能的最佳途徑和最核心的技術。
進入21世紀以來,以模式識别為代表的人工智能技術業已成為最重要的科技進展之一,人工智能正在諸多方面改變着人類的工作與生活方式。在這次以人工智能為核心的科技變革中,原有的研究問題、方法以及對智能系統的需求,都将發生前所未有的變化,這給模式識别和機器學習的發展帶來新的機遇與挑戰。可以預見,未來模式識别技術将變得無處不在,且越發成為不可替代的核心要素。模式識别技術将和認知、決策、控制技術越來越緊密地結合在一起,促進開放複雜環境下智能技術的研究和應用。
本書在回顧模式識别與機器學習發展曆程的基礎上,從模式識别基礎理論、計算機視覺、語音語言信息處理、模式識别應用技術四個方面出發,認真梳理未來互聯互通的世界對智能科學和技術的重大需求,結合模式識别理論與技術的已有基礎,歸納模式識别學科發展面臨的重大挑戰和機遇,厘清學科發展所涉及的關鍵科學和技術問題,分析界定學科發展新的生長點和新趨勢,凝練未來重要研究方向,形成模式識别學科的發展戰略建議。
模式識别基礎理論方向主要研究模式表示、分類和理解的建模理論與方法,主要方法可分為統計模式識别、句法和結構模式識别、人工神經網絡、支持向量機(support vector machine,SVM)等類型。
分類器設計是模式識别的主要研究内容,包括監督學習、無監督學習、半監督學習、遷移學習、強化學習等學習方法。在過去幾十年的模式識别基礎研究中,在貝葉斯決策與估計、概率密度估計、分類器設計、聚類、特征提取與學習、人工神經網絡與深度學習、核方法與支持向量機、句法結構模式識别、概率圖模型、集成學習、半監督學習、遷移學習、多任務學習等方面湧現出一系列具有重要影響力的工作。
目前模式識别基礎理論的研究呈現出幾個重要的研究趨勢:開放環境感知、結構可解釋性、魯棒性與自适應性等。未來的研究重點包括模式識别的認知機理與計算模型、理想貝葉斯分類器逼近、基于不充分信息的模式識别、開放環境下的自适應學習、知識嵌入的模式識别、交互式學習的理論模型與方法、可解釋性深度模型、新型計算架構下的模式識别、模式結構解釋和結構模型學習、安全強化的模式識别理論與方法等。
計算機視覺研究如何基于圖像讓計算機感知和理解周圍世界。過去幾十年研究的核心大多基于馬爾視覺計算理論框架,主要研究如何從二維圖像複原三維幾何結構。近10 年以來,以卷積神經網絡(convolutional neural networks,CNN)為代表的深度學習技術,在計算機視覺領域取得了重大突破,為目标識别與檢測、圖像分割、圖像場景理解、圖像檢索、視覺跟蹤、行為與事件分析等研究帶來了顯著的進展。
當下,計算機視覺與認知神經科學、應用數學和統計學等學科不斷交叉,與各種硬件深度融合,并受各種實際應用的驅動,在新型成像條件下的視覺研究、生物啟發的計算機視覺研究、多傳感器融合的三維視覺研究、高動态複雜場景下的視覺場景理解、小樣本目标識别與理解、複雜行為語義理解等方面将受到高度重視。
語音和文字是人類語言的兩個基本屬性,也是模式識别研究和應用的重要領域。以語音為主要處理對象的語音識别、語音合成和說話人識别等通常被稱為語音技術,以詞彙、句子、篇章等文本、語言為主要處理對象的研究則通常被稱為自然語言處理。
語音語言基礎資源建設、漢字編碼與輸入輸出及漢字信息處理、知識工程與知識庫建設是語音語言信息處理技術能夠蓬勃發展的基礎和支撐條件。在關鍵技術和理論方法方面,語言模型、序列标注模型、句法結構理論和篇章表示理論、文本表示模型、自動問答與人機對話、機器翻譯、語音增強、語音識别、語音合成等均取得了顯著的進展。同時,相關産業化應用方興未艾。未來語音語言信息處理技術除了在具體應用中不斷追求極緻的性能外,從科學研究角度出發探究人腦語言理解的神經基礎和認知機理也十分重要。具體來講,語義表示和語義計算模型,面向小樣本和魯棒可解釋的自然語言處理,基于多模态信息的自然語言處理,交互式、自主學習的自然語言處理,類腦語言信息處理,複雜場景下的語音分離與識别,小數據個性化語音模拟等問題将成為研究熱點。
模式識别技術的應用已經深入人類生産和生活的方方面面,重要性日益凸顯,在諸多應用領域取得了令人矚目的成果。面向應用的技術研究也推動了模式識别基礎理論與方法的快速發展。
生物特征識别、視頻監控、多媒體信息分析、文檔信息處理、智能醫療等是模式識别發展較快和應用較廣泛的領域。具體來說,在面部、手部和行為生物特征識别、聲紋識别、圖像和視頻合成、遙感圖像分析、醫學圖像分析、文字與文本識别、複雜文檔版面分析、多媒體數據分析、多模态情感計算、圖像取證與安全等應用方面取得了顯著進展。随着模式識别技術應用不斷深入,具體應用對模式識别技術不斷提出新的需求,新的研究問題不斷湧現,高可靠、高精度、高效率的模式識别應用技術變得越來越重要。其中,非受控環境下的可信生物特征識别、生物特征深度僞造和鑒僞、遙感圖像弱小目标識别和場景理解、醫學圖像高精度解釋、複雜文檔識别與重構、異構空間網絡關聯事件分析與協同監控、神經活動模式分析等都是在不同應用領域亟待解決的重要問題。
近年來,模式識别與機器學習、數據挖掘、腦與認知科學等領域交叉融合,相互促進。未來會結合得更加緊密,奠定模式識别技術在不同領域和不同應用中蓬勃發展的堅實基礎。
除了回顧理論和技術的發展外,本書還專門回顧了我國模式識别學科的發展曆程,分析概括了包括國家現行政策以及學術團體對學科發展的推動作用,具體介紹了我國在模式識别基礎理論、計算機視覺、語音語言信息處理、模式識别應用技術等各個方向取得的曆史性進展。同時,分析了我國模式識别研究的優勢領域和薄弱方向,并闡述了其中的主要原因。本書還指出,我國的模式識别學科發展水平距離國際領先水平還存在較大差距,總體呈現出重技術輕理論、論文多原創少、學界弱業界強等特點。
最後,結合我國研究現狀、現實需求以及國際環境,本書提煉了以類腦模型、自主學習、可解釋和可理解模型、自适應學習、語義理解、機器學習安全為主的重點發展方向,并且從科技人才培養、團隊制度建設、科研支持政策與國際合作政策等方面出發,提出具體可操作的政策建議,以期促進我國模式識别領域的學術思想交流,推動學科發展和技術創新,推進創新人才培養模式的探索。
本文摘編自《中國學科發展戰略· 模式識别》,由中國科學院共同組織編寫,标題和内容有調整。語音播報為智能生成,如有疑問請以文本為準。科學人文在線,與您共同關注科技史、科技哲學、科技前沿與科學傳播,關注人類社會的可持續發展,創造有價值的閱讀!
今日好書推薦
内容簡介
本書闡明了模式識别學科的科學意義與戰略價值,總結了模式識别學科的發展曆史及其研究規律,梳理了模式識别學科在基礎理論、計算機視覺、語音語言信息處理、模式識别應用技術等方面的發展現狀,分析了模式識别學科中尚未完全解決的關鍵科學問題,确定了面向學科前沿的優先發展方向和研究重點,指出了模式識别技術創新的新挑戰、新使命與新機遇,提出了模式識别學科發展的保障措施與政策建議。本書旨在為模式識别學科的健康穩定發展奠定堅實的科學基礎,促進模式識别在解決國計民生重大需求方面做出應有的貢獻。
本書适合高等學校、科研院所從事模式識别與人工智能等相關方向的學生和科研人員閱讀,同時也适合國家學科發展規劃和科研項目規劃等相關單位的人員閱讀。
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!