【文 觀察者網/趙挪亞】
在圍棋這個人類一直以來占據着優勢的項目裡,谷歌旗下DeepMind開發的人工智能(AI)AlphaGo已經先後擊敗了柯潔和李世石兩位頂尖棋手。但說來難以置信,DeepMind開發的AI能打敗人類世界棋王,卻無法通過英國高中的數學考試。
《分析神經模型的數學推理能力》
4月2日,谷歌旗下的DeepMind團隊公布了一份名為《分析神經模型的數學推理能力》的研究報告(Analysing Mathematical Reasoning Abilities of Neural Models)。在這項研究中,團隊讓AI接受一項包含了算術、幾何、概率和測量的數學測試,考題有 40 題,難度大約是英國高中數學的程度。
DeepMind給出的40道英國高中數學題
不過,在這40道高中難度的數學題中,擁有強大通用算法和遠超人類計算能力的人工智能,卻隻答對了14題,正确率隻有35%,是實打實的不及格。
值得一提的是,在AI參加測試以前,團隊已經為其做好了充足訓練。據DeepMind介紹,他們為AI建立了一個包含200萬道題目的題庫,涵蓋了算術、代數、概率、微積分等各種題型。
同時,團隊也派出了循環神經網絡 (RNN) 和Transformer兩大當下性能最先進的模型參與測試。
為什麼人工智能無法答對高中數學題呢?
原來,最主要的原因是AI“看不懂”題目。DeepMind旗下的AI雖然已經擁有了極強的機器翻譯能力,但依然抵不住數學問題的複雜性和語言多樣性的壓力。
對AI而言,數學符号和題目本身就很難理解
對人類而言,要解決數學問題,要應用到的不隻有計算能力,還有各種各樣的認知技能。比如理解題幹,需要将文字或圖标轉換為算術運算符。
而對于依賴大量數據分析來尋求解決問題規律的AI而言,數學語言的複雜性是一座難以逾越的高山。
其次,AI“舉一反三”的能力,也無法與人類一較高下。它隻能處理一些内部存儲的問題,無法超越已有的環境去理解新的東西。
而人類在解決數學問題時,會進行推理,從已知的公理中找到最佳策略,而在具體的運算過程中,必須利用工作記憶來完成運算。
據DeepMind研究人員總結,現階段AI在推論的能力上,還不及人類。在解答問題時,人腦動用了多種認知能力,包括将符号分類、演算、運用工作記憶來儲存中間值、還要運用學到的規則或定理等。
相反,AI則擅長模式比對、機器翻譯和強化式學習,但彈性遠不及人腦。它們不太能将事物推論到已有經驗的環境外,更無法處理刻意亂輸入的資訊。
不過,雖然目前AI還無法當數學老師,但他們已經稱霸了相當多的領域。除了圍棋以外,DeepMind旗下的AI又在遊戲《星際争霸2》(StarCraft II)的測試賽中,5-0橫掃世界頂尖職業選手。
本文系觀察者網獨家稿件,未經授權,不得轉載。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!