ai小白鼠deepmind-tft每日頭條

ai小白鼠deepmind

圖文更新时间:2025-08-12 15:28:53

生活在一個AI“泛濫”的時代，我們幾乎每天都能看到 AI 研究上的最新進展。昨天，AI 打 DoTA 戰勝人類了；今天，AI 能自己找路了；明天，AI 能假冒人類打電話了。在擔心 AI 會滅掉人類的人們眼中，AI 正像一隻怪物一樣野蠻生長，像一隻侵略軍一樣從遠方大跨步逼近。

ai小白鼠deepmind（DeepMind給最厲害的AI測了IQ）1

然而實際上，你所看到的這些進展，隻是不同的 AI 在特定方向的進步。雖然當前基于深度學習的 AI 熱潮已經有五六年了，還是沒有一個獨立的 AI，像一個獨立的人一樣，能夠優秀地執行多種任務。

人們在形容 AI 時，通常會用這樣一種說法：這個 AI 的智商，跟三歲小孩差不多。智商 (Intelligence quotient) 簡稱 IQ，是評價人類智商一個普遍接受的标準。你有智商，我也有智商，就連三歲小孩也有智商。接下來問題來了：既然說 AI 跟三歲小孩差不多，那麼它的智商到底有多少呢

得給 AI 測測智商了。

DeepMind要給AI測IQ

自 AlphaGo 橫空出世以來，AI 在解決一些複雜的、策略性的問題上，能力已經得到了證明。但如果想要更像“人”，AI 必須也擁有像人類一樣的抽象理解能力。

現在的 AI 計算能力不用說了，推理能力也很強，所以隻剩抽象理解能力了。Google 旗下的 AI 科研機構 DeepMind 認為，“基于神經網絡的機器學習模型取得了驚人的成績，但想要衡量其推理抽象概念的能力，卻非常困難。”

為了搞清楚現在的 AI 在抽象理解能力上究竟實力如何，DeepMind 還真給 AI 設計了一套測試題：

ai小白鼠deepmind（DeepMind給最厲害的AI測了IQ）2

這套測試題，借鑒了人類的 IQ 測試裡著名的瑞文推理測驗：給定一組圖片，找到符合其“演進”規律的圖片。

ai小白鼠deepmind（DeepMind給最厲害的AI測了IQ）3

在這種測試中，題目裡并不會告訴你要找到符合什麼标準的圖形，而是需要我們根據日常生活中學習或掌握到的一些基本原則，來理解和分析測試中出現的簡單圖案。

要找到正确的答案，往往要借鑒我們從生活中明白的“演進”規律。比如小樹苗長成大樹，比如從 0 到1、2、3、4、5 的加法，再比如加減乘除。以上這些，就是我們生活中所提煉出的抽象的“演進”(progression)的意義，就是人類的抽象理解能力。

“但是，我們現在還沒有找到辦法，能讓 AI 也可以從 ‘日常經驗’中學到類似的能力。” DeepMind 在論文中說。

“不過，我們依然可以很好地利用人類的這種視覺抽象邏輯測試，來設計一個實驗。在這個測試中，我們并不是像人類測試那樣，考察從日常生活到視覺推理問題的知識轉移。而是研究AI在将知識從一組受控的視覺推理問題，轉移到另一組問題的能力。”

簡單翻譯一下這段話就是：DeepMind 先給 AI 喂一組由三角形構成的圖像的視覺推理題庫，等訓練的差不多了，再出一組由方塊構成的視覺推理題，讓 AI 去回答，看它是能随機應變舉一反三，還是學會了三角，換成方塊就不靈了。
機器人仍需努力

對于擔心 AI 取代人類的朋友來說，DeepMind 的一部分實驗結果确實是個好消息：一些最棒的 AI 模型，在這個IQ測試中的表現得并不咋樣。

正如預期的那樣，當訓練集和測試集所采用的抽象元素相同時，多個 AI 模型都表現出超過75%的準确率。

然而，當測試集和訓練集出現變化，甚至有時候隻是把黑點換成較暗的淺色圓點，AI 的表現就會像無頭蒼蠅一樣，失去了準星。

上面這些都是深度神經網絡領域的當紅炸子雞，測起智商來卻沒那麼靈光了。

ResNet (Deep Residual Network)，即深度殘差網絡在其中一組測試中僅僅得到22.4%的低分。要知道，它的提出曾被形容為CNN（卷積神經網絡）的一個裡程碑式事件，它在網絡深度上比其他模型提升了n個量級，更重要的是它的殘差學習方式，改良了模型的架構，因此一出現就秒殺衆前輩。

測試中表現最好的 WReN 模型，則是 DeepMind 在關系網絡 (Relation Networks) 模型基礎上改良的版本。它增加了對不同圖像組合之間關系的分析，并可以對這類 IQ 測試的各種可能性結果進行評估。

不過，DeepMind 針對這個測試的邏輯，對一些模型進行改良，改良後的模型表現出明顯的提升。

比如，在一些模型中，DeepMind 加入了元标記（meta-targets) 的輔助訓練方法，讓模型對數據集背後體現出的形狀、屬性（形狀的數量、大小、顔色深淺等）以及關系（同時出現、遞減、遞增等等）進行預測，當這部分預測準确時，最終回答的準确率就明顯出現提升，預測錯誤時，回答準确率明顯下降。一些極端情況下，模型回答的準确率更是從預測錯誤時的32%提升至了87%。

DeepMind 表示，他們設計的這個實驗，最終目的并不是為了讓 AI 能夠通過這種 IQ 測試。他們關注的是 AI 泛化能力的問題。

泛化是指模型很好地拟合以前未見過的新數據的能力，這是機器學習界的術語，你也可以粗暴的理解成一個 AI 模型能否在各類場景中“通吃”。AI 的泛化能力越強，離啥都能幹的所謂“通用人工智能”就越近。

DeepMind 在博客最後這樣說道：

研究表明，尋找關于泛化問題的普遍結論可能沒有任何意義。我們測試的神經網絡在某些泛化方案中表現優秀，但是其他方案下卻很糟糕。

諸如所使用模型的架構、模型是否被訓練從而能解釋答案背後的邏輯等一系列因素，都會對泛化效果帶來影響。而在大多數情況下，當需要處理過往經驗從未涉及的、或完全陌生的情景時，這些 AI 的表現很糟糕。

至少現在看來，AI 還有很長的路要走啊。
,
更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

圖文适合早孕期間的運動
在傍晚的時候，常常看到孕媽媽們出來散步，即使肚子已經很大了，仍然會堅持散步。孕期運動對于孕媽媽來說，可以增強身體素質，讓自然分娩更順，也更有利于産後恢複。對于肚子裡的寶寶來說，也是非常利于發育的。妊娠期有許多運動可以做，包括瑜伽，散步，遊泳... 2023-02-03
圖文烤魚加盟被騙
原創作者：秦.關中鄭師傅加盟了一個餐飲品牌是做烤魚項目，加盟公司承諾：“保姆式”服務。從選址到裝修都是加盟公司幫他弄得，前後一共投了30多萬，裝修結束後，鄭師傅因為不能辦理《餐飲衛生許可證》遲遲不能開業，幹着急！鄭師傅打算開一家烤魚店，加盟... 2022-11-19
圖文 photoshop裁剪圓形
連電影中都使用了圓形構圖，而在繪畫中圓形構圖也早就存在，在攝影中其實也有很多人使用這個構圖方式。今天我們來用Photoshop制作一個圓形構圖照片。這類構圖比較适合主體突出的作品，我選了一張背景純淨的照片。我把它“剪裁”成圓形構圖，并且配上... 2022-11-05
圖文巴啦啦小魔仙所有人現在的樣子
巴啦啦小魔仙所有人現在的樣子?在很多80,90後的童年回憶中，兒童魔幻劇《巴啦啦小魔仙》絕對占有一席之地當初很多小女生都會模仿《巴啦啦小魔仙》裡面的動作和咒語，有一點男生追《火影忍者》《七龍珠》的感覺，今天小編就來聊一聊關于巴啦啦小魔仙所有... 2022-10-15
圖文一幅名揚中外的畫介紹給大家
《靜物·茶具》利奧塔德（1783年）梁二平1702年，讓·艾蒂安·利奧塔德在日内瓦出生時，中國的瓷器和茶正風靡歐洲。一生遊走世界熱衷多元文化的利奧塔德，在生命的最後20年裡，随着他所擅長的粉彩肖像畫需求下降，開始改畫靜物。他到底畫了多少幅靜... 2023-02-28
圖文阿瑪尼女款滿天星
說起阿瑪尼，大家會想到什麼？高級定制的西裝？濃郁飽滿的口紅還是大魔王代言的Si香水？可能很多人不知道，阿瑪尼一開始是以賣香水、手表、眼鏡這些百貨起家的，所以比起前幾位，其實它家在手表領域也是頗有建樹！身為全球知名的時裝品牌，Armani老爺... 2023-02-01
圖文身高不夠顔值來湊的5位男星
郭俊辰，1997年10月1日，粉絲數：576w第一次看到可愛的郭俊辰，是在《太子妃升職記》裡面，這部網劇當時的火熱程度，簡直無法想象，和去年的《小美好》也有得一拼。前兩年郭俊辰還參演了《旋風少女》第二季，飾演飛魚。王一博，1997年8月5日... 2023-02-13
圖文贊比亞血檀為什麼特别亮
最近在展廳看到一套贊比亞血檀的傳奇寶椅，吸引我的不是坐上去秒變太上皇的寶座氣勢，也不是一個個威風凜凜的獅子，而是贊比亞血檀這個材質本身。再此前我本人從未聽過這材質，顯得有點孤陋寡聞了。這材質顔色暗紅，咋一看有點像小葉紫檀，但是這麼大的家夥，... 2022-10-27
圖文不值得入手的漢服
不值得入手的漢服?開菠蘿财經（kaiboluocaijing）原創作者|梁麗爽，現在小編就來說說關于不值得入手的漢服?下面内容希望能幫助到你，我們來一起看看吧!不值得入手的漢服開菠蘿财經（kaiboluocaijing）原創作者|梁麗爽編輯... 2022-10-11
圖文 win7簡易版怎麼設置主題
小夥伴們，小編這幾天剛好學習了一個關于電腦的内容，并且現在就迫不及待的想要小夥伴們來了解一下了。那麼，小夥伴們就和小編一起來看看win7設置透明窗口的方法吧。最近小編發現有小夥伴想知道win7系統設置透明主題的方法，然後小編就花了些時間了解... 2022-12-02
圖文微信悄悄上線一波新功能和新規範
最近微信又悄悄地上線了一個新功能表情搜索功能跟以往的關鍵詞搜索表情包不一樣這一次小夥伴們可以用自己的表情去搜同類型或同一套的表情作為表情包達人小編抓緊去體驗了一下這個新功能第一步：點擊微信頂部的搜索欄，找到“表情”第二步：點擊“”來選擇自己... 2022-11-01
圖文微信被騙凍結了怎麼辦
平時很多人經常會用到微信轉賬在用微信轉賬時如果你的手機出現這兩個界面一定要提高警惕說明你當前支付存在巨大風險這15分鐘，非常關鍵↓↓↓典型案例：微信先付款，貨沒到人被拉黑大學生小芳是個“購物狂”，平日閑着沒事，就愛看購物直播。最近，小芳看中... 2022-11-13
圖文上海公積金如何才能正常提取
上海公積金如何才能正常提取?本人不在上海工作了，然後公積金封存滿半年了要怎麼提取？，我來為大家科普一下關于上海公積金如何才能正常提取?以下内容希望對你有幫助!上海公積金如何才能正常提取本人不在上海工作了，然後公積金封存滿半年了要怎麼提取？歡... 2023-02-18
圖文全新一代淩渡L現在能優惠多少
全新一代淩渡L現在能優惠多少?#淩渡L辣感美學數字轎跑#近期上市的新車中，上汽大衆全新淩渡L無疑是輛十分受關注的車型，截止到它上市當天（3月31日），該車的累計預售訂單就達到了18117台，可以說受到了消費者的追捧随着它公布了14.99-1... 2022-10-06
圖文紅顔知己藍顔的最高境界
紅顔藍顔招牌口号：“女人的心和身體是可以分開的，我們之間，就一個純字。”“男人女人之間沒有純潔的友誼?那隻怪你沒找到紅顔知己。”“他是我靈魂上的知己，我們彼此了解卻又永不占有。”每次和老婆吵架後，他都會奪門而出，跑到她家裡哭訴一番，完了會說... 2022-11-07
圖文勞動合同法經濟補償金是多少
勞動合同法經濟補償金是多少?近年來，勞動者的法律維權意識可以說是越來越強了尤其是這兩年市場經濟環境普遍不景氣，很多公司都是在生死線上徘徊，就連華為都高喊“活下去”的口号，可想而知其他中小微企業的生存壓力是多麼巨大另一方面，勞動者的日子也并不... 2022-10-06
圖文養老理财為何這麼火爆
養老理财試點已滿一周年。2021年9月，銀保監會發布《關于開展養老理财産品試點的通知》，随後在12月，工銀理财、建信理财、招銀理财和光大理财發布首批4款試點養老理财産品。到今年2月，試點範圍進一步擴大，“四地四機構”擴展至“十地十機構”。中... 2022-11-09
圖文山東直招士官能報考幾個學校
近年來，軍校是考生和家長們比較關心的院校類型之一，但軍校的錄取分數線都比較高，很多抱有軍人理想、高考成績不高的考生根本沒有機會報考。其實，除了43所正規的軍事院校之外，高考還有一種可以進入部隊的招生類别，隻要身體素質和政治素養過硬，上專科的... 2022-12-24
圖文三地齊發确保中歐班列高質量開行
三地齊發确保中歐班列高質量開行?新華社北京12月8日電題：開行量創紀錄絲路“新使者”中歐班列加速奔跑穩外貿，我來為大家科普一下關于三地齊發确保中歐班列高質量開行?以下内容希望對你有幫助!三地齊發确保中歐班列高質量開行新華社北京12月8日電題... 2023-01-08
圖文劍蘭花養殖方法與注意事項
劍蘭花養殖方法與注意事項?，現在小編就來說說關于劍蘭花養殖方法與注意事項?下面内容希望能幫助到你，我們來一起看看吧!劍蘭花養殖方法與注意事項, 2022-10-29
圖文喬遷的儀式感
經過裝修大考驗，去年8月終于入住二環邊的老破小，雖然房子不大，但也是三口之家的幸福蝸居，喬遷必須要有儀式感，于是自己搞了個喬遷儀式，簡單又講究。選擇好日子提前打開手機萬年曆或者網上黃曆，如果更在意可以找師傅幫忙挑選好日子，一般選擇宜搬家的日... 2023-01-21
圖文鮮苞翠葉臨風舞
#頭條創作挑戰賽#可可愛愛的花菱草，一片燦爛橙黃色的花朵。花菱草的花型很美，像大裙擺，每片花瓣上的褶皺像百褶裙開成綻放的花朵，光彩奪目，妩媚嬌麗，簇簇花朵，燦然怒放，沁人心脾。, 2023-03-14
圖文小娃學漢字
今天來看這幾個字詞：“場”，“闆塊”、“版塊”，“樣”，“情”。讀音易錯“場”，有兩個讀音：（cháng）和（chǎng），這個字非常容易讀錯，比如：空歡喜一場。是不是會讀成（chǎng），實際上是應該讀（cháng），感覺到很意外吧。讀（... 2022-12-25
圖文吉他零基礎第二課
這是一套G調入門吉他速成教材，可以讓你在短時間内學會吉他彈唱/彈奏。（視頻教學在主頁查看）第二節課通過《龍的傳人》這首歌掌握各類時值的音符, 2023-02-11
圖文黑暗之魂2原罪學者各boss弱點
DLC1收束靈魂塊魔法在有兩個槍兵的橋頭【罪龍噴火那】，右轉從罐子那滾過去走到頭惜别奇迹有個全是刺的地方的屋子找到合适的位置射機關，在裡面的寶箱裡必然的和平足迹暗術最難找的一個，說個大概吧，在進dlc後不用多少路，在一個很多升降機關的附近注... 2022-11-14
圖文學會與人相處的三大原則
在與人相處的過程中，弱勢的一方總是受到最多的傷害。01誰也不能改變世界在我們看來，一個人如果想要去改變自己的缺點是非常困難的事情，因為在這個世界上，并沒有任何人能夠真正幫助到你，如果一個人想要去改變自己的缺點的話，那無異于在自毀自己。如果一... 2023-02-02
圖文特别好看的雪花
問你個問題，你知道雪花長什麼樣麼？正如世界上不會存在兩片完全相同的葉子，世界上亦不會有兩片完全相同的雪花。六百年修忽而過，站在人類曆史世界文明的格局上，繪于其上的海水江崖紋飾，不僅隻在寓意江山安定，也将賦予山水相依，守望相助的全新時代内涵。... 2023-02-11
圖文怎麼設置無敵插件
大家好，這裡是正經遊戲，我是正經小弟。十多年前玩遊戲，沒有什麼腳本，也沒什麼挂，想快速升級要麼腰好腎好熬夜通宵刷經驗，要麼土豪找個專門代練人員24小時在線！這些操作太傷錢傷身了，其實遊戲還是可以挂機的。正經小弟昨天在玩家群裡和水友們聊到了當... 2022-12-29
圖文做一個鄉村追夢人
做一個鄉村追夢人?今年，河南八百裡伏牛山腹地小縣城栾川的一紙鄉村運營招募令登上熱搜一批青年大學生紛紛奔赴鄉村，以民宿管家、旅遊主播、研學導師、劇本殺主持人、新型農民等身份，化身“綠水青山合夥人”，形成了大學生返鄉創業就業的熱潮，我來為大家科... 2023-03-28
圖文蘆荟是不是全部蘆荟都可以吃
蘆荟是不是全部蘆荟都可以吃?辦公室裡有一位非常愛美愛保養的女同事，除了自己愛美，把辦公室裝扮的像一個植物園，其中最多的植物就是蘆荟，作用不隻是觀賞，還時不時的割下一塊來吃，現在小編就來說說關于蘆荟是不是全部蘆荟都可以吃?下面内容希望能幫助到... 2022-10-15

tft每日頭條

> 圖文

> ai小白鼠deepmind