自動櫃員機裡真的沒有櫃員嗎?
幾個月過去了,繪圖AI仍沒有取代人類畫師。
前段時間“用嘴畫圖”的AI很火時,就有一種“畫師将被取代”的焦慮在傳播着。又經過小半年的進化和更多新選手的入局,AI們再次取得了不小的進化,但這股悲觀仍沒有成為現實。
在目前市面上衆多效果頂尖的繪圖AI裡,如果加上對性價比的考量,後發制人的Stable Diffusion無疑是其中的佼佼者。
它能很好地模仿藝術家風格,人與物的輪廓邏輯更清晰,而且沒有不少AI禁用名人肖像之類的諸多限制。更重要的是,它已在8月24日正式将其算法開源。
開源的意義重大
在此期間,2D美術類AI的大放異彩,也自然地讓人們想起了它主攻3D的同類。隻不過相比起已經趟出了一條商業化道路的前者,2D轉3D類AI還存在不少局限和進步空間,并沒有什麼驚豔的效果來吸引更多眼球。
就在這樣的大環境下,一匹3D建模的AI黑馬在前段時間突然殺出。
靠着一張圖片就能轉化成模型的智能,輸入文字就能修改的便攜,以及符合人工建模标準的高完成度,人們很快就開始暢想起它在各個領域一展拳腳的那天。
隻不過,這驚人的一鳴剛剛初啼沒幾天,它就被此起彼伏的質疑聲被打上了騙局的烙印。越來越多的證據被網友扒出,都指向這個AI的背後很可能隻是一群拿着低廉工資的外包建模師。
1. 一鳴驚人
創立于2020年的Kaedim,是一家緻力于研究2D圖片轉3D建模AI的初創公司。他們旗下的産品隻有一個,就是與公司同名的AI項目Kaedim3d。
在一個月前他們公布的正式版Demo裡,這個AI展現出了強大的3D建模能力。最低隻需要一張圖片,它就能識别出圖中物體的3D形态,快速建好模型,并用可導入幾乎所有主流軟件的格式輸出給用戶。
就算圖片裡存在一些遮擋和殘缺,Kaedim也能和人腦一樣根據客觀規律将它補充完成。如果對模型的某個細節不滿意,再加上一段文字描述自己希望得到的改進,還能很快得到更符合預期的模型。
就算是找不到參考的複雜物體也不在話下
如此智能的效果,讓這個AI很快就在從業者間引發了讨論。這是因為在2D圖片轉3D模型的方向上,它看上去克服了不少以往的技術難點。
目前市面上的2D轉3D建模的AI,主流方法是把一個物體劃分為很多個區域後同時進行變形,有些類似于3D打印的過程,或是一塊被上百隻手同時拿捏的橡皮泥。
正因為它并不像人工建模那樣,先捏出大緻形狀、再進行細節雕琢,而是直到完成的最後一刻,它的每一部分都還在不斷變化,所以對參考圖片的數量、角度和質量都有較高要求。
論文《Differentiable Signed Distance Function Rendering》裡的展示
但Kaedim不一樣,它似乎和人工建模使用了同一套“從整體到細節”的流程,得到的模型幹淨整潔到已十分接近使用需求,也基本沒有以往AI常見的模型噪點和錯誤,
就算隻有一張圖片,它也能通按照人類的邏輯突破以往多角度、多圖片的要求限制,判斷出圖片内容的空間屬性,給出我們想象中的3D模型。
同一張圖片被推特用戶Rico拿來AI建模的結果就有明顯差别
但這一點正是其他同類AI犯錯的重災區,僅憑一張單角度的照片,它們大多還很難判斷其中物體的形态。深色實體和陰影的區别,圖片裡被遮擋一側的形狀,或者一些非純色的顔色變化等,AI都還很難和我們一樣去“想象”。
幾個反面案例
特别是在模型布線——這個對很多3D建模新手來說也是個老大難的問題上,Kaedim竟然也能做得很好。
3D模型上的線條越簡單清晰,意味着模型的結構更清晰、占用資源更少;模型上的線條越密集複雜,模型的可動性就越好。這并不是一個簡單的疏密問題,而是需要根據不同模型的形狀、類型或是使用場景靈活判斷,需要靠經驗積累慢慢摸索。
但Kaedim做出的模型,卻好像完全沒遇到這個問題。它不僅打破了很多人眼裡AI對布線完全沒概念的固有印象,很多模型上的布線就連人類新手都自愧不如。雖說它目前隻能提供一些簡單的模型,但在實用性上,對于很多小體量的開發者來說也夠用了。
Kaedim官方演示裡的模型
但就是這樣一個眼看着就要引領行業革命的好産品,卻在推出不久後就遭到了部分網友的質疑:Kaedim根本就不是一個AI。
而一切懷疑的起點,都是因為它實在太貴了,貴到同等價格完全可以請來人工外包。
2. “人工”智能
在Kaedim發布的演示Demo下,很多人都提到這些建模功能對于小體量遊戲工作室來說非常實用。在創始人接受的采訪裡,她也提到十分歡迎和小工作室進行合作,這部分遊戲開發者正是他們的目标用戶。
但是它的價格,卻實在不是這些開發者負擔得起的。
在他們的官網上,最低一檔的會員每月價格顯示為599美元,購買後能生成的模型數量隻有30個,每個模型能進行10次修改。就算是标價最高的15000美元每月的會員套餐,依然還有每月1000個模型的數量限制。隻有一個“價格面議”的最高檔位裡,才完全放開了生成模型的數量限制。
這個價格對于常常邀請業内人士進行免費内測的AI來說,着實不是一個小數字,高到足以支付外包建模師的工資。再加上不論模型的大小或者難易程度如何,Kaedim都需要15分鐘左右的響應時間,盡管官方解釋說這是AI的信息處理和中轉時間,但顯然站不住腳。
于是人們開始半開玩笑地懷疑,這個完全看不到建模過程的AI,背後難道真的隻是一群外包建模臨時工嗎?
一開始,并沒有多少人把這個對價格的吐槽當真,但很快就有人在Kaedim過去的招聘界面裡,找到了幾個月前他們曾招募外包建模師的信息。聘用标準裡除了按模型結算和自由職業外,還有一個很奇怪的要求:能在給出需求的15分鐘内參照2D圖片制作出3D模型。
這條極不合理的要求,很難不讓人把二者聯系起來
盡管Kaedim很快就否認了這張圖片的真實性,但又有網友在另一個英國的招聘網站上找到了相同的廣告,其中還提到了這份工作的年工資為15000英鎊,在當地并不算高。
目前這個網頁也已經遭到删除
對Kaedim是騙局的質疑逐漸發酵後,官方又再次發言進行了回應。他們解釋說這是因為他們對交給用戶的模型有一定質量要求,所以在AI的輸出的結果後,還進行了額外的人工審核和修改,這才出現了大家質疑的那些情況。
但對于這份并沒切中要害的解釋,大多數人并不買賬。
在這篇解釋文章下面,就有繼續追問他們為什麼要加上這麼一步畫蛇添足卻成本巨大的步驟。因為對于AI——特别是有着技術突破的AI,現在的用戶都心知肚明它們存在或多或少的錯誤,人們對新技術有着充足的容忍度,已不需要額外的遮遮掩掩。
“Kaedim的整個團隊都對社區的關注感到謙卑”
也有人在下面建議,現在讓質疑者閉嘴的更好辦法就是展示出生成的過程,或是放出“人工幹預”前AI制作的模型“生肉”。
在此期間,盡管又有人聲稱他們AI生成的模型和5年前網上出售的模型素材一樣,但Kaedim再也沒進行過任何回應。
他們在長文回應後因“已有了足夠的會員”關掉了付費通道,質疑聲也随着對它讨論度的降溫慢慢平息了下去。
3. 經典騙局
也許第一個提出“臨時工”假說的人,隻是抱着玩笑的态度提出了懷疑,但網友們會認準這樣的質疑并深挖下去,其實也并不是心血來潮。因為就算在AI已經逐漸普及的這幾年,用人工假裝AI的騙局也已經算不上新鮮事。
2017年,《華爾街日報》曾報道過一家名叫Engineer.ai的印度公司。他們宣傳的AI産品,能根據用戶的描述智能化進行APP自動開發,進行高達80%完成度的基礎功能搭建,極大地縮短流程和節約成本。
但在他們數位前員工的爆料下,所謂的“AI開發”其實隻是為了争取投資的噱頭,大部分開發工作其實交給了他們在印度等地雇傭的軟件工程師完成。
在被《華爾街日報》曝光的一個月後,盡管他們聲稱這些都是前員工們因合同糾紛做出的報複,但還是對報道中提到的諸多事實進行了回應。
他們同樣搬出了一套“人工輔助的人工智能”的說辭,表示盡管APP的開發主要由印度工程師完成,但AI還是參與到了“項目定位、定價和時間管理等重要的工作”中,APP的自動化開發平台工作仍在研發完善中,不再像之前宣傳時那樣底氣十足。
如今已棄用了engineer.ai網址的他們仍然使用着相同的口号
據英國風投機構MMC Ventures 的調查統計,在宣傳中具有某類AI元素的初創公司,最多能比普通軟件公司多吸引到50%的資金。但事實上其中超過40%的公司,其實并沒有任何形式的人工智能技術。
每當曆史上出現高出了大衆認知的新技術時,人們一開始總會不自覺地去懷疑:留聲機出現時,會懷疑裡面蹲了個演奏家;電影出現時,會想銀幕後是不是站着兩個演員;第一次見到自動櫃員機時,會猜測是不是因為裡面真的藏了個銀行櫃員。
但是當某個新概念普及開後,我們又會對它的廣泛應用變得不再敏感。從而被人認準這片“有所耳聞但不甚了解”的認知盲區,拖進一個又一個系滿華麗彩帶的“新事物”裡。
如果在今天,音樂盒可能就叫該叫“元宇宙音樂家”了
對于市場來說,到底是人還是AI或許根本不重要。哪種外殼看上去高端就包裝成哪種,哪種内核成本更低就選擇哪種。
此前繪圖AI剛剛興起時,就冒出了不少“新銳畫師”高價賣畫。其實隻是當時很多人沒見過的AI畫作,甚至還是盜用的其他人免費分享的作品,就打着信息差把AI又變成了“真人畫師”的中之人。
起碼在現在,AI和人類都還做不到完全替代彼此。除了在大幕還沒落下台前扮演着自己的重要角色,它們還會根據需求在這場雙簧戲的前後角色裡不斷轉換、互為替身。
在以後的很長一段時間裡,用真人僞裝AI的騙局肯定還會有,拿AI冒充人類作者的新聞也一定不會缺席。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!