tft每日頭條

 > 圖文

 > 生活在被人工智能支配的夢中世界

生活在被人工智能支配的夢中世界

圖文 更新时间:2024-07-24 09:09:51

在預想中,我們以為AI圖像的生成界面是一個簡潔的提示詞輸入框加上圖像生成頁,然而Midjourney創新性地加入了“群聊”機制,本篇文章就來和大家聊聊Midjourney的使用體驗以及AI繪畫與人類創作之間的關系,感興趣的朋友一起來看看吧。

生活在被人工智能支配的夢中世界(人工智能請創作)1

讓我們聊聊最近大熱的人工智能(AI)藝術創作。

在艾廠的人工智能國際論壇進行的五月底(以至後來的六月),還發生着另外一件頗相關的重要事件——兩款主要的人工智能圖像生成軟件,DALL·E·2和Midjourney,都開始開放測試版的内部邀請

沙丘的成員也獲得了Midjourney的邀請,進入了測試版的discord社群,得以觀察到無數圖像的生成、篩選與調校,也嘗試了自己輸入的提示詞(prompt)以生成AI圖像。

在預想當中,我們以為AI圖像的生成界面是一個簡潔的提示詞輸入框加上圖像生成頁——類似于谷歌圖片搜索頁面,隻是“搜索結果”換成了“生成成果”。

然而實際情況卻是,所有Midjourney受邀的測試新人都将加入一個discord社群,這個大社群下又進一步細分出五十個“新人群”。當新人加入的時候,Midjourney的機器人(bot)将會首先自動在“通告群”中發出消息,指定某某新人到第XX号新人群中。

在這一“群聊”的機制中,用戶将以适當格式輸入提示詞——譬如“一顆檸檬戴着墨鏡,躺在沙灘上休息,攝影級真實風格”,而機器人将在約一分鐘後,在群聊界面裡回複依照提示詞生成的四張AI圖像,并在新消息中提及(@)新人。值得注意的是,這意味着所有用戶要求的圖像——不管是輸入的提示詞,還是生成出來的圖像,都将對所有人可見。

生活在被人工智能支配的夢中世界(人工智能請創作)2

Midjourney的Discord社群的截圖。左側是新人群的不同頻道,右側展示的圖像的提示詞是“消防員,1970年代拍立得風格”,圖像下方的U1代表放大(upscale)第一張圖,VI代表對第一張圖做出進一步變種(variation),以此類推。

圖源:作者。

在這個基礎上,用戶可以進一步對得到的四張圖像做挑選,要求對其中的某一個或某幾個做出其他變種(variation),或者放大尺寸、增加分辨率(upscale)。有趣的是,正因為這些所有步驟都處在一個群聊的界面當中,所有用戶都可以對其他用戶要求的圖像做挑選,而機器人會把這些要求一一回應,發布在群聊當中。

我們對Midjourney團隊選擇的這樣的交互/組織形式非常感興趣。不得不承認,五十個接連不斷滾動着新消息的群組十分有沖擊力,龐大的信息量和不斷增大的積累速率注定沒有任何單個的人類大腦能跟得上——這樣的機制一開始也讓新人有些暈頭轉向。

但适應以後,我們也大概體會到這種形式的妙處——我們仿佛置身于一個巨大的實驗性公共藝術項目當中,這是單點的、以個體用戶為中心的界面(譬如谷歌圖片的搜索框)所不能比拟的。

生活在被人工智能支配的夢中世界(人工智能請創作)3

同樣的提示詞:“一顆檸檬戴着墨鏡,躺在沙灘上休息,攝影級真實風格。”左側是Midjourney的生成圖像,右側是DALL·E·2的。

圖源:MattVideoProductions。

首先,這種像洪水或雪球一樣不斷向人滾來和湧來的圖像量,或許也正是人工智能藝術想要向我們傳達的一個重要特征——沒有哪個人類藝術家或者人類藝術家團隊,能夠如此大量和快速地響應“客戶”的要求,并不斷産出不同變種,再進一步修改并放大,二十四小時無休無止。

其次,這種群聊的機制也讓輸入者、觀看者和AI機器人的身份變得史無前例地平等,并且邊界模糊。這裡沒有作者和觀衆的二元對立,署名權也似乎無從說起——一張驚豔的圖究竟是誰的作品?是最起初的提示詞輸入者嗎?是AI機器人嗎?是Midjourney團隊的算法工程師嗎?是中途幫忙選擇變種或者要求增大尺寸的其他用戶嗎?這是多方協作、去中心化的過程。

第三,每個用戶不斷看到其他用戶的提示詞,也不斷看到新的AI生成圖,也構成了一個不斷向其他人學習怎樣更好地、更有創意地輸入提示詞的研讨會式的場所。另外,當看到其他人要求的圖像出現,并從中篩選,本質上也是在幫Midjourney團隊義務訓練他們的算法。

這些也引出了人類藝術家時期不曾有過的問題,在AI創作的往複溝通中,究竟誰是真正的受益者?架構者、輸入者、篩選者、觀衆、機器之間,究竟誰在訓練誰,誰又在向誰學習?

生活在被人工智能支配的夢中世界(人工智能請創作)4

提示詞:“一個日本女人坐在榻榻米上,攝影級真實風格。”Midjourney的生成圖像。

圖源:作者。

事實上,這些問題在艾廠的2022藝術與人工智能國際論壇當中也多有提及。我們認為這是一個很好的機會和時間節點,寫下我們自己的想法。

艾廠的論壇以“人工想象力”為主題,由來自藝術、設計、文學、計算機科學和哲學領域的嘉賓對這一話題進行分享和探讨(關于論壇具體信息,點擊這裡跳轉)。沙丘研究所也受邀作為特别觀察員參與。不過,就像是上述羅列的那樣,我們對此并沒有宣言式的觀點,而是更想要用問題的形式分享一些我們正在思考的東西。

在嘗試了AI圖像的内測之後,沙丘的成員以及我們在Media Lab的朋友都由衷發出這樣的感歎:這樣的技術革命對于圖像和創作的影響,或許不會小于一百年前攝影技術對于繪畫的沖擊。正如本雅明在他著名的作品《機械複制時代的藝術作品》的開頭引用了保羅·瓦萊裡:

世界正發展着的偉大的技術革新會改變藝術的全部表達技巧,由此必将影響到藝術創作本身,最終或許還會導緻以最迷人的方式,改變藝術概念本身

對于本雅明來說,當時興起的電影使藝術不再是脫離大衆的收藏品,因為其本質本來就是大衆的。而如今人工智能藝術平台似乎讓每個人都成為了創作者。

另一方面,對圖像的重新定義似乎還将進一步重塑我們與世界的本質關系,畢竟視覺是人類感知世界的(最)主要渠道。正如電影中“攝像機”的位置為觀者創造了一種全新的觀察和共情的方式,人工智能藝術中的人工智能似乎也為我們提供了一種不同于人類創作的思考方式。

一、想象力和創造力是人類獨有的嗎?

對于很多人來說,“人工”和“想象力”兩個詞注定是一組矛盾;“人工想象力”也根本就無法存在,沒有比較和讨論的餘地。“人工”一詞指向“人造的”和“人造物(artifacts)”而與之相對,想象力似乎是人與生俱來的,是“自然的”而非被“制造”出來的。

另外,想象力還通常被認為是人類獨有的能力,它将我們與其他非人的“物”區分開來——不論是自然中的動植物,有機物和無機物,還是如工具和機器這樣多樣的人造物。

這種主導性的觀點尤其被人類中心主義所推崇,因為人們通過這種獨特的創造力獲得了主體性。在文藝複興時期和英雄式的現代主義中,我們都可以看到許多“單獨存在的天才(standalone genius)”。

這些藝術家、建築師、作家廣為人知,天才的光環讓他們區别于他們創作和生活中的協作者,他們的創作力是神秘的(或可以說是神聖的)——後人研究他們的生平、作品、創作過程和手法,但是他們的想象力和創造力則是先驗或超驗的,這樣的能力宛如神降,僅屬自身;這個神秘無窮的黑箱,他人無法刺透,更無法複制。也因這一點,這些天才的創作者作為個體,與同時代的其他人分離了出來,像是”單獨存在“的。

生活在被人工智能支配的夢中世界(人工智能請創作)5

提示詞:“一隻狐猴處在星叢圖當中”Midjourney的生成圖像。

圖源:作者。

然而,不論是以物為導向的存在論(Object-Oriented Ontology),還是後人類主義的藝術、設計、文學實踐和哲學研究,都挑戰着這種人類中心主義的觀點。在論壇中,嘉賓們也從不同方面就這一觀念進行了批判和思考。

譬如在許煜的分享中,他通過解讀康德,強調“想象”本身就具有“人工”的成分,因為圖像形成(image formation)的過程總需要涉及“符号”等人工系統;而喬安娜·澤林斯卡也引用後人類主義學者克萊爾·科爾布魯克的觀點,批判将人類作為唯一的藝術創造者的想法。

這一問題不僅是理解人工想象力的核心,也進一步成為對于人類想象力的反思。喬安娜·澤林斯卡在分享中展示了日本設計師菅野索和山口隆廣設計的“無意義的繪畫機器人(Senseless Drawing Bot)”所繪制的圖像——這些圖像既像是孩子的塗鴉,又和傑克遜·波洛克和塞·托姆布雷的藝術有着高度相似的特質。

對于喬安娜·澤林斯卡來說,與其将這一作品看作是對于人類塗鴉的一種模仿,它或許可以被理解為一種對于人類創造性為的重新思考——或許人類的創造力也并非來自人的理智和主體能動性。這些都使得“想象力是自然的而非人工制造的”這一命題變得不再穩定。

生活在被人工智能支配的夢中世界(人工智能請創作)6

菅野索和山口隆廣設計的“無意義的繪畫機器人(Senseless Drawing Bot)”。

圖源:Yohei Yamakami 2011。

生活在被人工智能支配的夢中世界(人工智能請創作)7

塞·托姆布雷“酒神” 系列(2005),藝術評論家阿瑟•丹托(Arthur Danto)稱這些畫為“酒神式狂歡之作”,隻有神才能達到如此酣醉之境。

圖源:Rob McKeever/Gagosian Gallery。

二、署名權與自主性歸屬于誰?

如今,數字素養(digital literacy)幾乎成為了新一代人類的必備。AI所生産的機械的、數字複制的圖像材料,也給當今幾乎耗盡了創造可能性的人類藝術家們提供了新的刺激和原材料。人工想象力既是自主的(autonomous),又是無處不在的(ubiquitous),它的美學令人目眩神迷。

但開發者和藝術家們顯然并不止步于将AI藝術視作一個可以不斷擴展壯大的靈感庫。我們也好奇,如果想象力并非人類獨有的,那麼人工智能是否能獨立進行創作呢?在論壇中,我們看到多位藝術家、設計師分享人工智能作為共同進行創作者産生的作品,但一個僅由人工完成的藝術作品會是什麼樣的呢?

生活在被人工智能支配的夢中世界(人工智能請創作)8

提示詞:“美國郊區住宅,1960年代拼貼廣告風。”MIdjourney生成的圖像。

圖源:作者。

這顯然還很困難。人工智能來自于人,現有人工智能的想象與創造也全程由人類像父母呵護一般陪伴着全程。其中最讓人工“署名權”成為問題的,在于首先,機器算法學習和訓練的庫仍由人來指定,而産出物亦由人來最後篩選。它仍需要人類的“處理”,才能被人類的雙眼“消化”。

論壇上,劉宇昆講述,他嘗試利用AI學習自己的寫作去創作新文本,卻發現成果并不驚豔,甚至難以被借用。他隻好大幅修改,加入很多自己的段落,最終發表了《五十件與人類合作的AI應該知道的事》(“50 Things Every AI Working with Humans Should Know”)。

同理,算法通過分析推薦而産生的審美,直白且相似度高,有時又很跳脫。即便如此,不少設計師有意識地去收集這些圖像,編輯整合成新的圖集,作為自己創作的情緒闆(moodboard)。

除開我們在文章一開頭提到的圖像的生産,AI也可以進一步處理已有的圖像,在某種風格内進行新的創作。它把圖像創作者的風格變為一種濾鏡,加在其他圖像上。例如在AI藝術網站Dream中輸入圖像内容,選擇“吉蔔力風格”,新生成的圖像就展現出相似的奇幻動畫風格,而轉換成超現實主義風格,則會出現類似于達利畫作的圖像。

生活在被人工智能支配的夢中世界(人工智能請創作)9

左側:輸入提示詞“沙丘,吉蔔力風格”後的結果;右側:輸入提示詞“沙丘,超現實風格”後的結果。

圖源:作者。

用戶提供命題,而AI作為産出者,生産了新的圖像。抑或是用戶提供内容,而AI把它放進别人風格的框架裡,生産新的圖像。那麼AI在這個産出過程裡的身份是作者還是工具?究竟誰才是這次創作的主語?AI,AI開發者,用戶,還是藝術家本人?

這不妨也誘使我們進一步想象:如果沒有人對于人工智能進行訓練、或對産出物進行篩選,也不僅考慮用AI處理已有的圖像,它是否還能夠産生某種更為“自主”的作品?

這樣的作品或許指向了一種更加不可知的想象力,成果或許也超出了人類的理解和欣賞範圍。菲利普•迪克的《仿生人會夢見電子羊嗎?》和萊姆的《索拉裡斯星》(點擊這裡跳轉)為我們提供了這樣的範式:對不可想象之物的想象。

三、人工智能的量産是創作嗎?

通過分析搜索到的大量圖像數據,AI提取其中已有的藝術風格、物體形狀、人物特征并進行整合和産出,全新的圖像作品便誕生了。

在我們加入的AI圖像内測社群裡,新的提示詞和新的圖像不斷産生、受挑選并且疊代、發展,這使我們産生了一種強烈的感覺——與其說這是一種“制作(production)”,毋甯說它是一種伴随着無數變異和選擇過程的“繁殖(reproduction)”。

這些圖像也模拟出一些現實世界中本不存在的創造物的形象。譬如我們可以在DALL-E、Midjourney或者其他AI圖像生成軟件中,疊加“紮哈·哈迪德”與“巴黎世家”(zaha hadid balenciaga)這樣各自風格強烈的建築師和時尚品牌,從而獲得一系列既有廓形剪裁,又具有光滑曲度的服裝——一個将二者基因強勢結合的奇異圖像。

這樣九張或四張全新圖像所構成的“圖集(atlas)”恰好使它穩定地建立了一種新的創作話語權,就好像世界上真的有這麼一位混血設計師一樣。

同理,我們可以混血食物和工具,建築和藝術,繪畫和攝影等等不同領域的詞條,創造新的“人造物(artifacts)”。電子時代的圖像現實,開始脫離我們的物理現實,自由繁衍。這些無限自主繁衍的新的圖像,是人工智能創作的“作品”嗎?

生活在被人工智能支配的夢中世界(人工智能請創作)10

在DALL-E mini中使用“紮哈·哈迪德”與“巴黎世家”産生的九張圖像。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved