安妮 郭一璞 發自 凹非寺
量子位 報道 | 公衆号 QbitAI
“AI摳圖,細至發絲,童叟無欺,假一賠十……”
随着AI技術的發展,摳圖業也步入了新的競争格局中,老牌巨頭、新興APP、開源項目、論文實現齊上陣,要把頭發絲都摳出來。
不過,吆喝一時爽,摳圖火葬場,到底誰家的摳圖最智能?誰家的AI最聰明?這是對計算機視覺技術的考驗,也是對選擇恐懼症用戶的考驗……
今天,量子位為大家一一測評,幫你挑出最合心意的AI摳圖應用。
測評對象:六大應用,四種場景在介紹我們的測評對象之前,需要先說一下目前智能摳圖界的兩大潮流風向:
一是全自動摳圖,扔一張圖進去,就自動摳好了,而且很有自信,不給你留手動調整的機會;
二是半自動摳圖,通過簡單的标點劃線,選擇圖片上需要摳出來的部分,反選圖片上需要抹去的部分,提示AI摳哪裡。
當然,還有一些應用是兩者結合的,AI自動摳出它認為是主角的物體,然後你可以手動标注需要摳出來的部分和需要抹去的部分,幫助AI糾錯。
至于PS套索那種純人工摳圖嘛,不在本次測評範圍之内。
現在,請我們的六名選手登場:
馬卡龍玩圖
摳圖界小網紅,曾用名Versa,早期以風格遷移著稱,也就是把你的照片改成名畫的風格,這家公司的主要技術方向是類腦人工智能,可以實現全自動摳圖。
麼麼照
來自京東Y事業部,和上面的馬卡龍玩圖類似,也是全自動摳圖,可以摳下來換背景。
美圖秀秀
老牌修圖軟件,可以實現半自動摳圖。
但是量子位在美圖秀秀的移動端、web端和Mac端都沒有找到摳圖功能,隻有windows電腦客戶端才有摳圖功能,都9012年了……
稿定摳圖
Web端摳圖神器,不用下任何客戶端和APP,适合低頻次需求。
不過,稿定摳圖僅支持.jpg和.png格式圖片,大小不超過9MB,半自動摳圖,需要标注保留和抹去的部分。
PPT
沒錯!Office家族,都是附帶摳圖功能的,隻要選中圖片,删除背景就行,全自動/半自動混合摳圖模式,辦公小助手,美化PPT插圖壓根不需要專門打開PS摳圖。
當然,和Office家族功能類似的金山家族和蘋果Keynote其實也可以摳圖。
PhotoShop CC 2019
修圖巨頭Adobe旗下C位的軟件,設計師們吃飯的家夥,具有海量複雜、專業的功能,最新的版本可以通過“選擇主體”功能實現一鍵摳圖。
測評規則:四個考點本次測評設置了四大考點,分别是:
摳圖精細度:到底能不能摳頭發絲?前景背景區分:顔色一樣,還能分出來麼?多人合照:大合照,能摳出幾個人?主角非人類:如果照片主角不是人,是我家主子會怎樣?四大考點分别對應四道題目,每道題目是六個摳圖應用摳同一張圖,比對用時、操作和效果。
第一題:到底能不能摳頭發絲?為了表示自己摳圖細緻,不少應用都宣稱自己是“發絲級”摳圖,效果究竟如何?
我們找到了這張Taylor Swift的照片,金色的卷發剛好造成邊緣處有很多很多頭發絲,讓摳圖AI們摳個夠。
AI們的表現如下:
這是難分伯仲的一道題,邊緣處理都比較粗糙,僅有馬卡龍玩圖略微露出了一點頭發絲的痕迹。
馬卡龍玩圖
馬卡龍大約運轉了10秒就摳好了,的的确确保留了一部分模糊的頭發絲,雖然也有一部分被抹掉了;整體邊緣是最圓滑的,換背景的話幾乎可以直接拿來用,不用做進一步的修整塗抹;
可以說,馬卡龍效果最好,是本輪冠軍。
稿定摳圖
大約用了不到半分鐘标注要保留的區域,基本沒保留什麼頭發絲,反而為了頭發絲把邊緣處理成了鋸齒狀。
PPT
自動選定人物,瞬間就摳好了。當然,頭發絲基本沒保留,邊緣效果也不是很好。
PS
保留了一部分綠色背景,感覺AI在判斷邊緣的時候陷入了焦慮。
麼麼照
麼麼照自動處理得很快,隻用了兩三秒,但是圖片被壓縮過了,頭發絲也就不那麼明顯了,看不出摳了頭發絲的痕迹。另外Taylor的左邊有一些殘渣,仿佛AI很努力地要摳頭發絲,但是最終還是失敗了。
美圖秀秀
美圖秀秀的邊緣處理仿佛是在搞笑,就像用手從海報上撕下來的一樣參差不齊,想要保留頭發絲,結果幹脆保留了一部分背景,讓人難以理解,不推薦。
第二題:人物衣服和背景一個顔色,能區分出來麼?
為了完成這個挑戰,我們找到了在康熙朝任職的“中國聖誕老人”鳌拜大人,鳌拜的暗色衣服和下方黑暗的背景幾乎融為一體,頭頂的頂戴花翎和背景的張燈結彩也剛好都是紅色。
不知道是不是這道題太難了,三位選手連完整的人都沒有摳下來。
馬卡龍
人物形象完美,就是紅頂子拿捏不準,整體尚可。
PPT
邊緣略有參差,整體效果尚可。
稿定摳圖
邊緣十分感人,為鳌拜的衣服增加了自己的設計,仿佛鳌拜穿了奇裝異服。
麼麼照
麼麼照無法區分右下方黑色的衣服和黑色的背景,不及格。
美圖秀秀
美圖秀秀是不是以為聖誕老爺爺是抽象畫?眼裡隻認紅頂子和白胡子?
連肩膀的形狀都沒有摳出來,隻能說,不及格。
PS
這不是我認識的那個Adobe,竟然隻把最像聖誕老人的頭部摳下來了,不及格。
重點是,連完整的“Merry Christmas”都沒摳出來。
我們把背景變成黑的看一下,一句話竟然漏掉了三個字母,真是匪夷所思。
第三題:多人合照,能分清否?當圖片上有不止一個人,有人站C位,有人站角落的時候,摳圖應用能做到把它們都找出來麼?
為此,量子位找到了這張谷歌大腦成立時的合影,Geoffrey Hinton、Jeff Dean、Samy Bengio、Vincent Vanhoucke等大佬紛紛上鏡,全圖總共17個人,還有中間那張大海報、旁邊的桌子和顯示器做為幹擾,是可以讓摳圖AI們好好琢磨一陣了。
馬卡龍玩圖
17個人每個人基本都被分開了,可以進行單獨編輯。陰影和牛仔褲交錯的下半部分也做了區分,可以說令人驚喜。美中不足的是,電腦顯示屏沒有抹掉。
PPT
雖然處理時間長達6分鐘,做了40個手動标注,不過大塊的非人物部分都去掉了,除了超高難度的下半部分,整體畫面還算幹淨。作為一個辦公軟件裡的小功能,能做到這樣已經相當優秀了。
稿定摳圖
一些多餘的部分沒有去掉,隻能說是一個平庸、沒有野心的摳圖軟件。
美圖秀秀
電腦桌和下半部分基本沒動,成功的避開了所有考點。讓人不得不吐槽的是上面那個紫色的小點:
仔細看,是天花闆上毛絨骰子“2”那一側,看起來萌萌哒,難不成美圖秀秀認為這是個可愛的小臉?
PS
左下部分跟沒摳一樣,上面摳了的部分,也是幽靈制造機啊。
△ 你後面有人
△ 你們後面也有人
吓得我點了左上角的叉叉。
麼麼照
這哪裡是摳圖,下半部分仿佛黴菌菌落一樣的密集的點點,難不成這張照片在上海經曆了梅雨季節?隻能說不合格。
第四題:主角不是人,看你怎麼辦許多摳圖應用都針對人做了專門的訓練,它們可以自動的找出圖片上所有的人。
可是,如果想給孫子摳個佩奇怎麼辦?
因此,我們找了個佩奇:
O(∩_∩)O哈哈~
這得問一下摳圖AI:啥是佩奇?
AI:一千個AI心裡有一千個佩奇。
美圖秀秀
雖然邊緣比較粗糙,不過形狀基本合格。
PPT
框定範圍後全自動摳圖,沒有手動幹預就能摳出一個完整的佩奇,但是,為什麼佩奇的眼神如此空洞?
好在,手動點選之後可以解決這個問題,也不費事。
PhotoShop
PS有一個好處,它自動的識别了所有類型的主角,不管是不是人,都公平對待。但是,佩奇的耳朵呢?怎麼丢了一隻?
稿定摳圖
摳是摳出來了,就是無法精準的識别什麼是佩奇的一部分。
換句話說,它搞不清楚“什麼是佩奇”。
麼麼照
不及格選手,隻摳了佩奇的眼睛鼻子和一隻手臂,難不成是覺得上半部分的佩奇比較像人臉?
馬卡龍玩圖
不及格選手,想摳人也就罷了,摳的不是手而是衣服這就有點匪夷所思了。
結果推薦一個好的修圖軟件必定秀外慧中,不僅摳圖質量要過關,在細節設計上也得配得上“豬豬軟件”的稱号。
比如操作簡便性:
除了專業賽道的P圖一哥PhotoShop外,其他軟件基本無需學習就能上手。
不過美圖秀秀操作略麻煩,不僅移動端無入口可摳,還沒有提供Mac版的客戶端,想要有上美圖秀秀的摳圖功能,需要先找一台Windows系統的電腦。
從時間方面來看,馬卡龍、麼麼照和PhotoShop這種全自動玩家總體優先于半自動玩家不少,半自動選手用時長短與圖片難度和你要求的精細度有很大關系。
效果可粗可精,時間可長可短。
不過,PS等這種半自動的應用也是專業玩家/強迫症患者放空自己的一種方式,俗話說畢竟沒有最好,隻有更好嘛。
綜合摳圖質量、操作難度和用戶體驗,量子位做出一張智能摳圖推薦榜:
馬卡龍玩圖
推薦指數:⭐️⭐️⭐️⭐️
摳人專用,全自動、準确,但除人之外不能摳
PPT
推薦指數:⭐️⭐️⭐️⭐️
辦公場景必用、簡單标記就行,性價比之王
稿定摳圖
推薦指數:⭐️⭐️⭐️
輕量級網頁應用,隻要肯精修,效果還是可以
Photoshop
推薦指數:⭐️⭐️⭐️
“選擇主體”新功能并非盡善盡美,如果有耐心可以慢慢手動摳呀
麼麼照
推薦指數:⭐️
摳人專用,全自動見效快,效果如何看天意吧
美圖秀秀
推薦指數:❌
O__O …小老弟,你為什麼如此想不開?
啥是摳圖?問題來了,這些應用是怎麼完成摳圖的鴨?
摳圖,也就是把一張照片裡的主角或者一類物體自動摳下來的操作,在學術領域有專門的英文名Image Matting。
想不到吧,這種連80歲老太都會玩的修圖操作,其實也可以被形式化為一個數學問題,即下面這個“求解摳圖方程式”:
I=αF (1-α)B,α∈[0,1]
其中,I是圖像RGB色彩,F為前景色,B為背景色,α為預測前景蒙版。這樣來看,摳圖這件事就被形式化為兩種顔色的線性組合,因此目前大多數方法将其近似為一個色彩問題,可以用多種算法來實現摳圖效果。
視覺顯著性檢測(Visual saliency detection)就是常用方法的一種:
舉個,當你一眼望到那張黴黴的照片,是不是最先注意到的是照片裡有個人→金發紅唇→應該是美女,随後才注意到了綠色的背景和其中模糊的綠葉?
△ AI覺得你是這麼理解的
好巧,AI和你想的一樣。
在視覺顯著性檢測中,AI會嘗試模拟人的視覺特點,猜測你可能對圖中哪些物體感興趣(也就是顯著區域),并把這部分自動提取出來。
摳圖這件小事不就完成了!
圖像分割(Image Segmentation)也能實現将主角摳出來的效果,它有幾個子分類,包含語義分割和實例分割等細化的技術,分割精度也在逐年升高。
和視覺顯著性檢測不同,分割大法不是AI找你感興趣的,而是在圖像中找到自己會認的。
在語義分割任務中,照片裡的每個像素都被打上了一個标簽,比如在這張道路場景圖中,綠色色塊代表行道樹,藍色色塊表示車輛,紫色色塊代表道路。
但是,語義分割隻能識别這個像素屬于樹,卻沒有辦法判斷一個像素塊的位置到底是屬于哪棵樹。想要要AI識别出個體,就得派實例分割上場了。
和語義分割不同,實例分割不需要标記每個像素,它隻要找到物體的邊緣輪廓就好了,标記上不同的顔色,個體分離技能get。
所以不難理解,在摳谷歌大腦團隊的那張合影時,有的應用可以摳出單個人并對其單獨編輯了。
最後,你最喜歡的摳圖工具是哪一款?它夠智能麼?歡迎在評論區告訴量子位。
— 完 —
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公衆号(QbitAI)對話界面,回複“招聘”兩個字。
量子位 QbitAI · 頭條号簽約作者
վ'ᴗ' ի 追蹤AI技術和産品新動态
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!