#本文為人人都是産品經理《原創激勵計劃》出品。
不知不覺中,AI技術已經滲透了我們的生活,比如短視頻平台就有AI/AR道具,創作者可以利用這一類道具來創造更有趣的内容。具體而言,有哪些AI技術可以應用在内容類型産品中、增加創作的多樣性?不妨來看看作者的總結。
最近因為工作原因接觸到了快手的AI技術(主要是CV方向的),也跟快手的技術團隊做了一些訪談。不由得感歎其實快手的技術還是非常領先的,甚至很多場景做得比抖音還要早,技術單拎出來比字節的技術更加能打、更加領先。
但是為什麼AI技術如此出衆的快手卻在大衆市場上或者是我們談的商業市場上不如抖音呢?互聯網的競争如此激烈,原則上在占用用戶時間的維度上大家都是競品,人們知道字節的輕顔、剪映、醒圖,但是很少人知道快手也有對标的一甜、快影和原片。
圖1 快手頭條有一系列對标的競品
首先需要澄清的一點是,AI技術并不是萬能的。很多商業上的成功,并不代表這家公司隻是因為技術很厲害、算法很牛逼,商業上就一定很成功,這個不是充分必要條件,技術很牛逼最多隻是一個充分條件。
商業上的成功,或者是我們世俗定義的成功,更多還包括組織上的成功(人才的管理、激勵,組織協同工作、效能最大化)、産品的成功、對于人性的洞察與應用,對于商業模式的理解等等,這些全部要素才能最終使得一款産品真正地走向成功并且生命周期足夠長。
比如說微信就是一個很典型的例子,微信有AI技術麼?當然,但這些都是潤物細無聲的存在,微信并不會為了AI而AI,比如微信掃一掃入口識圖、識街景、識商品/長按翻譯/語音轉文字等,這些都是AI技術能力産品化,但是這些并不是微信這個産品的全部,或者說,這些技術隻是幫助微信更好地向用戶提供一個交流溝通的工具,讓人們更加無障礙地交流互動。
問一個問題,對于抖音或者快手來講,大部分人是刷視頻還是調用攝像頭主動拍攝視頻呢?
相信大家的答案應該是一緻的,大部分人用抖音快手還是用來浏覽,kill time。真正使用抖音裡面的各種AI/AR道具UGC創作内容的還是少數,大部分用戶如果使用道具可能是嘗鮮,比如一些拍同款;對于專業的内容創作者,主要是通過内容本身的編排設定來吸引觀衆,也不太依賴于AI的模闆或者是各種道具。即使需要使用AI的各種剪輯等特效技術,可能也是在視頻創作過程中使用,即作一個AI賦能的視頻編輯工具,比如類似剪映。
但是問題又回到了起點,為什麼快手很多的gan(對抗生成網絡)等AI生成技術比抖音好很多呢?頭條不是算法起家嘛?通過近一周多時間仔細分析兩家公司的背景,嘗試得出的原因總結如下:
1)基因使然
快手最早是從動圖gif剪輯工具起家,本身就是一家技術驅動型的公司,且創始人宿華和程一笑也都是技術出身,因此營造工程師的樂園,重點在CV等技術上加大投入,用技術來驅動産品,通過一些AI加持的爆款特效 專題運營來激發用戶活躍度;這個是快手這家公司的底層邏輯。
2)老鐵需求
快手本身的平台特質跟抖音就有很大區别,抖音是符合馬太效應的,即主要的80%流量都導向頭部的20%網紅,而網紅生産的内容是通過抖音大數據平台算法得出的。
快手則相反,緻力于構建一個公平的平台機制,如果流量太高反而會被限流,更多的鼓勵是平民生産内容,構建同城或者是你身邊跟你很相似的人的故事。這些人可能就與你我一樣是個普通人,背後沒有MCN機構、沒有巧妙構思的腳本、專業的剪輯,因此這些“平民”需要AI加持、需要一些工具來低成本地創造内容,記錄自己的生活。
從這個角度來講,快手更需要更加強大的内容創作生成技術來幫助普通人實現明星夢,或者是拍同款。
雖然AI技術不是萬能的,短視頻的核心還是内容為王、圍繞内容構建各式各樣的玩法;但是通過AI技術加持,幫助大家高效地生産内容、創造有趣的、好玩的内容,所以接下來想談談,具體有哪些AI技術是可以應用在内容類型産品中的。
一、物體/動作檢測技術這一類應該是最早應用在短視頻内容創作上的,包括很多自拍相機也有類似的功能。比如眨眼睛、吐舌頭、比各種手勢來觸發一些特效,這些是基于人臉的。同理,基于一些生活中的圖标、物體檢測來觸發一些特效。
圖2 比心特效
二、美顔、美妝、美體、美牙等人像美化功能這些其實都是基于關鍵點技術,無論是人臉的關鍵點檢測還是人體的關鍵點檢測技術,不論是5點、21點還是137、200 、1000 的點,又從2D的關鍵點到3D的關鍵點,這裡都是為了幫助機器确認人臉的五官位置以及面部輪廓來進行的比例調整,比如大眼、瘦臉、瘦腰、拉腿等等。
這些比較基礎,對于關鍵數量依賴比較少。如果想要做得更加精細,比如美妝裡面需要進行眼妝(睫毛、眼影、眼線、眼睑下至、卧蠶)等等小部位的刻畫,這就需要關鍵點數量的增加,甚至如果想要做豐額頭、高鼻梁、低顴骨、豐蘋果肌等效果,就需要一些3D mesh(從原來的點形成網狀結構)的輔助。
圖3 2D人臉關鍵點和3D關鍵點,人像美化的最基礎技術
圖4 人體關鍵點技術
又或者是如果在美體這個用戶體驗做到既可以拉腿、細腰、豐胸,同時又不讓背景畸變,就需要引入matting和inpAInting的技術了(既摳圖和補全),有些場景下也可以使用3D人體重建的技術。比如說剪映軟件裡的換背景功能也依賴于摳圖能力。
牙齒美白、口紅依賴于分割技術,比如我最近在使用剪映牙齒美白功能的時候,嘴巴前面有一個遮擋物時,就會在遮擋物上就浮現了一個白色的月牙狀不明物體,這是因為牙齒沒有像嘴巴一樣做遮擋狀态的判斷,呈現了一種俗稱“穿幫”的畫面,非常尴尬。
三、AR類(人和環境)所謂AR類的,我們統一都定義為在已有的現實空間中疊加3D渲染的CG素材,不論是疊加在人臉上的、還是疊加在環境中的。
這些底層技術一部分依賴于3D的人臉關鍵點的定位技術,另一部分依賴于對于空間的3D定位技術,如何在不同的用戶手機姿态運動下、用戶本身做各種動作的情況下,能保證疊加3D素材的絕對位置的固定(因為現實生活中的物體都是絕對靜止的、不會随着手機的運動而動來動去),這個是對于技術考驗最大的部分。
當然3D素材的精緻程度,很大程度也依賴于CG的生成效果。
圖5 google基于Android像開發者提供的ARcore能力,對标的蘋果有ARkit
同時,這類型的技術還非常适合跟廣告主結合,廣告主通過某個主題的風格或者元素,平台推出、大V優先使用引發網友參與最後形成二次傳播,使得品牌的産品及形象在網友中引發廣大的讨論。
比如在ins上,Gucci、LV、Dior就訂制了很多富含自己品牌元素的AR貼紙套裝供用戶使用,用戶在拍照錄視頻玩的同時,也可以體驗産品虛拟試穿、試戴的效果,進一步促進購買轉化。
圖6 ins上的gucci lens(特效)
四、生成類網絡(GAN)随着螞蟻呀嘿的一夜爆火,zao等AI換臉引發社會廣泛倫理道德的讨論,社會對于GAN生成類的特效一直有很高的熱度,比如說“變三歲”、當你老了、迪士尼風、國漫風、手繪小姐姐等等。
由于GAN本身網絡的特性就十分适合短視頻這類、以内容生産作為主要驅動力的産品定位,通過使網絡學習大量的目标圖片的風格,AI技術結合一些短視頻類的模闆就可以非常快速地幫助用戶生成非常搞笑的、可愛的、炫酷的短視頻内容,也非常适合結合短視頻平台的各種節日運營活動展開,比如萬聖節生成鬼怪妝容、兒童節生成兒童臉,520/情人節“變男友”等等。
圖7 快手平台520活動變男友,應用的就是GAN網絡生成有夫妻相的男友
雖然在任何時代,内容為王此話不假,但是在所有UGC的平台都已經被AI深度滲透、成為不可或缺的一部分的時候,你的産品沒有反而無法留住用戶。此時的AI技術在Kano模型當中已經從一個魅力需求變成了一個基礎需求。
據内部消息,小紅書已經大規模高薪聘請CV算法工程師來幫助提升其平台内容的AI多樣性,你認為這必要麼?
作者:大仙河,7年AI産品相關經驗;微信号 :大仙河知識學堂
本文由@大仙河 原創發布于人人都是産品經理,未經許可,禁止轉載。
本文為人人都是産品經理《原創激勵計劃》出品。
題圖來自 Pexels,基于 CC0 協議
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!