gan風格遷移原理-tft每日頭條

gan風格遷移原理

科技更新时间:2025-07-18 14:58:48

gan風格遷移原理?無需會議室和出差，打開手機，登錄APP，就可以和千裡之外的人“面對面”開會疫情下，這種場景已經成為很多打工人工作的常态，今天小編就來說說關于gan風格遷移原理?下面更多詳細答案一起來看看吧!

gan風格遷移原理

無需會議室和出差，打開手機，登錄APP，就可以和千裡之外的人“面對面”開會。疫情下，這種場景已經成為很多打工人工作的常态。

作為一種實時的網絡應用，視頻會議對網絡的要求比較高。當下視頻會議過程中，因網絡信号問題，常會導緻與會者頻頻掉線、屏幕共享畫面不清晰，影響開會的效率。此外，成像角度不佳、客觀原因造成個人形象不佳等問題，也将影響與會者的開會體驗。如何在低網絡帶寬下，進行流暢、清晰的視頻會議，成為困擾衆多視頻會議開發者的難題。

此前，開發者大多通過調整圖像分辨率、碼流、幀數等方式實現視頻數據壓縮，解決低網絡帶寬下視頻會議問題。雖然這類方法可以緩解視頻會議卡頓問題，但會導緻視頻圖像模糊、不連貫。

而以深度學習為代表的卷積神經網絡具有更深的學習層次，能夠有效的去除掉冗餘數據特征，獲得更高的壓縮比，開發者們傾向于使用神經網絡來替代以前的方法。同時，由于帶寬一般很難增加，而增強算力相對容易，所以開發者們也更希望将帶寬問題轉化為計算問題。

基于此，NVIDIA 研究團隊從AI維度出發，開發了一個用于視頻會議軟件 NVIDIA Maxine SDK的深度學習模型Vid2Vid Cameo，隻需一張照片或卡通頭像，就能合成逼真的3D人臉說話視頻。

一、視頻會議Maxine SDK背後的AI生成模型

受疫情影響，遠程協作和辦公已逐漸成為不可逆轉的趨勢，這使得各種視頻會議APP下載量激增，成為打工人的标配。

為了增強用戶的視頻會議使用體驗，NVIDIA推出了一套基于雲的、GPU加速的 AI 視頻會議軟件Maxine。NVIDIA Maxine 包括三個 AI SDK：視頻特效 SDK 、音頻特效 SDK 和 AR SDK ，每個SDK裡面都配有預訓練好的深度學習模型，使開發者可以快速構建或增強其實時應用程序。

Vid2Vid Cameo 是基于 NVIDIA Maxine SDK 專為視頻會議打造的深度學習模型之一。它使用生成式對抗網絡(Generative Adversarial Networks，GAN)，在一個人的真實照片或卡通頭像上合成動态的3D說話視頻。

二、僅需一張照片合成逼真的3D人臉說話視頻

NVIDIA Vid2Vid Cameo隻需兩個元素：一張參考照片和一個指導圖像應該如何動的視頻流。其中，把上傳的清晰照片作為源圖像，從中獲取外貌特征；然後把視頻中一幀幀畫面作為重構視頻的依據，從中提取出面部表情和頭部姿勢等信息。通過這些信息，模型可以将參會者的面部動作映射到靜止的照片上，進而合成視頻會議上的逼真人臉說話視頻。

同時，該模型基于NVIDIA DGX系統開發，并使用包含18萬個高質量人臉說話視頻的數據集進行訓練。這讓該網絡學會了識别20個人臉關鍵點，而這些關鍵點可以在沒有人工标注的情況下用來模拟面部運動，借此修正使用者在會議中低頭、看兩旁，而未專注于鏡頭方向的情況，讓使用者在會議中看起來更有參與感。

在 NVIDIA Vid2Vid Cameo 提供的交互式體驗Demo中，可以在Pitch俯仰角（向下/向上）、Yaw偏航角（左/右）、Roll翻滾角（順時針/逆時針）三個方向上任意旋轉，每個方向上最多旋轉30度。甚至眼球也可以上下左右的旋轉，每個方向上最多旋轉20度。

現在點擊【AI Demo | NVIDIA 研究團隊】試用NVIDIA Vid2Vid Cameo交互式Demo。

此外，NVIDIA Vid2Vid Cameo還可利用 AI 從專業攝像頭或智能手機拍攝的标準 2D 視頻中捕捉面部動作和表情，協助動畫師、照片編輯師和遊戲開發者輕松制作臉部動畫。

三、視頻會議的網絡帶寬成本最高可降低90%

NVIDIA Vid2Vid Cameo能夠辨識臉部的20個關鍵點，而這些關鍵點可以針對包括眼睛、嘴巴和鼻子在内的位置進行編碼。接着模型會從通話者的參考圖片中撷取這些關鍵點，并将這些關鍵點可以提前發送給其他的視頻會議參與者。

如此一來，視頻會議平台隻需發送參會者臉部關鍵點的移動情況數據，而不用在每一個與會者之間發送龐大的直播視頻流。而對接收者來說，GAN 模型在接收端使用這些信息合成一個模仿參考圖片外觀的視頻内容。

由于關鍵點的分布十分稀疏，比全像素圖像的數據量小得多，因此發送的數據要少得多。而Vid2Vid Cameo通過來回壓縮及發送頭部位置和關鍵點，而不是完整的視頻流，可以讓視頻會議的網絡帶寬成本最高可降低90%，從而提供更流暢的用戶體驗。同時，該模型可以進行調整，傳輸不同數量的關鍵點，以實現在不影響視覺質量的條件下，适應不同的帶寬環境。

四、視頻會議和直播軟件開發團隊的新Pick

作為 NVIDIA 研究團隊的重要成果之一， Vid2Vid Cameo 将網絡瓶頸問題轉化為計算任務，從而借助本地或雲端資源更輕松地解決此類問題。Vid2Vid Cameo 也可用于直播軟件，制作表演者說話、唱歌或移動頭部的視頻片段。此外，它還可減少了對高網絡帶寬的依賴，這不僅為提供商削減了成本，也為最終用戶提供了更流暢的視頻會議體驗，成為視頻會議和直播開發團隊解決因網絡所造成畫面卡頓及模糊問題的新選擇。

Vid2Vid Cameo 很快将在NVIDIA Video Codec SDK中作為AI Face Codec推出。SDK 支持免費下載，還可與 NVIDIA Jarvis 平台搭配用于對話式 AI 應用，包括轉錄和翻譯；也可與3D 人體姿态估計工具協作，像Notch 和 Pixotope 等公司，創作者們使用 NVIDIA Vid2Vid Cameo 和 3D 人體姿态估計工具，将自己的動作傳輸到虛拟角色，從而快速制作數字角色上的特定動作。

之後，我們還将陸續介紹 NVIDIA 研究團隊推出的計算機視覺、深度學習模型以及有意思的交互式Demo，如NVIDIA GauGAN360，可将粗略的草圖變成可用于3D場景的360度環境。

體驗更多人工智能和深度學習互動Demo，點擊【AI Demo | NVIDIA 研究團隊NVIDIA HomeMenuMenuCloseCloseCloseCaret down iconCaret down iconCaret up iconCaret right iconCaret right iconCaret right iconCaret left iconCaret left iconCaret left iconShopping CartSearch iconNVIDIA 引領人工智能計算NVIDIAFacebookTwitterLinkedInYouTubeNVIDIA】立即體驗“NVIDIA AI 互動 Demo”。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技球球大作戰電腦版和手機版
球球大作戰電腦版怎麼操作？球球大作戰是一款休閑手遊，受到很多玩家特别是年輕玩家的喜愛，是休息期間放松娛樂一款不錯得小遊戲。今天來教一下大家怎麼在電腦上玩這款手遊。1、百度搜索“tcgames”到官網下載安裝最新版電腦端軟件到電腦上。2、打開... 2022-11-26
科技華為新系統和蘋果系統對比
華為新系統和蘋果系統對比?[閩南網]華為消費者業務CEO餘承東透露，華為面向下一代技術而設計的操作系統OS最快在今年秋天、最晚于明年春天将可能面市那麼華為自研的系統與市面上其他的系統有什麼不同呢?下面來和小編一起看看吧，我來為大家講解一下關... 2023-01-15
科技飛利浦剃須刀7系列哪款最好
導語：“胡子”作為男人最獨特的标志為什麼還需要經常清理呢？随着時代的發展“陽光幹淨整潔”已經成為當下最流行的男人形象表現，而古代那種“美髯公式”的時尚也早已一去不複返，僅有極少一部分人留着“長胡子”或者“絡腮胡”，這也算是傳統美的繼續發揚吧... 2022-10-24
科技一鍵重裝電腦系統到手機
最近有網友問老友一鍵重裝大師，小編關于自動一鍵裝系統的教程步驟?其實現在網上的自動一鍵裝系統的方法有很多，但是有不少的網友怕網上的教程不安全，教程内容不完整，那自動一鍵裝機的教程有哪些呢?下面就讓老友一鍵重裝大師小編給大家介紹關于自動一鍵裝... 2022-11-25
科技白天手機也開啟夜間護眼模式
自從DC調光開始大熱以來，似乎每個人都對自己的眼部健康十分看重。但其實手機當中還有一項功能也能有效緩解眼部疲勞，這就是“護眼模式”。“護眼模式”的主要工作原理是降低了屏幕的藍光比例，畢竟藍光對于眼睛有較大的刺激，開啟護眼模式後晚上玩手機确實... 2023-02-08
科技怎樣從手機交養老保險
步驟如下：⤷打開支付寶→點(轉賬)→出現(轉到銀行卡)字樣→接着點進去就看到可以填寫銀行卡内容(輸入自己交養老保險存折上的賬号)就完成了。是不是很簡單，一學就會，方便快捷！, 2023-01-13
科技消化系統是什麼意思
消化系統是什麼意思?消化系統(digestivesystem)由消化管和消化腺兩大部分組成消化管：包括口腔、咽、食管、胃、小腸（十二指腸、空腸、回腸）和大腸（盲腸、闌尾、結腸、直腸、肛管）等部，今天小編就來說說關于消化系統是什麼意思?下面更... 2022-06-24
科技八位半标準數字多用表
八位半标準數字多用表?高精度和多功能的完美結合，接下來我們就來聊聊關于八位半标準數字多用表?以下内容大家不妨參考一二希望能幫到您!八位半标準數字多用表高精度和多功能的完美結合Fluke8846A六位半精密數字多用表的精密性和多功能可以應對極... 2022-10-18
科技最适合年輕人的三款手機
比起性能黨，熱愛煲劇和各種綜藝的朋友選手機才是最難的。畢竟如今性能高的手機一抓一大把，但公認好音質手機的“影音手機”是真的不多。好在近幾年，各大手機廠商紛紛推出超級影音手機。今天咱們就來盤點，今年推出的這3款雙喇叭手機，每一款都是公認好音質... 2022-12-01
科技
老年人學手機（005）如何設置應用權限請看演示視頻，然後再詳細看文字内容：一、科普一下名詞我們常聽年輕人說“APP”，不懂他們指的是什麼，因而發懵，其實，會說“APP”這個詞也不代表很高端的樣子。App是application的縮寫，通常專... 2022-10-24
科技 256gb内存長續航手機
對于安卓手機而言，内存對體驗的影響很重要，大内存意味着可以在後天運行更多的APP，同時伴随着長時間的使用，APP和遊戲體積勢必會越來越大，小内存手機會漸漸出現卡頓，而大内存手機依然流暢。結合以上需求，向你推薦5款“12G256G”大容量手機... 2023-01-25
科技手機号碼如何解綁其他軟件
手機号碼如何解綁其他軟件?一般情況下，運營商會在過一段時間後，将注銷的手機号重新投入市場如果下個人用了這個手機号，則可能通過手機驗證碼的方式登錄相關賬号，造成财産損失提示：如果手機号不用了，除及時注銷外，還要把相關軟件解除綁定，銀行卡預留手... 2022-11-15
科技如何清理手機流氓軟件彈窗
關不掉的彈窗廣告，莫名增加的流氓軟件，虛假惡意的網絡鍊接……讓智能手機的體驗大打折扣，對于父母來說，更是成為了他們使用手機的障礙。所以今天這篇文章就給大家分享如何避開彈窗廣告和流氓軟件。一、真實經曆和感受手機廣告彈窗很多年輕人可能沒遇到過，... 2022-11-15
科技 Lenovo手機忘記密碼要怎麼辦
Lenovo手機忘記密碼要怎麼辦?Lenovo手機忘記密碼可以進入聯想手機的recovery模式，清除數據恢複出廠設置此方法會是手機恢複至出廠狀态，手機上的個人數據、資料、通訊錄、應用均會丢失，如果SD卡上有重要資料也請在操作前将SD卡移除... 2022-06-01
科技華為mate50搭載骁龍8還是骁龍8...
去年7月，華為推出了旗下全新一代的P50系列旗艦。但與以往的新機發布時間相比，這一發布周期已經晚上了不少。而在下半年的剩餘時間裡，華為也并未帶來慣例的Mate系列新機叠代。随着時間的推進，上個月曾有爆料稱，全新華為Mate50系列會在今年正... 2023-01-14
科技 windows10如何關閉中心圖标
據neowin報道，即将到來的微軟Windows1122H2将允許用戶禁用任務欄通知區域所有應用圖标。據悉，Windows1122H2是微軟最新操作系統即将推出的功能更新。早在去年Windows11系統發布時，微軟就曾預告“将會采取一年一次... 2023-01-20
科技 git合并分支後如何撤銷
git合并分支後如何撤銷?1.在日常開發過程中經常會遇到多環境，但是環境文件不同的情況，導緻每次切換Git環境時候非常麻煩，可能會提交上來不需要提交的文件，一個文件來回提交修改，下面我們就來聊聊關于git合并分支後如何撤銷?接下來我們就一起... 2023-01-10
科技十大高顔值旗艦手機
十大高顔值旗艦手機?，今天小編就來聊一聊關于十大高顔值旗艦手機?接下來我們就一起去研究一下吧!十大高顔值旗艦手機, 2022-11-02
科技如何在手機上面玩絕地求生
如何在手機上面玩絕地求生?在手機上找到手機自帶的應用商店軟件，點擊進入搜索絕地求生，安裝多用戶裝的那個軟件，顯示打開兩字，就是下載好了，點擊打開進入看截圖箭頭标識，今天小編就來聊一聊關于如何在手機上面玩絕地求生?接下來我們就一起去研究一下吧... 2022-06-10
科技 dnf光劍幻化推薦
暗淡的瑩光劍炎日鹵素光劍藍星爍芒劍極光劍光之翼刃騎兵光劍列特的疾影劍碧影凝光劍卡露亞的教導—匿迹玄磁光劍蛇眼極光劍邪芒奪目劍寒光劍聖愈光劍天行者不屈之志寒光劍朱諾星劍光炎劍—烈日裁決雙龍魔影劍——黑光天脊乾坤劍無軒之散魄泰拉石光劍聚光劍—破... 2022-11-07
科技蘋果13有語音錄音功能嗎
隻需幾步，為蘋果手機“添加”錄音，ios13有望支持錄音功能各位有沒有在使用蘋果手機，或者曾經用過蘋果手機呢？相信大家選擇蘋果手機的理由多種多樣，有人喜歡ios系統的超高流暢度，有人喜歡蘋果手機簡潔卻不廉價的外形設計，也有人是因為信任蘋果公... 2022-11-13
科技手機的主要分類
手機的主要分類?#擡頭有星空夜色更精彩#手機新定義，，我來為大家科普一下關于手機的主要分類?以下内容希望對你有幫助!手機的主要分類#擡頭有星空夜色更精彩#手機新定義，光（體。計算機，（處理器，芯片（矽片（晶體管（集成電路，手機。手子，眼珠子... 2023-02-25
科技用手機錄制伴奏
, 2023-01-09
科技怎麼用優啟通pe安裝系統
優盤PE啟動工具-優啟通PE使用體會分享大家都知道現在電腦系統安裝完後，經常會自動安裝上一些亂七八糟的軟件，浏覽器主頁也被逛鎖定了，還時不時彈出一些好煩人的彈窗廣告，其實，這些問題的出現很大一部分和使用的PE工具有關。今天介紹一款自己在用的... 2023-02-14
科技通俗地說什麼叫内卷
通俗地說什麼叫内卷?“内卷”，第一次聽到這個詞，還是去年看《奇葩說》的時候在海選階段，有一個女孩，好像是一個縣級狀元，在說内卷的話題聽她講半天，我也沒完全理解這個詞的含義，當時隻感覺是惡性競争的意思我猜幾個導師也沒聽明白，因為她說完就被淘汰... 2022-12-03
科技易店管家有什麼效果
寵店管家、寵老闆、銀豹都是市面上比較出名的寵物店收銀管理系統，但是很多寵物店老闆可能不太了解這三者之間的區别，在選擇收銀系統的時候，也是很難抉擇。今天，就給大家簡單對比一下寵店管家、寵老闆、銀豹三家寵物店收銀管理系統各自的優缺點，希望對大家... 2023-03-30
科技汽車有不充氣輪胎嗎
業餘車新聞，專業逗比範兒。話題無下限，節操是路人昨夜，一場小雪的光臨使京城銀裝素裹，分外清新。看到2016的第一場雪景，吃瓜群衆的心情是這樣的：而早上開車出門的車友們心情是這樣的：盡管雪天讓人心情愉悅，但對駕駛員來說，濕滑的路面時刻提醒自己... 2023-03-23
科技為啥我的微軟商店打不開
有的用戶收到新電腦開機發現微軟應用商店一直轉圈圈，如下圖情況：解決方法：1.檢查代理設置,在IE的Internet選項->連接->局域網設置。如果配置了代理，建議清除代理設置，使用自動檢測設置查看下。如果上述方法不行，那您再次打開浏覽器，點... 2023-01-14
科技微信閃退會怎麼樣
微信出現“閃退”？那麼，你的手機有可能在你不知道的情況下安裝了root軟件，成為“肉雞”給一些公衆号增粉、點贊、刷閱讀量。日前，邳州市公安局破獲一起非法控制計算機信息系統案，有94萬部手機成為“肉雞”，嫌疑人通過“肉雞”刷粉獲利100餘萬元... 2022-12-18
科技 20款寶沃bx5新車8萬值不值
寶沃品牌去年憑借BX7這款複興之作回到我們公衆眼前，并且BX7獲得了月均銷售5000輛的成績。如今借着國内SUV市場的大熱，寶沃品牌推出了其第二款SUV産品BX5，以14.98-21.68萬元的價格進入市場，并保持了寶沃一貫的服務品質。關于... 2022-12-10

tft每日頭條

> 科技

> gan風格遷移原理

gan風格遷移原理

gan風格遷移原理

相关科技资讯推荐

热门科技资讯推荐

网友关注