Pytorch實現我們的高分辨率(例如2048x1024)照片級真實感視頻到視頻轉換的方法。
用于高分辨率(例如2048x1024)照片級真實感視頻到視頻轉換的Pytorch實現。它可以用于将語義标簽地圖轉換為照片真實視頻,合成人們從邊緣地圖說話,或從姿勢生成人體運動。視頻翻譯的核心是圖像到圖像的翻譯。我們在那個空間的一些工作可以在pix2pixHD和SPADE中找到。
vid2vid Body
2.線稿着色 - style2paints該項目旨在為線稿着色。 AI 可以根據既定的顔色樣式在草圖上繪制、或在草圖上創建繪制自己的顔色風格、亦或者将現有的風格轉換至另一種風格。
有一些值得一看的新的功能,例如色彩錨和圖像過渡。
3.一鍵将文本轉為mp3文件 - Text2Speech
語音合成助手主界面:
如果你隻是想使用這個小工具,可以直接下載windows可執行文件壓縮包。
解壓後是一個exe可執行文件,直接打開即可使用。這也是寫這個小工具的契機。
使用說明
1 點擊 合成語音 按鈕後,會自動在本地創建一個audio文件夾,轉換完成的mp3文件就在這裡,命名格式為:當前時間 文本的前10個字.mp3,例如2020-02-25_22-29-37歡迎使用百度語音合成.mp3
2 使用的是百度語音合成api,最多隻能轉換512個漢字(1024個字節)
4.Image-to-image translation in PyTorch該項目有兩個組成部分,CycleGAN 和 pix2pix 。基于 PyTorch ,它們可以實現用于未配對和成對的圖像到圖像轉換。 乍看之下,它仿佛隻是一種相當普通的風格轉移解決方案,事實上,它跟其他應用不一樣。比如它能将圖片裡普通的馬轉換為斑馬或從實景照片轉換為莫奈風格的畫作。并且它的處理速度快到足以在實時視頻上應用。
5.StarGAN in PyTorch
StarGAN 是這篇文章中提到的一個 PyTorch 應用:Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation。它可以将源圖像轉換成不同的發型、皮膚類型、年齡、性别和不同的情緒。
一個好的圖像到圖像的轉換模型應該在滿足以下特性的同時學習不同視覺域之間的映射:
1)生成圖像的多樣性
2)跨多個域的可伸縮性。
現有的方法解決了這兩個問題中的任何一個,對所有域都具有有限的多樣性或多個模型。
我們提出了StarGAN v2,這是一個可以同時解決這兩個問題并在基線上顯示出顯著改進的結果的單一框架。在CelebA HQ和一個新的動物臉數據集(AFHQ)上的實驗驗證了我們在視覺質量、多樣性和可擴展性方面的優勢。為了更好地評估圖像到圖像的轉換模型,我們發布了AFHQ,一個高質量的具有較大域間和域内變化的動物臉。代碼、預訓練模型和數據集将被發布以獲得可重複性。
StarGAN v2可以将源圖像轉換為反映給定參考圖像的樣式(例如發型和化妝)的輸出圖像。其他高質量的視頻可以看下圖示意。
6.Fast Style Transfer
使用 TensorFlow CNN 實現,這可能是圖像樣式傳輸的最佳示例之一,顧名思義,它的完成速度非常快。 該項目基于 Gatys 的藝術風格的神經算法, Johnson 對實時樣式轉換和超分辨率的感知損失以及 Ulyanov 的實例規範化的組合 。
7.FastPhotoStyle
另一個十分好用的圖片風格轉換工具,基于Python實現的 FastPhotoStyle。它提供了簡單的API來合并樣式和源圖像。 令人印象深刻的圖像樣式轉移工具。
給定内容照片和樣式照片,代碼可以将樣式照片的樣式轉換為内容照片。代碼背後的算法細節在我們的arxiv文件中有記錄。如果您的出版物中使用了此代碼庫,請引用本文。
A Closed-form Solution to Photorealistic Image StylizationYijun Li (UC Merced), Ming-Yu Liu (NVIDIA), Xueting Li (UC Merced), Ming-Hsuan Yang (NVIDIA, UC Merced), Jan Kautz (NVIDIA)
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!