4月1日,是張國榮辭世19周年的紀念日。每年的這一天,全球無數歌迷、影迷都會用自己的方式緬懷“哥哥”張國榮。今年,由騰訊雲多媒體實驗室的智能影像修複技術支持,騰訊音樂娛樂集團與環球音樂旗下廠牌寶麗金攜手,并聯合騰訊雲、微信視頻号、騰訊視頻等多個團隊聯合呈現的“張國榮2000年《熱·情》演唱會超清修複版”全球首播。
4K版修複演唱會預告片。
《熱·情》演唱會是張國榮生前的經典絕唱,由其親自擔任藝術總監,知名時尚設計師讓-保羅·高缇耶負責服裝設計。今年,得益于數字修複技術加持,這個被塵封21餘年的“時代符号”被首度解鎖。此次《熱·情》演唱會修複采用的“超清沉浸感修複引擎”基于騰訊雲多媒體實驗室多年的多媒體通信和處理研發經驗,高清修複則是利用該“引擎”的智能分析、畫質修複、畫質增強、智能編碼四大模塊,解決了因時間跨度大帶來的劃痕、噪點等問題。但演唱會整體環境較暗,細節不夠豐富,場景切換快,燈光環境複雜,顔色豐富,對算法帶來了挑戰,此次面對清晰度較為欠缺的部分,無法精确建模,需要嘗試不同的算法達到最佳修複效果等諸多技術難點,在接受新京報專訪時,騰訊雲多媒體實驗室總監李松南、騰訊雲多媒體實驗室專家研究員夏珍進行了介紹。
修舊如舊:每個人心裡都有一個标準
新京報:此次推出張國榮2000年《熱·情》演唱會的超清修複版,想法是從何時産生的?
夏珍:我們也是一個比較偶然的機會接觸到環球音樂旗下寶麗金唱片,了解到他們剛好有張國榮《熱·情》演唱會的母帶,覺得與我們的技術挺契合,就達成了合作的意向。三月初的時候,我們正式開始做這次修複工作。
新京報:在張國榮衆多的演唱會裡面,為什麼選擇《熱·情》?
李松南:因為《熱·情》是“哥哥”生前的最後一場演唱會,當時寶麗金唱片公司也是想看能不能對張國榮之前的一些演唱會或者片段做修複,因為我們實驗室之前一直做智能影像的修複,所以雙方很快就達成了合作意願。
借4月1日這個特殊的日子推出修複的版本,其實也是特别榮幸的事情。每年的這一天,大家都會用電影的片段或者其他方式去紀念他,我們這次用修複演唱會的方式去做這件事情,也會覺得特别有意義和有價值。
從對比圖能看出修複前後畫質上的差别。
新京報:此次演唱會修複版的直播,是否會涉及版權等相關問題?
李松南:這次跟寶麗金的合作是基于對張國榮先生的一種緬懷,因此這裡面不存在任何商業性的東西。另外,這次演唱會我們在很多平台進行直播,雖然這些直播的渠道以往對于明星藝人開設打賞功能,但張國榮這場直播是關閉的。
新京報:此次修複的過程花費了多長時間,哪部分修複是耗時比較久的?
夏珍:如果從算法上來講,整個智能修複在算法上時間并不算長,但是因為我們還是想把演唱會做得“修舊如舊”,保留整場演唱會的藝術效果,中間還是嘗試了不同的算法和效果,所以花了很多時間去做一個平衡。
新京報:整個修複過程中,你認為比較具有挑戰的地方是什麼?
夏珍:借助實驗室的修複引擎等技術積累,可以極大限度地還原演唱會視頻的清晰度,但對于演唱會視頻中的色彩、畫面切換較快,外加視頻素材清晰度不高等問題,如何做到“修舊如舊”,給觀衆帶來融入其中的沉浸感體驗,對于團隊來說是一個不小的挑戰。
修複版演唱會能呈現從母帶畫質(上圖)到修複後(下圖)的效果,經曆了去隔行、去除噪聲和壓縮失真、增強和超分環節。
新京報:在演唱會修複領域,修舊如舊的“舊”應該達到一種怎樣的标準?
李松南:“修舊如舊”是我們以往做老的經典影像修複時,想達到的一個目标,這個理解應該是因人而異,業内也沒有誰提出一個标準,演唱會的“修舊如舊”隻是我們想表達的一個宗旨。
首先我們團隊會有一個大概的判斷,先去了解和規劃這場演唱會在藝術上,應該怎麼去遵從當時整個舞台想要表達的氛圍,我們就盡量在算法方面往那方面調整。做完修複以後,我們也會跟老版做對比,看整個藝術的表達與整體的感官是否能達到當時“舊”的感覺,因為确實每個人對于“舊”都會有自己的看法。
技術亮點:分辨率提升6倍,場景降噪
新京報:這次提到“數據”相比電影和電視劇較少,這個數據具體指什麼,為什麼說它比較少?
夏珍:我們講的“數據”,如此前做《天下人家》《康熙王朝》這類電視劇的修複,相對而言影視劇的場景比較固定,鏡頭的運動以及整個畫面比較穩定,從頭到尾的藝術表達形式、整體的色彩風格都是類似的。但演唱會不一樣,演唱會裡面的燈光與畫面鏡頭會有特别多的切換,在之前的修複裡很少遇到這樣複雜的場景,我們說數據比較少,通常指的是我們之前比較少遇到的場景。
演唱會現場的燈光變幻,給修複帶來了挑戰。
新京報:這次修複,在畫質上會有多大的提升,比如修複前後的分辨率是多少,修複之後有沒有看到一些之前沒有看到的細節?
李松南:從整體畫面的主觀感受上來看,修複後會比以前的畫面更清晰、更真實。比如,我們能看到張國榮臉部的清晰度是非常高的,包括他臉部的輪廓、毛孔、胡子都會比老版要清晰很多。之前版權公司給的母帶分辨率非常低,大概隻有720×480的分辨率,現在做完修複以後接近4K的分辨率,分辨率大概提升了6倍,整個畫面的流暢度也有所提升,在幀率上面我們也做了一些優化。
夏珍:我們做人臉修複的時候,有一個很大的人臉,剛好整場演唱會的燈光設計也是紅色,當光打到張國榮臉上的時候,他整個臉的顔色就跟我們正常臉的顔色不一樣,導緻人臉的模型以及修複的結果會出現不太好的效果,那麼我們就會專門針對這些問題去做優化。
新京報:從觀衆的角度看,高清修複更為關注人臉修複,這次修複如何達到最佳效果?
李松南:現在業界基本上很難找到基于視頻的人臉修複,大部分的人臉修複隻是基于圖片或者單張照片,如果要用到視頻上會遇到更多複雜的問題。比如臉的角度不一樣,如果是側臉或者很小的臉以及很大的臉,各種角度和姿态的臉都需要在算法處理裡面能夠解決這些問題。
這次演唱會修複有一個難點,就是演唱會有很多燈光,燈光的顔色會多變,比如整個顔色有紅色、藍色、綠色等,打在人臉上後,我們目前的算法會有一些處理不了的問題,也是給我們後面的工作或者優化提供了很多寶貴的經驗。
新京報:修複對哪些具體場景進行了構建?
李松南:比如人臉,我們會針對有些場景對人臉去做修複,很大的場景我們會用GAN(生成對抗網絡)技術,因為之前的母帶裡面有很多大的場景,鏡頭拉到遠景的時候會變得很模糊,通過GAN技術以後,場景的清晰度與紋理都會特别清晰。除此之外,我們在不同的場景也會用一些不同的算法,比如,整個演唱會的場景有很大的噪聲,我們也是對這個場景進行了降噪處理。
新京報:與傳統人工修複相比,此次的技術有哪些優勢?
李松南:整個演唱會有兩個小時,相比之前傳統的人工修複可能需要一、兩個月的時間,如果從算法角度來講,我們的算法處理就比較快。首先,利用多種智能評估算法的智能分析模塊會對視頻内容進行全方位、多維度分析,主要是為了評估視頻的運動和紋理複雜度、壓縮失真程度等。得到不同維度的分析結果後,畫質修複模塊就能利用多種智能算法,有的放矢地修複各類破壞畫質的主要因素,包括但不限于劃痕、豎線、雪花點、噪聲、壓縮失真、抖動等問題。這其中的算法基本都是騰訊自研,譬如劃痕算法,實話說在公開服務中還沒遇到過。
夏珍:劃痕與雪花點的面積和數量與觀看體驗成反比關系。面積越大體驗越差,反之亦然。與此同時,劃痕修複也存在諸多難點。一方面劃痕修複不可逆且成本高昂;另一方面目前缺少龐大的劃痕公開數據庫,算法難以調優,建設成本也非常昂貴。為此,實驗室專門設計了針對性的多方向數據增廣方案。方案包括劃痕的裁切及合并、随機尺寸、随機模糊程度、局部及全局随機亮度調整、随機透明度調整等。
緊接着,畫質增強模塊便會選擇最佳視頻增強算法,對畫面進行多維度畫質提升,在空間和時間上提升視頻的分辨率和幀率,在空域上提升細節清晰度、色彩豐富度。需要更好地駕馭和平衡CNN(卷積神經網絡)和GAN(生成對抗網絡)兩種智能算法。
修複前後異同的視頻對比。
新京報:為了營造直播演唱會“面對面”的效果,技術上還做了哪些嘗試與努力?
夏珍:實驗室團隊還對張國榮演唱會的眼神細節做了特别算法調優。從修複後視頻中截取一幀張國榮在舞台中央的靜态畫面,放大後仿佛可以透過其眼眸看到舞台折射的影像輪廓。
新京報:這個技術未來是否會更加接近大衆?
夏珍:“超清沉浸感修複引擎”主要分為智能分析、畫質修複、畫質增強、智能編碼四個部分,其中畫質修複就是針對這種老視頻去做修複,主要是去除其中的一些失幀。畫質增強是希望在現有的視頻基礎上再進一步提高它的質量,包括提高分辨率、幀率、動态範圍,甚至是往沉浸式的方向去發展,做一些維度轉換的工作。我倒不覺得現在修複這邊的應用前景非常小,因為我們之前接觸到的很多業務,不管是傳媒、泛娛樂還是影視行業,确實積累了大量老的素材,尤其是電視台這塊,還是有挺大的市場。
新京報:除了這些專業技術外,觀衆在感官上需要注重哪些方面的體驗?
李松南:感官确實是因人而異的,因為在整個演唱會的過程中,我們不會有修複前和修複後的對比,如果要讓觀衆能感覺一個很好的效果,感覺這是一場很棒的演唱會,那麼整個演唱會的一些細節比如“哥哥”的狀态,能讓大家感覺到已經跟現在的演唱會比較接近,那就算達到預期了。
因為當年的母帶質量比較差,從我們的角度講,能明顯感受到修複後包括“哥哥”臉部的一些細節,他的眼睛、眼神,還有整個演唱會當中他所戴的假長發的發絲,清晰度會比以前要好很多。我們希望大家在觀看這次演唱會的過程中,能通過當下的技術,很清晰地回望當年“哥哥”那場演唱會的全過程。
新京報資深記者 劉臻
資深編輯 田偲妮 校對 劉軍
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!