tft每日頭條

 > 科技

 > 人臉識别看起來并不是個好主意

人臉識别看起來并不是個好主意

科技 更新时间:2024-07-21 11:23:36

人臉識别看起來并不是個好主意?商湯科技是OPPO新品發布會上的常客了,接下來我們就來聊聊關于人臉識别看起來并不是個好主意?以下内容大家不妨參考一二希望能幫到您!

人臉識别看起來并不是個好主意(人臉識别每天都用)1

人臉識别看起來并不是個好主意

商湯科技是OPPO新品發布會上的常客了。

這可不是說商湯科技的代表經常參加OPPO手機發布會。實際上,商湯科技常常是發布會的宣傳點之一,而且存在感極高。

這種場景最早可以追溯到2017年下半年OPPO R11發布的時候。在那場發布會上,OPPO副總裁吳強花了不少時間,公開介紹了和商湯科技的合作。随後,商湯科技也在自己的微信公衆号上發文,表示公司所提供的人臉識别技術和AI美顔已經能“給用戶帶來更便捷的體驗和驚喜”。

這是商湯科技第一次公開自己和手機廠商之間的緊密聯系。在那之後,無論是R15,還是最近發布的Find X,其人臉識别和拍照技術背後都有商湯科技的支持。換言之,數以千萬計的用戶在使用“前後2000萬”的手機鏡頭時,都在不經意中用到了商湯科技的技術。

OPPO并不是唯一一家和商湯科技有合作的手機公司。在vivo、小米、華為等手機品牌的産品之中,商湯科技的身影随處可見。從某種意義上來說,這家公司雖然隐身在幕後,但對于想在智能領域繼續突破的手機品牌來說,商湯是一個繞不開的合作對象。

事實上,商湯科技從2014年正式成立開始,就把手機業務作為規劃中的一個重點,也是四個首要的落地場景之一。“因為手機是走進千家萬戶的,是為老百姓所深入感知的;每台手機都會有越來越多的攝像頭,從2D到3D,這是圖像的重要入口,”商湯科技聯合創始人、研究院院長王曉剛告訴界面新聞記者。

商湯的技術基礎在于基于深度學習的計算機視覺技術。商湯成立後不久,就在人臉識别領域首次取得了超越人類肉眼的識别率,并參加了計算機視覺領域最著名的ImageNet大賽,在物體檢測與識别方面獲得了三項冠軍,這也讓它們的技術能力開始為外界所了解。

帶着技術,商湯科技成立了手機業務線,随後,研發團隊開始尋找将技術和手機産品結合落地的機會。

最早找上門來的手機品牌是小米和華為,但它們提出的需求并不是美顔。2015年前後,包括蘋果、谷歌在内的一些海外科技公司,已經擁有了一種類似“智能相冊”的技術,這個技術能夠識别出不同的照片中的人臉,從而進行具體分類。對應地,為了吸引更多用戶的關注,華為和小米也希望在它們的手機上實現這個功能。

對于商湯科技來說,這并不算一項太複雜的工作。很快,相關的功能就在客戶品牌的産品中落地。

這次合作,可以被看作商湯科技在手機行業中落地的開端。

商湯手中的算法和技術并不局限在“識别出照片裡有誰”,它能為手機企業提供的支持也遠遠不止這些。繼小米和華為之後,OPPO也找上門來。OPPO一直以拍照作為主打功能,怎樣讓用戶拍出更滿意的照片是他們最關心的問題,這也是他們找到商湯科技的主要原因——OPPO希望借助人工智能的力量來實現這個目标。

從深度學習技術到手機産品的落地是一個曲折的過程,這個過程需要商湯科技和手機廠商共同的打磨。“比如雙目虛化,這個産品使手機可以拍出類似專業相機的效果。商湯科技是最早将AI算法用于雙目虛化的,我們很早就擁有了世界上最準确的利用雙目攝像頭估計深度的技術,但是單一技術并不能帶來完美的用戶體驗。”王曉剛解釋稱。

他舉例稱,如果說傳統的圖像處理算法經過長時間打磨給用戶帶來的體驗是90分,商湯科技最初的産品隻能達到70分。原因在于,手機廠商對于速度、功耗、邊緣的處理,以及各種複雜場景的魯棒性都提出了極高的要求。

“但是手機廠商也看到了AI的巨大潛力,給傳統算法帶來的突破,它們願意付出耐心和商湯一起疊代,把用戶體驗做到98分甚至100分”。王曉剛說。

在這個過程中,商湯科技和手機廠商緊密合作,雙方都付出了巨大的努力,往往幾天更新一個版本。王曉剛記得很清楚,商湯科技的研發人員在客戶那裡辦公,加班加點解決問題是常态,“一次在客戶那裡一直待到淩晨,大樓突然停電,才發現從各個樓層裡出來的都是對接不同項目的商湯員工。”

最終,商湯科技基于AI的雙目虛化技術落地OPPO R11,這個技術在畫質、複雜場景的魯棒性等各個方面都超越了傳統的解決方案。

萬事開頭難,這次合作之後,商湯科技的研發團隊有了底氣,開始探索更多的技術落地。在他們自己看來,這是一次“讓手機廠商重新認識到AI力量”的機會。

在iPhone X問世之後,商湯科技的研發重點又從拍攝優化轉到了人臉識别解鎖上。

這是一個新的挑戰。此前,在互聯網金融等領域裡,商湯科技已經實現了人臉識别的落地,比如說可以識别出屏幕前的是活體還是一張照片。但這種識别往往是在相對穩定的環境中進行,手機上的人臉識别要複雜得多。

“用戶需要在各種條件下進行解鎖操作,比如躺在床上或者側卧着,原來是正面的,現在是360度的;有的時候是在陰暗的環境下,有的時候是在逆光的環境下,整個識别環境會非常複雜。”王曉剛介紹。

盡管蘋果Face ID已實現3D識别,但這項技術剛出現時,國内依托于安卓系統的手機廠商隻能做到2D層面的識别,也就是利用可見光和紅外光來感知。商湯科技及其他技術供應商的任務,就是在此前提下提高識别準确率。

手機廠商們給商湯科技設置了嚴格的測試過程,商湯也成立了專門的人臉解鎖攻擊實驗室(Attack Lab)。“幾十個人連續幾個小時來嘗試破解我們的人臉識别,要求在這個過程中不被攻破才能過關。”王曉剛回憶。在這個過程中,不僅有國内的測試人員,國外的測試人員也參與其中,目的就是為了确保商湯科技的人臉識别能夠最高限度地保證準确性。

最終,商湯的2D人臉解鎖方案被市場廣泛接受。

商湯并未止步于此。5月,商湯又實現了從2D人臉識别向3D結構光人臉識别的突破,這一創新技術搭載于最新發布的小米8透明探索版上,同時也使此款手機成為了全球首款支持3D結構光技術的安卓旗艦手機。

與iPhone X的結構光方案不同,商湯3D結構光人臉識别方案能夠創建帶有面部深度信息的人臉模型,實現更優的解鎖速度、識别精準度及安全性。

“蘋果、三星這樣的廠商是軟硬一體,可以提供整體的方案;國内的手機公司和技術提供方是分開的,這就需要兩邊更好地結合,才能和外國廠商抗衡。”王曉剛解釋。

商湯科技的做法是,在頭部廠商落地方案之後,再把相關的技術标準化,形成類似SDK的整合,然後提供給更加長尾的客戶。之後,商湯科技還會逐漸形成一個平台,來提供更加綜合性的服務。

“我們終歸堅持用自己原創的AI技術來引領潮流,尤其是手機相關技術,需要對手機有深刻的認識,再去做更深層次的引領。每完成一次合作,我們都會更了解到技術要達到什麼要求,怎樣更好的滿足客戶的需求。這是一個逐漸深入的過程。”王曉剛說。

商湯科技眼前有兩個問題,一是找到下一個技術突破口,另一個是怎麼應對未來潛在的市場競争。

對于第一個問題,王曉剛認為,3D相關的技術能力将會成為下一個競争焦點。

在最近推出的OPPO find X上,一組全隐藏式3D攝像頭被安置在了手機頂部的升降模塊之中。商湯科技在這款手機的攝像功能内完美嵌入了原創的人臉3D重建技術,用新科技幫助自拍愛好者達成美顔的目标。

王曉剛表示,以前沒有傳感器、攝像頭等硬件作支撐,相關的3D應用很難發展;但現在,随着越來越多的技術得到實現,3D有望在不久的将來成為人工智能在手機上的又一個落腳點。

他透露,今年下半年,會有更多來自商湯科技的相關技術在手機産品上落地。

至于市場競争,王曉剛認為,競争并不是商湯科技目前發展業務的重點。

“像蘋果這樣的公司,一直在引領潮流;國内的手機廠商想要抗衡,其實還是要國内的技術提供商一起提供基礎。”對于現在的商湯科技而言,作為行業之中的領頭者,還有一定的空間可以進行自我調整,用更好的心态來面對市場上的其他玩家。“我們也感激競争,有競争才會有進步。”王曉剛說。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved