tft每日頭條

 > 生活

 > 隐私計算技術

隐私計算技術

生活 更新时间:2024-12-22 21:58:16

機器之心報道

機器之心編輯部

9 月 2 日,“WAIC2022· 金融科技與數據要素論壇”如期舉行,論壇由世界人工智能大會組委會辦公室指導,華東師範大學長三角金融科技研究院、上海市人工智能行業協會、機器之心主辦。上海市經信委人工智能發展處副處長孫躍出席會議并緻辭。在論壇的圓桌讨論環節,嘉賓們普遍表示,目前隐私計算的整個發展形勢非常蓬勃向上,但對于可用性來說,稍微有些不及預期。我們需要提高可用性,在解決這一挑戰過程中,有幾個特别值得我們關注和傾注全力的問題。

繼去年在世界人工智能大會上大放異彩後,隐私計算再度成為今年世界人工智能大會的關鍵熱詞。

所謂隐私計算,是一套包含人工智能、密碼學、數據科學等衆多領域的跨學科技術體系。它能夠在數據不可見的前提下,對生産要素進行加工、分析、挖掘、建模和驗證等,實現“可用不可見”。在 2021、2022 連續兩年的未來科技趨勢報告中,隐私計算都被列為未來一個重大的科技發展方向。

金融領域之所以成為隐私計算落地最為肥沃、也最為活躍的領域,主要原因在于随着這幾年數據法規的陸續出台逐漸淘汰掉過往野蠻無序的數據交換使用方式,隐私計算憑借得數據 “可用不可見” 的技術特性,确實解決了極度渴望數據的銀行業務痛點。

以此次論壇上大家普遍提及的普惠金融為例。銀行手裡的小微企業數據非常有限,很難有效評估被受信方資質的情況,這給小微貸款帶來很大阻礙。隐私計算可以幫助銀行在合規前提下,獲得更多數據,比如,運營商掌握的用戶軌迹信息,電商手裡的消費信息。這樣做聯合建模和數據分析,銀行對被受信方的受信額度和評價就能更加完整。

這兩年,隐私計算技術在各金融機構、科技公司的推動下,在金融行業快速應用落地。除了落地客戶營銷、風險控制等領域。另一方面,作為社會經濟活動的基礎,金融機構也肩負着社會責任與使命,例如,監管、普惠金融等也成為金融數字化轉型的重要落點。

不過,技術快速發展的同時,安全合規監管、數據、标準、人才、技術等制約因素也日益凸顯。9 月 2 日,在 “WAIC2022· 金融科技與數據要素論壇” 活動的圓桌讨論環節,主持人和嘉賓以《隐私計算在金融産業的應用與挑戰》為題就此展開了深入對話。

嘉賓們坦言規模落地的挑戰之一在于互聯互通的标準。既然我們将隐私計算視為一種基礎設施,就要有統一标準,大家都講同一套語言才能互聯互通。隐私計算和傳統技術最大的差别在于,它涉及多方參與,涉及多方數據評定。沒有标準,合作方就會擔心對方是否留有後門等問題。

再比如,就像 ISO 質量認證體系一樣,希望有權威機構解決平台資質認定問題。現實中,讓使用方去判斷平台技術本身是不是符合安全要求,成本非常高。他們希望有權威機構可以進行相應認證或者對現有隐私計算平台進行評級認定。

還有數據确權問題。流通過程當中數據如何确權?參與各方如何分享價值和收益?這些設計也是技術蓬勃發展的關鍵因素。

以下是本次論壇圓桌對話環節的實錄,機器之心做了不變更原意的編輯。

隐私計算技術(為什麼當下隐私計算可用性不及預期)1

從左到右分别為:主持人錢衛甯、郭林海、陸培爾、王灣灣

主持人錢衛甯(華東師範大學數據學院院長):與傳統所使用的數據管理技術、數據分析技術、數據挖掘技術相比,隐私計算在當前金融行業裡最亮點、最成功的應用是什麼?

郭林海(上海浦東發展銀行股份有限公司信息科技部創新實驗室人工智能團隊負責人):在數據成為生産要素後,隐私計算為什麼在金融行業特别重要?大家知道,金融行業是強監管行業,不管是對于數據的安全、數據存放、數據流通、數據使用都是非常嚴格的。我們希望把金融服務融入到各種場景生态中就要面臨數據怎麼區分和引進來的問題。

我認為,不能說哪項技術特别成功,現在來看,大家都講了隐私計算最關鍵的是多項技術的融合。每項技術都有自己的特點,比如 MPC(多方安全計算)強調的是數學可證明,安全性最高;聯邦學習起步于分布式計算,在效率上比 MPC 高;TEE(可信執行環境)借助硬件的方式提供安全防護,通用性最強。在金融強監管的條件下,要實現計算可追蹤還面臨一個監管因素,所以,我們常常把這幾個技術和區塊鍊技術做融合,充分發揮區塊鍊信息難于篡改、穿透監管的能力。金融行業面對隐私計算以及數據要素流通環節,需要多種技術融合,并沒有說哪些技術特别強。

第二,現在最主要的應用場景還是營銷和風控。金融本身就有經營風險,存在很多信息不對稱。風控、營銷都需要大量外部數據。我們具備客戶完整的交易數據,但還需要了解客戶其他的一些行為數據,包括消費習慣(當然是在客戶授權的情況下)等,才能針對客戶畫像做精準營銷。風控領域也是的如此,對一個人了解越多就能越好地進行定位。

隐私計算技術(為什麼當下隐私計算可用性不及預期)2

主持人錢衛甯,華東師範大學數據學院院長

隐私計算技術(為什麼當下隐私計算可用性不及預期)3

郭林海,上海浦東發展銀行股份有限公司信息科技部創新實驗室人工智能團隊負責人

陸培爾(中國銀行上海市分行信息科技部高級技術經理、雲原生轉型實驗室負責人 ):隐私計算是這兩年大熱的技術,從 2021 年一直到現在,我們也一直關注它,為什麼這麼熱?今年人工智能大會的主題是元宇宙和隐私計算,隐私計算為什麼這麼火爆?它确實解決了金融行業的痛點,我們金融行業對數據極度渴望。

我們能獲取的數據基本上都獲取到了,然後進入了瓶頸期,我們希望獲取更多數據,希望從泛金融領域,希望獲取其他機構客戶交易金融數據以及場景化非金融數據,考慮到現在的強監管、個人信息保護、隐私保護政策,這其實比較困難。隐私計算從技術角度有助于解決這個問題。

從技術發展趨勢來講,我們認為,它已經是屬于基本可用的技術,能夠給我們實際業務場景落地帶來實際收益的技術?所以,現在包括銀行、外部第三方的創業公司以及數據消費方、數據提供方大家都在這個賽道,它解決了大家的痛點——如何保護數據隐私的前提下做聯合建模和數據分析。如果沒有聯邦學習技術、區塊鍊、多方安全計算等技術,我們是做不到的。

就應用場景而言,從金融行業來講,有非常多的場景可以和隐私計算聯合起來。比如,數據要素的流通過程當中,我們可以去獲取運營商的數據,包括銀聯的大數據以及監管的數據,保證隐私安全的前提下都可以獲取這些數據。再比如泛金融、多方借貸、反洗錢、反欺詐包括黑名單共享,都是非常關心的問題,這都是隐私計算的場景。

我也簡單分享一下我們中國銀行在隐私計算方面的探索。第一,中小企業融資場景。響應政府号召,也是為了貫徹我們行的普惠金融戰略,需要解決中小企業融資難、融資貴的問題。我們前期推出了不少普惠金融信貸産品,近期也和上海市政府機構合作,依托政府綜合信用貸款平台來進行數據共享,這裡面會用到自己行内的數據,也可以用到政府公共信息數據,基于這些信息數據共享和建模,為中小企業設計風險管理。

第二,監管層面非常關注的電信詐騙問題。大數據時代,不法分子很容易利用洩露的信息進行短信、郵件的詐騙活動。我們聯合人民銀行、公安做了點對點對接,也取得了效果。不過,由于個人信息保護限制,沒有辦法做到平台級别的互聯互通,所以,我們很難去做多方聯合反詐,效果也相對有限。現在基于隐私計算平台技術,我們也進行了一些探索,比如和運營商、公安數據進行對接,利用多方安全計算和聯邦學習提升反電詐模型精準度。

第三,關于智能營銷這一塊,對于營銷來講,要分析客戶行為,拿到的數據越多越好。長期來看,這些數據都是在廣告平台,它可能會拿到客戶在平台上的點擊、展現、到達訪問的數據,我們銀行有些客戶後端轉化數據,由于隐私信息保護限制,我們也擔心在數據傳輸當中會有些洩露,所以,傳統上雙方不太傾向于數據分享。現在,有聯邦學習、多方安全計算等技術,可以做聯合建模,提升整個智能營銷的精準度。

隐私計算技術(為什麼當下隐私計算可用性不及預期)4

陸培爾,中國銀行上海市分行信息科技部高級技術經理、雲原生轉型實驗室負責人

主持人:陸總再次介紹了非常豐富的金融場景,通過一系列隐私計算技術的融合,可以有很多更大的想象空間,真正服務實體金融,降低每個人的風險。王女士來自于科技企業,你如何看待技術在金融場景的應用?

王灣灣(洞見科技數據科學家):人工智能、區塊鍊、大數據等技術在金融領域應用也給金融帶來一些優勢,比如,風險管理智能化、整個業務流程自動化水平都有很大提升。但隐私計算為什麼這一兩年受到這麼多的關注呢?一個是政策層面鼓勵數據流通,但法規又做了制度上的約束,我們隻能利用技術手段進行突破,發揮隐私計算在整個數據流通中的價值。整個隐私計算本身能發展得好,也代表說從技術層面它真的有用。

在隐私計算應用過程當中,我們有一次在實際應用真去對比了傳統模式和現在模式,看看當中有什麼樣的提升。以前,我們做模型,比如說三方去一起做模型,是為了數據安全和我們的效果,一般采用先建立子模型,然後通過子模型融合的方式構建模型。如果用隐私計算去用這三方數據一起做的建模,結果發現它的效果比原來傳統方式子模型 總模型的方式有所提升。這說明,這個技術對于我們來說是真的有用的,而且會給業務效果帶來質的提升。

就應用場景來說,具體應用場景也有對應的技術。比如,PSI(隐私集合求交)就是求交的技術,可以應用在不同的場景當中。比如,建模時采用它做對齊,可以做精準人群的圈定。另外,在高質量獲客方面也通過 PSI 完成。

在聯合風控營銷建模、反洗錢建模以及反欺詐建模當中,都可以利用聯邦學習引入更多方數據,提升整個業務決策精準度和效率。

MPC 可以被用來做聯合統計。另外,利用多方數據做一個特征衍生來提升整個模型效果時,MPC 也可以提供一些價值。

最後就是匿蹤查詢,除了傳統标簽查詢應用來保護銀行主體信息之外,還可以做黑名單場景、風險信息共享的場景、三要素合驗場景,這些方式都存在銀行客戶信息洩露的風險,我們通過這個行為可以避免風險發生。像 PSI、MPC、匿蹤查詢可以形成數據在整個業務當中應用閉環,也是隐私計算給我們帶來的技術價值。

隐私計算技術(為什麼當下隐私計算可用性不及預期)5

王灣灣,洞見科技數據科學家

主持人:無論是金融機構還是企業都講到自己要做隐私計算平台。不過,與擁有标準形态、标準形式以及成熟的廠商和産品的大數據分析平台相比,現在顯然還沒有成熟的隐私計算平台,大家都還在做一些探索。

接下來的問題是,在建設隐私計算這樣的基礎設施中,大家遇到最大問題是什麼?在有這麼多金融機構,有這麼多發展很快的創新型企業,還有政府的主導,有監管意見和法規,我們怎麼樣共同來做這些事?未來我們隐私計算平台會變成什麼樣子?在這個過程中,我們怎麼克服這些問題?

郭林海:本質上,它是一個體系問題。比如,要解決數據要素流通,第一個問題就是數據要能流通,這就要解決安全性問題。如何解釋我的技術是安全的?我們從 2017 年、2018 年開始接觸隐私計算時,當初問對方(的技術)怎麼安全,對方隻能提供論文,但你如何證明從論文中的理論到實現的邏輯是嚴密的?這中間我們需要有相關的标準。

現在,包括銀行和科技公司大家都在參與标準的制定,但标準還沒有到具體落地或者具像化的階段。隐私計算這個行業标準制訂非常重要,因為它和傳統技術(不管是數據庫、數據中台)最大的差别在于——多方參與,涉及到多方的數據評定、标準不統一。所以,最好是中立方,比如國家層面或者中立的研究機構、标準牽頭方等。大家都往标準靠,這就避免了每次擔心對方有沒有後門,對方也擔心我們有沒有後門。

第二,除了标準層面的問題,這些技術都還有很多需要攻堅的地方。我們和高校的老師做了很多的交流,實際上,大家很看好這個方向,還是那句話前途是光明的,道路是曲折的,我們要遵循科技發展的規律。

比如,多方計算本身還有性能的問題需要大家去研究,包括算法的安全可信等問題。聯邦學習要解決它的效率和通用性、梯度保護各方面的問題。可信方面,現在考慮到國産化,大家考慮用海光、鲲鵬等信創解決方案去補齊,但我們國内的解決方案還在起步的階段,在一些效能和各方還在不斷做驗證。大家都認為,同态加密是密碼學聖杯,解決終極通用型的問題。現在,很多隐私計算的場景都能隻能夠按照這個場景做定制,很難做通用化的東西,沒有通用化很難帶來量産,這些方面能否有技術上的突破?

第三,有了這些基礎,數據也安全了,那麼,流通過程當中數據如何确權?參與當中的各方如何分享價值和收益?數據和别的産品不一樣,一旦被看見就沒有價值了,所以才需要特别的保護機制。我們現在有《個人信息保護法》《數據安全法》,金融行業有金融交易的數據,運營商有用戶軌迹信息,電商有你的消費信息。這些信息是我從用戶收集過來的,我做了脫敏保證它可以應用,其實,在整個生态裡有很多參與方,除了有數據提供方之外還有算法提供方、純技術平台提供方,這些平台之間如何形成好的激勵模式?

當然還有數據如何定價,這都是需要進一步研究的。我們和高校及科研單位也有理論層面的研讨和學習,包括諸如數據估值計量體系、市場供需機制等研究。解決這些問題是隐私計算技術蓬勃發展的關鍵因素。

主持人:郭總講的特别好,有理論的問題,也有技術的問題,其實還有機制的問題,對于數據本質認識的問題。如果抛開數據的本質去讨論技術,市場很可能沒有動力去用這樣的産品。不知道陸總怎麼看?

陸培爾:現在這個賽道上參與者非常多,有一些是原來做人工智能的公司,有些區塊鍊公司,還有做雲計算包括互聯網巨頭、初創公司,各種各樣玩家都在這個行業裡。這個行業的健康發展還需要解決幾點比較值得關注的問題。

第一,剛才平安銀行包括洞見科技都談到了數據互聯互通的問題。我們現在也引入了一些平台,在做一些對接,實施當中整個生态裡有幾方參與者,而且是多對多關系,比如數據上遊提供方和下遊消費方以及平台方。對我們來說,由于具體實施中會接入多個平台方,無論是采購成本還是後續運維成本都會比較高。這也是因為現在标準不統一,很難建設統一的基礎設施底座,導緻目前工作比較困難,成本也比較高。

前面的主題演講中談到,隐私計算被視為一種基礎設施,這就要有統一的标準,大家都講同一套語言才能做互聯互通。比如,Web1.0 時代是基于 HTML,跑在小型機上甚至 X86 以及 ARM 服務器上,再通過标準化浏覽器都可以訪問這些網站的,隻有解決這些問題這個行業才能更加健康進行後續發展。

我們現在作為人工智能協會也是隐私計算成員單位,我們也參與了這方面建設工作。但我們覺得這個路還是比較漫長的,我們希望有政府機構出面牽頭或者行業協會牽頭,大家坐下來把标準梳理一緻,這對今後健康發展是非常重要的。

第二,整個隐私計算平台進一步發展,除了解決行業标準的問題,還要解決認證或者說資質的問題。現在平台實在是太多了,我們更多關注場景端或者消費端,解決我們實際的痛點,至于這個平台技術本身是不是符合安全的要求?我們也很難去判斷,也沒有這個能力去判斷,如果從底層往上溯源,做一套完整的分析和梳理,這個成本是很高的。我們希望有些權威的機構可以進行相應的認證或者對現在的隐私計算平台進行評級,對裡面的數據安全性做分類審核。借助這樣一個類似具體行業标準的東西,我們就能很方便地進行識别和使用。

第三,如果一段時間之内,互聯互通的标準無法建立的話,可能再過幾年,這個行業就會像當初互聯網一樣會變成剩下少量寡頭,赢者通吃的局面,這對後來的競争者來說壓力比較大,市場空間比較小。所以,我們希望盡快出台一套标準互聯互通的規範,對整個行業健康發展也是非常重要的。

主持人:您剛才講的寡頭通吃很有可能會出現。整套體系建立其實依賴于所說的标準,這個标準或者由行業内部慢慢推廣或者由政府重要的行業學會、協會來引領進行定制的,倆位都來自金融機構,意見非常統一。接下來,我們聽聽科創企業對這件事情的看法。

王灣灣:在實際落地當中會遇到一些問題,洞見科技也正在努力攻克這些問題。在性能上,不同的技術路線遇到的挑戰還有所差異,如聯邦學習面對大規模數據,比如億級甚至百億級的數據,在訓練和預測的耗時上不論是在算法原理層面還是工程優化層面仍有很大的提升空間。

再比如,MPC技術性能瓶頸呈現在通信量方面,要想大幅度提升其性能,除了在算法層面優化之外,需要着力于提升通信效率和壓縮通信内容。針對技術上不同問題,需要攻克給出不同的解決方案。

在安全性方面,因為隐私計算是多學科交叉的技術體系,因其原理層和實現層的複雜性,如何理解它的安全性存在非常高的認知成本,現在更多的是通過測評的方式來證明其安全性,但從推廣使用上來說,還是存在較高的技術成本。如何自證隐私計算軟件的安全性,仍有探索空間;另外在應用層面上來說,結果是否會暴露隐私和數據安全性,目前大多是通過審核代碼的方式,做到什麼場景計算什麼樣的結果是合适的、安全的,仍需在落地過程中不斷規範。洞見科技目前在這些方面也在嘗試通過技術手段解決這些問題。

最後,是互聯互通的問題,如果不實踐是否會導緻寡頭的問題?洞見科技也在IEEE倡導互聯互通标準的建立,今年6月牽頭了IEEE全球首個“隐私計算互聯互通”國際标準,目前各家廠商在數據生态中部署諸多節點,通過“以點連線”的方式融合輸出更多數據價值,但從“布點”到“連線”再到“結網”,這個過程需要借助互聯互通的建設,隻有完成互聯互通才能實現全局數據價值真正地釋放。

主持人:謝謝王女士剛才的觀點。雖然我們現在講隐私計算非常熱烈,當中間很多關鍵技術用起來時,還有很多技術問題需要讨論。和技術相匹配的生态如何建立?這樣才能夠在金融行業以及要素的市場上把整個環境給建立起來。

隐私計算也好或者說更大一點,金融科技或者數據要素發揮作用這件事情,它本身不會随着我們今天論壇結束而結束,我想,我們在未來人工智能大會上會有更多讨論。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved