萬向區塊鍊董事長肖風
矩陣元CEO孫立林
2019年1月3日,算力智庫研究院發布了《基于MPC的隐私計算研究報告》。報告指出,随着數字經濟時代的到來,數據共享和數據流通已成剛性業務需求,與此同時,隐私保護和數據高效流通之間的矛盾日益突出。
在剛剛過去的2018年,數據安全問題屢見不鮮:2018年12月,Facebook又一次曝出用戶數據洩露事件,6800萬用戶私人照片被洩露,而類似事件當年一共發生了三次;2018年8月,華住酒店5億條公民個人信息被洩露;同月,快遞巨頭順豐3億條數據也疑似流出。
“大數據時代,幾乎每個人都處于‘裸泳’狀态。”一名業内人士對《國際金融報》記者表示,“數據隐私保護已成為當下的重要難題。”
據了解,上述報告分析了以MPC為代表的隐私計算對數據安全和數據孤島問題的解決之道及應用場景。對此,1月3日當天,《國際金融報》記者獨家專訪了報告編寫成員——萬向區塊鍊董事長肖風和矩陣元CEO孫立林。
強制采集弊端多
有監測統計,2017年全球的數據總量為21.6ZB(1個ZB等于十萬億億字節),目前全球數據每年的增長速度為40%左右,預計到2020年全球的數據總量将達到40ZB。另據中國信息通信研究院調研數據,2017年我國大數據産業規模為4700億元,同比增長30.56%。未來三年,大數據産值預計将從2018年的6200億元增長到2020年的超過1萬億元,年複合增長率為17.66%,處于快速增長階段。
“數據已成為企業和國家具有戰略價值的核心資産。”在接受《國際金融報》記者采訪時,孫立林表示,“然而,目前互聯網企業和大數據公司通過提供免費服務的方式來過度采集消費者信息,然後将信息進行價值變現,這種模式對消費者既不公平也不安全,應該被改變。”
據悉,目前許多商業網站在用戶注冊使用時,都會采集包括身份證賬号在内的大量個人信息。多位人士對記者表示,“下載一款APP,必須允許開通個人的電話權限、存儲權限以及位置權限等,如果不允許就不能下載使用。”
孫立林稱,這種強制采集的方式存在兩方面弊端:一方面容易造成數據隐私洩露,另一方面也侵犯了消費者個人的數字資産所有權。“商業機構隻能是托管用戶數據,在合規性範疇内可以對數據進行變現交易,但所有權并不屬于機構本身,這也是目前商業機構普遍存在的理念誤區,即認為所采集的用戶數據歸機構所有。”
“事實上,數據所有權歸用戶本身所有。”孫立林表示,“在這方面,中國目前還存在立法滞後現象,但就全球而言,相關的法律法規已開始啟動。”
2018年5月25日,歐盟正式頒布了《一般數據保護條例》(General Data Protection Regulation,縮寫為GDPR),其中規定,數據主體授權必須是其被告知情況下自願并特定給出的明确表示;同時還規定,企業作為數據控制者,必須在事前數據采集和事後數據洩漏兩個環節履行告知義務。對企業違法行為将進行懲處,行為輕微的罰款1000萬歐元或全年營收的2%,行為嚴重的則罰款2000萬歐元或全年營收的4%。
孫立林表示,GDPR的出台,意味着全球範圍内第一部真正意義上的隐私保護立法宣告落地,彌補了數字化時代隐私保護的法律空白,在全球範圍内也具有标志性意義。
“孤島”必然數據“小”
對于屢有發生的數據洩漏現象,孫立林稱,這緣于采集數據的商業機構在隐私安全保護上面臨技術難題。
“目前解決數據隐私安全隻有兩種辦法:一種是基于MPC的隐私計算;另一種是基于可信執行環境的安全體系方法。現在的技術應用以後者為主,而事實證明這種技術系統已經被攻破。”孫立林表示,“從我們的判斷來看,隐私計算的主導技術方案,幾乎是唯一可行的。”
據了解,所謂MPC,是指安全多方計算,它是隐私計算的技術協議之一,主要是多方進行安全的聯合計算。該協議通過密碼學的方法将輸入的數據進行加密變換,同時将算法本身進行變換,從而有助于保護數據的隐私性。
肖風對《國際金融報》記者表示,隐私計算并不是一個全新的概念,而是一個世界級的話題。“隐私計算最早是伴随着人工智能的興起而出現,随着數據價值的日益彰顯,人們數據隐私保護意識的日漸增強,隐私計算才逐漸被重視。”
肖風認為,目前大數據在利用方式上,除了數據洩漏問題,還有其他三個亟待解決的問題:一是,并非所有的數據都存儲在互聯網平台,大量儲存在其他地方(如醫療機構)的數據流動性不夠,沒有充分發揮應有的價值;二是,諸多敏感數據并不允許以普通的技術手段共享利用,需要新的隐私保護技術手段來提高數據利用率;三是,當前互聯網企業在數據共享方面缺乏足夠的交互性。
“比如,國内社交數據騰訊最強,電商數據阿裡最強,但數據持有方依然堅守着‘數據孤島’,不願進行數據共享。他們既擔心數據共享可能會使自身喪失核心競争力,也擔心可能存在法律風險。”肖風表示。
孫立林則提出,全數字化世界面臨的最大挑戰是:“盲人摸象”。
“當前沒有一個機構能夠掌握全面的數據,數據使用方需要向多個機構獲取多維度數據,而各個機構又不願透露過多的數據給數據使用方,”孫立林稱,“敏感隐私數據難以商業化的現象,加劇了人工智能企業可用數據匮乏的問題。”
孫立林表示,馬雲曾提出一個“DT (Data Technology)時代”的概念,他認為目前還不是真正的DT時代,今天的大數據本質上都是小數據,它是零散的、片面的、孤立的,數據存在于不同的機構,彼此之間是數據孤島。即便是AI深度學習也隻能用于單一的、局部的數據變量,它無法作用于全域數據。
孫立林認為,以MPC為代表的隐私計算技術或許是一個解決方案,包括HE(同态加密)、VC(可驗證計算)、SS(秘密分享)等密碼學方法,正在被一些企業所接受并運用到大數據——特别是敏感隐私大數據的處理上。
“目前各個數據機構就像一個又一個孤島,他們是割裂式的、塊狀化的,無法建構真正的大數據流通,而以MPC為代表的隐私計算就像一座隐形的橋梁,将割裂的數據孤島融為一體、彼此互通,那時候(隐私計算被廣泛運用的時候)才是真正的DT時代的開始。”孫立林表示。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!