大數據時代,如何才能保證數據安全?
來源:電子政務網 更新時間:2021-11-15

隨著數字經濟的發展,“連接—在線—數據”將是數字社會的永恒主題。連接和在線的結果是所有人類行為和經濟活動數據化,數據既是過去人類行為的結果,也是預測未來人類行為的基礎。因此,數據是數字社會的核心資源,是發展數字經濟的關鍵要素,也是目前所有互聯網公司最重要的資產。

于是,打車公司會收集用戶出行數據,音樂公司收集用戶聽音樂的習慣數據,搜索引擎收集用戶搜索數據,移動支付廠商收集用戶的支付數據等等。數據這種資源,和其他資源最大的區別在于,它具有非競爭性(Nonrivalry),可以無限復制、重復使用。非競爭性一方面意味著相比于傳統的競爭性物質資本,數據資產能給社會帶來更多的經濟價值,但一方面也產生了大量的隱私問題。一個機構無法把數據借出幾天然后再收回,因為數據給出去就再也收不回來了。

同時,數據這種資源也不是天生就屬于公司的,數據里面含有大量用戶的敏感信息,導致在數據交換的時候,還有道德和法律風險。因此,在現代社會中,別說公司和公司之間,就算是同一個公司的不同部門,在交換數據的時候也是格外的小心謹慎。不同公司之間建立在共享數據的前提下的合作,往往是很難達成的。于是,就產生了所謂的“數據孤島”問題:各個機構組織各自擁有一部分的數據,卻無法和其他的數據共同作用,產生新的收益。通過發展數據要素市場,促進數據交易,有助于打破現有的數據孤島問題,更好地促進數字經濟發展。

中共中央國務院發布?關于構建更加完善的要素市場化配置體制機制的意見?,成為構建更加完善的要素市場化配置體制機制的綱領性文件。其中特別提到要加快培育數據要素市場,加強數據資源整合和安全保護。如何在實現數據安全保護的前提下發展數據要素市場,成為數字經濟學領域的前沿戰略課題。而且重視數據隱私和安全也已成為了世界性的趨勢。每一次公眾數據的泄露都會引起媒體和公眾的極大關注,例如Facebook的數據泄露事件就引起了大范圍的抗議行動。

同時各國都在加強對數據安全和隱私的保護。特別是歐盟在實施的《通用數據保護條例》(GeneralDataProtectionRegulation,GDPR)對用戶的個人隱私和數據安全進行嚴格保護,并依此對谷歌開出了5000萬歐元的巨額罰單。因此“一方收集數據,轉移到另一方處理和清洗并建模,最后再把模型賣給第三方”這樣一種傳統的數據處理模式已經變得不可行。如何重新設計數據要素市場交易機制和監管模式,成為數字經濟未來發展亟待解決的問題。信息博弈論是解決上述問題的基礎性理論工具。

數據是信息博弈論的基礎。Blackwell提出的信息結構(InformationStructure)包含了數據和模型兩個基本要素。但信息博弈論理論往往是給定信息結構,探討博弈參與者之間的策略性互動和機制設計問題。隨著數字經濟的飛速發展,數據不再是博弈參與者的外生約束,而成為一種新型生產要素。一方面,數字經濟的發展催生了海量的數據。據統計,從計算機誕生以來到2003年,人類所產生的數據總量已經達到50億GB。2014年時,我們每兩天就能產生同等規模數據,現在是每個小時就能產生同等規模數據。另一方面,大數據處理技術的發展使得人們可以輕易從海量數據中獲取信息。

《關于構建更加完善的要素市場化配置體制機制的意見》將數據安全保護提高到前所未有的高度。而缺乏安全保護正是現在我國數據交易市場的一大痛點。特別是很多所謂的“大數據公司”用爬蟲技術盜取數據,然后采用薄利多銷的方式,用低廉的價格出售獲利。從很多新聞媒體上,我們看到諸如“一個人的身份隱私單價只要1塊多錢;當購買者所需要的數據量足夠大,單價甚至可以低至1分錢”以及“一個人的人臉照片只值5毛錢”這樣的報道,引起了社會的廣泛關注。

近些年來,隨著機器學習、神經網絡等人工智能領域的蓬勃發展以及各國加強對隱私保護的監管,MPC也煥發了新的光彩。計算機領域中的加密以及多方安全計算技術已經擴展到聯邦學習、遷移學習、差分隱私、不經意傳輸、同態加密、秘密共享、混淆電路等等許多不同的技術。這些技術被廣泛應用于在保證數據保護隱私的情況下完成模型的訓練以及預測等過程。不同的技術有不同的功能,同時在安全性和效率方面也有不一樣的表現,比如在諸如算力負擔、通信開銷、數據使用效率損失、對數據毒化和對抗性樣本等惡意攻擊的抵御程度等維度上存在差異。這些差異使得博弈者的策略空間和收益函數在不同技術下均不一樣,因此數據要素市場交易機制的設計需要考慮到底采用什么樣的加密以及多方安全計算技術。基于不同的技術特性,有針對性地設計不同的交易機制。(蠟筆聊最炫科技)



铁牛视频app下载苹果-铁牛视频app下载地址-铁牛视频app破解版ios