大資料安全流通機制的研究與應用
資料流通的重要性
隨著資料經濟不斷髮展和大資料技術深度應用,資料日益成為資料經濟時代下新的重要戰略資源和生產要素。資料天性就是流通的,在安全條件下的開放、共享和利用,能夠極大地提高資本、技術、知識等其他生產要素的利用效率和結合對接,有效地推動管理、組織、制度和技術的不斷創新。而資料洩露的風險是阻滯資料流通最主要的障礙之一,其所造成的後果導致各方對資料的上傳流通採取過於保守的態度,因噎廢食。
2015 年 8 月,中國國務院釋出的《促進大資料發展行動綱要》明確表示,要“引導培育大資料交易市場,開展面向應用的資料交易市場試點,探索開展大資料衍生產品交易,鼓勵產業鏈各環節市場主體進行資料交換和交易,促進資料資源流通,建立健全資料資源交易機制和定價機制,規範交易行為”。
政府鼓勵資料資源的流通和交易,是在確保資料安全下進行的。因此,建立一個安全、可靠、合規、高效的資料流通機制,是我國資料經濟發展新形勢下的迫切需求。
1 資料流通的常見場景
1.1 單資料來源對外開放模式
以單個公司、組織為主體,向資料需求方單向開放自身的資料。資料型別主要是營銷資料、網際網路資料和政務資料。需要指出的是,資料對外開放需要做的工作很多,如資料的脫敏和去標識化,合規支援,對使用者的認證,演算法和結果分析,監管介面等等。單一資料來源對外開放的成本和技術難度都很高,導致很多資料來源止步於此。
1.2 組織內多部門資料共享模式
主 要 是 大 型 集團公 司、組 織 機 構 內部 的資料共享,包括總部與分部、決策層和執行部門、各部門之間和公司與單個具體員工等。組織內部之間的資料流通能夠有效提高業務效率,但是在實踐中會面臨諸多障礙,諸如員工跳槽或者以各種動機私自帶出資料;部門管理以業務為導向、架構獨立,會出現各部門推諉扯皮、不願承擔風險現象;跨國公司內部的資料流動涉及不同國家地區的資料跨境法律政策。
1.3 不同組織間共享資料的模式
不同機構、組織進行短期的專案合作,需要對各個成員單位進行資料共享。這種第三方外包服務通常需要對方的核心業務資料,這就使得各方之間普遍存在資料洩露的風險。
1.4 資料開放的要求
在上述或者任何其他資料流動的場景中,本質問題是資料開放缺乏相互的信任基礎和機制以及違約懲罰,建立各方能夠信任的資料安全流通平臺,才能從根本上解決資料共享的信任問題。目前,傳統企業對資料開放的訴求主要有幾點:資料安全,即在開放資料時能夠有效保證資料安全,避免資料洩露;應用場景,數字經濟下的海量資料在開放和流通中不斷積累,如何能夠在更多的場景下對資料實現更有效地利用;資料定價,基於網路空間的虛擬資料,結構複雜型別多樣,如何衡量其安全、商業、社會價值並建立規範的資料定價體系;算力支援,對於資料的接受、判斷、分析和處理需要足夠的技術儲備和安全的技術環境。
2 雲際資料交易平臺
基於此,我們提出了具備原始資料不可見、良好的加密和追溯機制、安全資料沙箱和可不斷迭代更新的雲際資料交易平臺。雲際資料交易平臺的原型源於雲際合作模
型,是一種不同架構雲服務之間的協作框架,這種模型框架應用到資料開發服務中就是雲際資料交易所,通過各方達成的共同協議和行為規則,實現不同機構之間的協作和資料開放共享的(見圖 1)。
圖 1 雲際資料交易平臺示意圖
平臺建構在多個數據源所提供的資料節點上,資料需求方提供自己需求演算法支援,在平臺上安全合規、便捷自由地處理資料提供方的原始資料,並得到演算法結果。這是平臺最重要核心的概念,即“資料所有權和使用權的分離”,資料來源在開放資料時開放的是使用權,而不是所有權。整個過程中資料的所有權都不會發生轉變,但是使用者通過平臺獲得了在某種特定時間內,在特定場景下的某種資料的使用權。
平臺的功能從底層到上層主要劃分為基礎設施層、資料資源層、資料加工層和結果應用層(圖 2)。合法合規且安全便利的資料流通平臺必須為資料流通和資料線上使用提供技術環境和機制支援。通過構建雲服務,使得使用者在雲端使用資料而不是下載資料,能夠有效地避免資料洩露。
圖 2 雲際資料交易所功能模組示意圖
2.1 雲際資料交易平臺主要特點
平臺化。通過平臺彙集資料提供方、資料需求方、演算法方和渠道方等各方,使得資料的採集、清洗、計算、使用全部在雲端平臺打通匯集。平臺通過大量的資料集聚和分類處理,能夠使得使用者能夠便利地尋找到需求資料,或者明確哪些是需求以及如何利用。同時,大量的資料集聚能夠使得不同資料來源之間能夠形成優勢互補,發揮資料的集聚效應,彌補同類資料來源資料過於單一的缺陷和不足,形成參與方各取所需的資料流通生態閉環。
合規化。平臺在構建時就嚴格遵循了《網路安全法》《資訊保安技術個人資訊保安規範》以及與資料安全相關的法律法規,確保平臺全流程合規合法。
線上化。客戶全程線上自主化使用資料,無需線下人工對接和資質稽核,並通過全方位的雲安全技術和流程設計作為安全保障,確保資料來源的原始資料不洩露,實現資料處理的脫敏、加密和匿名化,資料的使用得到所有者的充分授權等。
在產品功能上,實現資料資源融合。包括利用資料字典或資料名片對第三方資料來源進行展示,通過加密機制對自有資料和第三方上傳資料實現融合;建立完善的稽核機制,主要通過資料授權、演算法及結果稽核保障資料安全流通;確保資料來源穩定可靠,資料使用情況可追溯、檢視;演算法建模良好相容,建立演算法時可隨時檢視可用資料表,並支援多種語言編譯。
2.2 雲際資料交易平臺安全措施及流程
雲際資料交易平臺主要採取五種方式滿足資料來源和資料需求方的安全保障需求。首先是資料安全融合,通過分散式 AI 和分散式建模在不洩露原始資料的前提下實現不同資料來源之間的資料融合;二是加密機制,利用祕鑰生成器的抗干擾性、分散式等特點,實現加密,並確保金鑰獨立生成和原始碼公開;三是資料沙箱,為使用者提供封閉、安全、自由的計算環境,保證資料可用但不可下載;四是區塊鏈審計,利用區塊鏈本身不可篡改的特點,對資料交易、處理的各個環節進行記錄,確保整個過程合法合規、可被追蹤和溯源;最後是多租戶隔離,明確使用者許可權,保證資料需求方在使用資料進行計算或者建模的時候完全獨立,不會受到其他租戶的影響。
基於平臺的資料流動流程包括資料來源、平臺方和資料需求方(見圖 3),整個過程類似於電商的服務流程,但全部過程都是在線上進行,而且服務內容是資料,並不是物理商品。具體而言,資料提供方需要釋出資料時,將原始資料經過必要的匿名化、去標準化或者分散式記賬等操作後,上傳到平臺並在平臺確認後生成資料名片,呈現給需求方。提供方還要負責對資料進行日常的編輯、維護和更新。
對於需求方而言,則需要上傳參與演算法執行的自有資料,並在資料目錄中申請需要的資料授權,並選擇相應的演算法,檢視最後運算結果並確認之後,可以在線上直接使用。
圖 3 資料流動過程
通過雲際資料交易平臺,可以確保在資料安全方面做到五個不能。資料不能看,即在流程上做到資料的所有權和使用權分離,資料可用但不可見;資料不能拿,資料可用但不能下載,結果不能出庫,直接在線上的體系內完成閉環;資料不能用,平臺擁有一套基於資料脫敏的加密安全機制,就算髮生洩漏,資料也毫無價值,全防護體系,記錄所有日誌,確保所有的資料流動都可被追查;資料不想看,平臺方保持中立性,保證平臺不會私下利用上傳資料。
作者
陳曉建 ,優刻得科技股份有限公司副總裁。研究方向為網際網路產品開發、雲端計算、大資料、伺服器硬體、虛擬化技術等。
(本文選自《資訊保安與通訊保密》2019年第2期)
宣告:本文來自資訊保安與通訊保密雜誌社,版權歸作者所有。文章內容僅代表作者獨立觀點,不代表安全內參立場,轉載目的在於傳遞更多資訊。如需轉載,請聯絡原作者獲取授權。