《數字中國研究院:2022隱私計算與公共數據開放白皮書(23頁).pdf》由會員分享,可在線閱讀,更多相關《數字中國研究院:2022隱私計算與公共數據開放白皮書(23頁).pdf(23頁珍藏版)》請在三個皮匠報告上搜索。
1、引言 公共數據開放的現狀與挑戰 公共數據開放利用中的現有安全管理方式 隱私計算作為新型數據安全技術的潛在優勢與應用場景 隱私計算在公共數據開放領域的應用展望 總結與建議附錄 001003007011015019020001一、引言數據是數字化發展的基本要素。進入數字時代,人類獲取、管理和利用數據的能力空前提升,社會各界對數據的價值也愈發重視。2020 年 4 月,中共中央、國務院發布的關于構建更加完善的要素市場化配置體制機制的意見明確提出將數據作為一種新型生產要素,與土地、勞動力、資本、技術等傳統要素并列,要求“加快培育數據要素市場,推進政府數據開放共享、提升社會數據資源價值、加強數據資源整合
2、和安全保護”。數字化發展需要整合和利用各種來源的數據,而政府部門在履職過程中生成、獲取和保存了大量基礎性、關鍵性的數據資源,是一個國家最重要的數據保有者。在工業時代,政府在大型公共基礎設施的建設中發揮了主導作用;在數字時代,公共數據作為一種新的基礎設施,將和物理基礎設施同等重要。在不涉及國家秘密、商業秘密、個人隱私的前提下,把公共數據開放給社會進行融合利用,將有力促進數字經濟和數字社會的發展。因此,開放公共數據,構筑公共數據基礎設施,是數字化發展的現實需要,也是政府在數字時代的責任。近年來,公共數據開放已成為國家政策的重要關切。2020 年 4 月發布的關于構建更加完善的要素市場化配置體制機制
3、的意見要求推進政府數據開放共享,研究建立促進公共數據開放和數據資源有效流動的制度規范。2021 年 3 月發布的中華人民共和國國民經濟和社會發展第十四個五年規劃和 2035 年遠景目標綱要中提出要“擴大基礎公共信息數據安全有序開放,探索將公共數據服務納入公共服務體系,構建統一的國家公共數據開放平臺和開發利用端口,優先推動企業登記監管、衛生、交通、氣象等高價值數據集向社會開放”。2021年 12 月,國務院印發的“十四五”數字經濟發展規劃要求“建立健全國家公共數據資源體系,統籌公共數據資源開發利用,推動基礎公共數據安全有序開放,提升公共數據開放水平,釋放數據紅利”。2022 年 6 月,國務院印
4、發的關于加強數字政府建設的指導意見也要求“編制公共數據開放目錄及相關責任清單,構建統一規范、互聯互通、安全可控的國家公共數據開放平臺,分類分級開放公共數據,有序推動公共數據資源開發利用,提升各行業各領域運用公共數據推動經濟社會發展的能力”。002然而,公共數據開放的價值與風險并存。一方面,公共數據開放能夠釋放經濟、社會、政治價值,另一方面,公共數據開放也存在諸多潛在風險。一是在數據存儲和流通過程中存在數據泄露的風險,可能危及國家秘密、商業機密和個人隱私。二是開放數據面臨被不合規利用的風險,數據被誤用或濫用會損害公共利益和第三方利益。因此,在數字化發展的背景下,如何安全合規地推動數據的高質量供給
5、與有序利用就成為了重要且緊迫的議題。為應對公共數據開放與利用中的安全風險,各地政府已從管理體制和技術手段方面展開了諸多探索實踐,如建立全生命周期安全管理機制,推進公共數據分級分類開放,以及應用數據加密、數據脫敏、數字水印、數據沙箱等技術手段加強安全保障等。然而,公共數據開放在數據安全保護方面仍存在一些未能完全解決的問題,阻礙了高價值公共數據的開放。隱私計算作為一種新興的數據安全技術,有望在保護多個參與主體的數據本身不對外泄露的前提下,實現數據融合分析計算與價值挖掘,通過“原始數據不出域”、“數據可用不可見”以及“數據用法用量可控可計量”等特性,顯著降低公共數據開放與利用的風險,成為平衡公共數據
6、開放價值釋放與風險管控的助推器,以此推動公共部門開放更多的高質量數據,促進市場和社會的數據利用。003二、公共數據開放的現狀與挑戰(一)現狀與問題我國的公共數據開放起步于地方自主探索。2012年6月,上海市政府數據服務網“”(原網址)上線運行,標志著我國內地的公共數據開放實踐拉開序幕。其后,全國各地相繼上線公共數據開放平臺。截至 2021年10月,我國已有193 個省級和城市的地方政府上線了數據開放平臺,其中省級平臺20個(含省和自治區,不包括直轄市和港澳臺),占全部省級地方的71.43%;城市平臺 173 個(含直轄市、副省級與地級行政區),占全部城市的51.33%,如圖1所示。圖 1 中國
7、各省域平臺整體上線情況地理空間分布004近年來,我國公共數據開放水平正在逐步提升。在制度供給方面,與公共數據開放相關的法律法規、實施細則、標準規范等陸續出臺和完善。在平臺建設方面,各地公共數據開放平臺的功能逐漸擴展和優化,運營維護能力與用戶實際體驗也在不斷提升。在數據供給方面,各地開放數據的數量與質量也在逐步提升。在利用生態方面,各種利用促進活動正在開展和推進,企業、公眾等各種社會主體越來越多地參與利用開放數據,也產出了一定數量的利用成果。然而,推進我國公共數據高質量開放利用,仍存在許多問題和短板??傮w上,市場和社會對公共數據的需求尚未得到充分滿足,表現為開放數據數量不多、容量較低、質量不高,
8、已開放數據普遍存在字段少、條數少、顆粒度較粗等問題,以 API 接口形式開放的實時、動態、高容量數據尤為稀少。此外,在已開放數據中還存在高缺失、低容量、碎片化等低質量數據,數據利用價值較低;而數據供給端的不足還造成了利用端的成果數量少、質量不高等問題。005(二)困境與挑戰(1)數據開放與數據安全之間的平衡困境公共數據供給不足的問題在較大程度上受制于數據開放與數據安全之間的平衡困境。國家政策與社會公眾對數據安全的重視程度不斷提升,保護公共數據安全已成為開放與利用數據的前提。有關數據安全的法律政策體系也逐步建立起來。在頂層設計上,中華人民共和國網絡安全法、中華人民共和國數據安全法以及中華人民共和
9、國個人信息保護法從不同程度上提出要在保障數據安全和個人信息的前提下促進公共數據的開放利用;在實踐規劃上,“十四五”大數據產業發展規劃等政策文件中均強調了在數據流通過程中保障數據安全的重要性。雖然數據只有被利用了才能產生價值,但由于數據開放和利用過程中存在的各類安全隱患增加了相關部門所承擔的風險,數據泄露、隱私風險等安全隱患的客觀存在降低了數據提供部門的開放數據的意愿和動力,導致數據供給部門在數據數量、數據質量、數據開放范圍等方面較為保守,未能充分滿足社會對公共數據開放利用的需求。(2)數據開放面臨的各類安全風險和顧慮“十四五”國家信息化規劃 將數據全生命周期的安全管理劃分為數據收集、匯聚、存儲
10、、流通、應用等階段,公共數據在開放利用的各個階段均存在著不同類型的安全風險與挑戰:第一,數據匯聚與存儲中的風險。當前我國公共數據開放主要采用“部門數據供給-數據資源匯集-數據平臺開放”的形式,供給數據過程中的可見性存在數據泄露、數據篡改、數據被重新識別等隱患,也對平臺方內部工作人員的素養和技能提出了較高的要求;而數據資源的匯聚使得部分數據管理的主動權從數據提供部門轉移到數據開放平臺的管理方,而數據平臺又存在被惡意攻擊、數據泄露等安全隱患,數據平臺的安全防護面臨較大壓力。006第二,數據流通與利用中的風險。這類風險主要體現在兩個方面:一是在數據提供部門在將數據提供到數據平臺后,對部分數據缺乏監測
11、與控制,無法對數據利用過程及結果進行追蹤,難以監管數據應用的合規性與正當性,且現行脫敏技術手段并不能解決所有的隱私問題,在數據利用過程中仍有通過數據拼湊還原個體數據的可能,使個人信息面臨泄露風險。二是對于有較高安全級別的數據,我國目前多采用對滿足申請條件的用戶以有條件的、受限的方式進行開放,而由于缺乏對數據利用場景的監測,存在數據由滿足申請條件的用戶流通至不滿足申請條件的用戶從而導致數據泄露和違規利用的風險。目前國家尚沒有制定統一的公共數據分類分級標準,各地方部門對數據安全的管控手段主要還是以嚴格控制數據出域和嚴格制定數據獲取條件為主,也因此間接導致了數據供給不足和數據獲取門檻過高等問題。00
12、7三、公共數據開放利用中的現有安全管理方式為了應對上述公共數據開放利用中的安全問題,當前各地方政府在保障公共數據安全開放方面已經開展了諸多實踐探索。數據安全保障舉措一方面聚焦于管理體制的建立健全上,另一方面則體現為對新興數據安全技術的積極運用上。(一)體制機制數據安全,制度先行,公共數據開放的安全保障需要依賴管理體制機制的不斷完善。各地針對數據開放全生命周期的安全風險,圍繞事前的數據安全處理、事中的數據安全監控與事后的行為處置等方面都探索出了一些新的管理體制與機制。一是建立全生命周期安全管理機制。部分地方致力于在數據開放與利用的過程中,建立數據安全事件的風險預判、識別、預警、監測與控制機制,制
13、定應急處置預案與應急響應程序,定期開展應急演練,準備應急隊伍與專家資源等。在數據開放準備階段,對于一些高價值的敏感數據集,通過數據脫敏方式在降低安全風險的前提下對社會公眾予以開放。例如,山東省在公共數據開放標準中編制了數據脫敏指南,對敏感數據的識別、標識、場景確定及脫敏操作等進行了規定,以指導公共數據的脫敏工作。在數據開放后,針對已發生的數據安全事件,多地建立了事后處置追責機制,對違規數據利用主體,會依據情節輕重處以記錄信用檔案、追究法律責任、行政處罰等不同措施;對違規的公共數據開放主體,則會處以行政處分、限期整頓等處罰措施。008二是實施公共數據的分級分類開放。例如,浙江省出臺了公共數據開放
14、與安全管理暫行辦法,將公共數據分為禁止開放類、受限開放類、無條件開放類三種類型,并將公共數據的秘密級別劃分為國家秘密、商業秘密和個人隱私三個類別,對不同類型與層級的公共數據進行分類管理。對于“無條件開放類”公共數據,利用主體可以自由獲取使用,而無需進行申請審批;而對于“受限開放類”的公共數據,則要求公共數據開放主體和公共數據利用主體簽署“公共數據開放利用協議”,對數據利用情況、數據利用用途、數據利用安全職責、保障措施等作出明確約定。三是明確數據利用主體的安全義務。各地數據開放平臺在利用主體獲取數據時,會通過協議簽署的方式告知其數據安全義務,以落實數據利用主體的責任。例如,山東省數據開放平臺在下
15、載無條件開放數據時,會以彈框提示的方式提醒利用主體閱讀協議,讓其知悉保護數據安全方面應履行的義務,并以“已詳細閱讀該協議”作為獲取數據的條件;對于有條件開放類數據,數據開放部門則會在通過對利用主體的申請審核后,會與利用主體簽訂數據開放利用協議,明確數據安全保護義務。009(二)技術手段公共數據的安全有序開放離不開技術工具的保障。當前,在公共數據開放領域使用較多的主要有數據加密、數據脫敏、數字水印、數據沙箱等數據安全技術。數據加密技術是指以密碼技術為基礎對數據進行編碼轉化,從而讓攻擊者無法獲取有價值的信息,而擁有密鑰的一方可從亂碼中恢復原始數據。數據加密技術可用于滿足數據全生命周期的各個環節的安
16、全需求。在本文中,為了同其他數據安全技術區分,將哈希算法、數字簽名等傳統密碼學技術一并統稱為數據加密技術。數據脫敏技術是指對數據中包含的秘密或隱私信息(如個人身份數據、商業機密數據等)進行數據變形處理,使得惡意攻擊者無法從經過處理后的數據中直接獲取敏感信息,從而實現對機密及隱私信息的保護。數字水印技術是指在數據流通時,在提供方原始數據中嵌入具有可鑒別性的數字信號,從而實現溯源追蹤的能力。數據沙箱技術是指利用數據脫敏、加密、權限管理等技術,從網絡、數據、業務等多層次建立安全隔離環境,并將數據放置在隔離環境中,并在隔離的沙箱內部進行計算,用戶只能從沙箱中獲取經過審核確認的計算結果,但無法取走原始數
17、據,從而保證數據的安全。在數據開放利用的過程中,以上各類技術手段在兼顧數據的安全性和可用性方面各有利弊,其特性比較如表 1 所示。注:*越多表示該特性越強 表 1 現有數據安全技術的特性比較010總體上,在公共數據開放中,現有保障數據安全的管理機制側重于開放前的數據審查、數據脫敏,以及開放后的責任追溯和救濟補償。但是受制于監管能力的不足,對數據流通與利用過程中的監測、追蹤與干預還相對薄弱,難以有效遏制數據安全事件的發生。此外,現有的數據安全技術雖然在安全性和可用性等特性上各有所長,卻難以做到均衡全面,無法同時為數據供給與利用雙方提供足夠的便利與支撐。安全性:不可得:外部無法獲得原始數據,可使用
18、加密等技術以保證數據的機密性,也可通過訪問控制手段阻止數據獲取。不可知:外部即使在得到數據的情況下,也無法知道數據信息所對應的原始主體或原始數據內容,可通過對密鑰的管理或者一定安全強度的數據脫敏技術,以及部分訪問控制手段實現。不可還原:指在經過相應技術處理后使原始數據無法被推導和還原。不出域:原始數據不出數據方所控制的范圍,包括數據被加密后又解密還原的情況,但如果解密操作被限定在特定封閉范圍內則不在此情況中。不可篡改:指數據在流通和使用的過程中,不被非法篡改和破壞,以保證數據的一致性??勺匪荩褐笖祿诹魍ㄟ^程中可以對其來源和去向進行追蹤和溯源??捎眯裕嚎伤悖禾幚砗蟮臄祿軌蛳裨紨祿粯舆M行計
19、算處理(如四則運算、邏輯運算等),以及在計算使用上的友好度??刹椋禾幚砗蟮臄祿軌蛳裨紨祿粯幼鳛闂l件進行檢索查詢,以及在查詢使用上的友好度??稍倮茫簩τ谔幚砗蟮臄祿亩畏职l利用的友好度。便捷度:指該技術在數據開發、利用等方面的簡易和便捷程度。011四、隱私計算作為新型數據安全技術的潛在優勢與應用場景(一)什么是隱私計算隱私計算是在保護數據本身不會對外泄露的前提下實現對數據價值挖掘和開發利用的信息技術,是一套包含人工智能、密碼學、數據科學等眾多領域交叉融合的跨學科技術體系。隱私計算技術可在無需改變數據存儲位置的情況下支持數據查詢、數據建模等多方數據協同利用的場景,進而實現對于數據價值的挖
20、掘。隱私計算技術主要包含多方安全計算、聯邦學習、機密計算等關鍵技術。各種隱私計算技術的利用特性如表 2 所示。注:*越多表示該特性越強 表 2 隱私計算技術利用特性多方安全計算(Secure Multi-Party Computation,簡稱 MPC)是指互不信任的參與者在不泄露各自隱私數據的情況下,利用隱私數據參與保密計算,共同完成某項計算任務。聯邦學習(Federated Learning,簡稱 FL)本質是一種分布式機器學習技術。聯邦學習過程中各參與方的數據始終保存在其本地服務器,參與方之間交換訓練中間結果和模型參數,而不交換數據本身,有效降低了傳統中心化機器學習帶來的數據泄露風險。0
21、12 圖 2 隱私計算與其他數據安全技術的比較機密計算(Confidential Computing)是指在受信任的硬件執行環境基礎上構建安全區域,對使用中的數據進行保護。機密計算的所有參與方將需要參與運算的明文數據加密傳輸至該安全區域內并完成運算,安全區域外部的任何非授權的用戶和代碼都無法獲取或者篡改安全區域內的任何數據。報告從安全性和可用性兩個維度將隱私計算技術同其他數據安全技術進行了對比,如圖2 所示。013在安全性上,隱私計算技術同其他數據安全技術各有優勢。隱私計算技術在不可得、不可知、不可還原、不可出域等方面均表現良好,不同的隱私計算技術之間在安全性方面也存在差異,如機密計算技術在不
22、可篡改和可追溯方面皆表現良好,而多方安全技術和聯邦學習技術在這兩方面相對較弱;其他安全技術之間整體上參差不齊,數據加密技術和數據沙箱技術整體上表現較好,數字水印技術表現相對較差。在可用性上,隱私計算技術總體表現優于其他數據安全技術。除聯邦學習技術不涉及“可查”外,隱私計算技術整體上在可算、可查、再利用等方面均表現良好,但在便捷度方面有所欠缺;其他數據安全技術中數據水印技術總體表現良好,在便捷度方面的優勢較為明顯。(二)隱私計算的潛在優勢隱私計算平臺作為多方安全計算、聯邦學習等技術在學術領域成果的直接工程落地實踐,滿足了大部分場景的商業化落地需求。從技術層面來講,主要有以下幾個方面的優勢:中立性
23、平臺。隱私計算平臺不存儲用戶原始數據,隱私計算結果不落盤,數據處理過程可通過區塊鏈等方式進行記錄,從而降低了數據安全風險。最小化查詢。隱私安全集合求交(PSI)作為隱私計算平臺的核心功能之一,其基于密碼學技術實現,允許參與方使用各自的數據集合計算交集,且不會泄露除交集以外的任何數據,從而提供數據的最小化查詢。精細化管控。隱私計算平臺可防止未經授權的訪問,數據協作方需要事先約定數據的使用用途和使用條件,隱私計算平臺可實現對數據用法用量的細粒度管控,在獲得數據提供方授權的前提下,數據使用方才可以開展數據協同作業,整個過程中原始數據不出本地數據庫。014(三)隱私計算現有應用場景因其在“數據可用不可
24、見”及提升數據處理行為的合規性等方面的優勢,隱私計算目前在金融、醫療、政務等已有較為成熟廣泛的應用空間。金融領域方面,在聯合風控、精準營銷等場景中借助隱私計算技術“原始數據不出域”、“可算不可得不可導”、“可查不可知”等技術特性,既保障了數據的安全,又實現了數據價值的挖掘。醫療領域方面,在疫情防控、基因分析、臨床醫學研究等場景中借助隱私計算技術“原始數據不出域”、“可算不可得”等技術特性,不僅可以實現保護數據隱私保護下的醫學數據安全統計分析和醫學模擬仿真與預判,還可以實現聯防聯控、群策群力,方便臨床科研成果的產出。政務領域方面,在辦案偵查、房貸違約風險預測等場景中借助隱私計算“原始數據不出域”
25、、“可算不可得不可導”、“可查不可知”等技術特性,不僅規范了數據的查詢使用與管理,還通過聯合建模提升了預測的精準程度,有利于推動數字政府的建設和數字經濟的發展。隨著隱私計算技術的逐漸成熟和商業化落地,中央和地方政府從 2020 年開始陸續發布了相關政策文件(見附錄 2)。例如,“十四五”大數據產業發展規劃提出要加強隱私計算、數據脫敏、密碼等數據安全技術與產品的研發應用,提升數據安全產品供給能力,做大做強數據安全產業等。鼓勵和支持運用隱私計算等技術構建數據安全防護體系,為數據要素安全流通提供技術支撐。015五、隱私計算在公共數據開放領域的應用展望如前所述,數據安全風險既限制了可開放數據的范圍,也
26、降低了政府部門的開放數據的意愿,造成“不愿開放、”“不能開放”、“不敢開放”等問題,阻礙了高質量的開放數據供給?,F有的管理機制與技術手段雖然能夠在一定程度上消彌部分安全風險,但仍不能全面均衡地解決數據可用性與安全性之間的困境。而隱私計算技術所具有的“原始數據不出庫、數據可用不可見”、“數據使用可控可計量”以及“計算分布式、監管有中心”等特征和優勢,有助于在保證數據歸屬清晰的同時解決數據安全問題,契合了公共數據有序開放的需求。(一)隱私計算應用于公共數據開放的潛在收益具體而言,隱私計算作為一種技術手段,通過隱私計算平臺的工程化落地實踐,滿足了一些場景的應用落地需求。隱私計算平臺可作為一種底層數據
27、安全能力支撐和上層技術服務工具,其能為公共數據開放工作帶來的潛在效益主要體現在以下三個方面:(1)推動高價值、低風險的公共數據供給如前文所述,受制于安全風險,當前我國開放的公共數據在數量和質量上都還無法滿足社會公眾的普遍預期。在公共數據中,有大量高價值、高風險的數據集,由于相關部門缺少數據安全管控能力而不敢開放或不能開放。這些數據對促進數字經濟發展與數字社會建設具有重要作用,亟需在數據安全技術的賦能下對社會予以開放。016(2)兼顧安全性、靈活性的公共數據利用數據安全法、個人信息保護法的相繼出臺,與網絡安全法一同構成了數據安全合規領域的“三駕馬車”。在法規政策的強監管下,公共數據利用也面臨著較
28、大的安全合規風險。隱私計算技術集合了密碼學、機器學習等技術,可以通過不同技術方式實現數據的最小化查詢。隱私集合求交(Private Set Intersection,PSI)作為隱私計算的關鍵技術之一,可以允許數據協作方之間使用各自的數據集合計算交集,但不會泄露除交集以外的任何數據。同時,隱私計算技術支持對開放數據使用進行管控授權。具體表現為:隱私計算平臺通過區分用戶權限來提供不同顆粒度的數據,并對數據的用法、使用時間、使用次數、并發限制等內容進行設定,從而實現對公共數據的精細化治理。由此,公共數據開放能夠在價值與安全之間保持平衡,推動兼顧安全性與靈活性的公共數據利用。隱私計算的技術特性使得以
29、較低風險開放較高價值的公共數據成為可能。依托隱私計算技術“原始數據不出域、數據可用不可見”的新型數據流通模式,公共數據資源可以實現“物理集中+邏輯集中”雙匯聚模式,物理集中是指將公共數據資源物理集中于公共數據開放平臺,進行統一集中化存儲和管理。邏輯集中是指將公共數據資源目錄匯集于公共數據開放平臺,而公共數據資源則分散存儲于數據提供方本地。數據使用方可以通過公共數據開放平臺了解公共數據的全貌,但在使用過程中可通過隱私計算方式實現雙方或者多方的數據安全協同計算,整個過程中原始數據不出本地數據庫。通過“邏輯集中,物理分散”的新模式,從而降低了開放數據的安全風險。同時,還需要強調的是,隱私計算技術也不
30、可過度應用,對于列入“無條件開放”屬性的低風險數據,仍應盡可能開放原始性的、完整的、可機讀的數據集,以最大程度降低數據利用的門檻,釋放數據的價值。017(3)搭建工具化、低成本的安全開發環境目前各地方政府公共數據開放平臺普遍開設了開發者中心板塊,為開發者開發數據應用提供便利,但賦能效果不太明顯。隱私計算平臺作為一種技術能力載體,不僅可作為保障數據安全流通的技術底座,也可成為公共數據開放平臺的服務工具,幫助開發者進行數據應用的快速開發。具體而言,隱私計算平臺可將底層復雜的密碼學、機器學習等技術和建模過程抽象成算子,支持用戶以拖拽式交互,構建可視化建模 pipeline,開發者無需了解底層的技術實
31、現原理,只需關注業務實現,合理的運用不同的算子完成數據應用開發。這種工具化的能力不僅降低了開發者的學習成本,還提高了數據應用的開發效率,有望實現大規模高價值的數據應用開發與流通。(二)隱私計算對不同主體的價值隱私計算以隱私信息處理的全生命周期為優化對象,其基礎法律關系涉及三類主體,即:數據提供方、數據開放平臺管理方、數據使用方。傳統公共數據開放平臺升級隱私計算能力,將有助于分別滿足這三類主體在不同場景的需求。對于數據提供方,通過隱私計算方式供給具有較高價值和較高風險的公共數據時:可只提供公共數據目錄,原始數據不出本地數據庫,外部“不可見”、“不可識”、“不可知”,保證數據的機密性,保障數據提供
32、方的相關權益??芍唤浻梢粋€平臺對多個數據使用方、多個數據協作場景進行分門別類的管理,有效節省數據維護和管理成本。018(三)隱私計算面臨的局限與挑戰隱私計算并非萬能,并不適用于所有場景。由于隱私計算技術種類的多樣性,各種技術實施路線之間存在著較大的差異,在保護效果、計算性能、計算精度,以及對于硬件的依賴等方面也有所不同。由于目前還沒有完全統一的技術標準和測評標準,隱私計算大規模應用仍存在一定的局限性:多方安全計算包含很多復雜的密碼學運算,對于計算的性能會有相對較大的損耗,其性能也會受到通信方面的限制。聯邦學習在其安全保障效果方面目前還沒有被嚴格地定義或證明,所以對于有較高安全要求的數據使用場景
33、,需和其他技術配合使用,單一使用該技術會將具有一定的局限性?;跈C密計算的隱私計算方式對于硬件有較強依賴,因此會相應地增加使用成本。此外,由于技術路線的多樣性,在異構的技術體系之間,甚至是采用相同技術方案的不同廠商的產品之間,可能在互聯互通上存在一定的障礙和壁壘,出現數據“孤島”變成“群島”的情況,對于公共數據的流通仍然會形成了一定的阻礙。對于數據開放平臺管理方,通過隱私計算方式管理具有較高價值和較高風險的數據時:可將傳統數據物理匯集的模式轉變成“邏輯集中、物理分散”的模式,保留數據的完整性,提升公共數據的數量和質量。公共數據開放平臺由數據資源匯集轉變為公共數據目錄匯集,一方面可減少平臺管理方
34、數據治理的精力和成本耗費,另一方面也可保障公共數據流通和多方主體數據開發協同中的安全合規程度。對于數據使用方,通過隱私計算平臺獲取具有較高價值和較高風險的公共數據時:可申請可用性較高的公共數據,在安全合規的前提下開發高價值的數據應用??山柚[私計算平臺對數據、模型等再利用的特性進行數據應用開發,降低數據開發利用成本,提高數據應用開發的敏捷性。019六、總結與建議 公共數據開放是推動數字化發展的重要內容。然而,公共數據開放風險與價值并存,公共數據在存儲、流通、利用各環節都存在安全隱患。在數據安全日益受到重視的今天,如何在數據開放與安全保護之間達成平衡成為重要命題。雖然各地在體制機制與技術手段兩方
35、面,已對公共數據開放中的安全保護做了諸多探索,但仍存在一些不足和短板,制約了高質量公共數據的充分供給,阻礙了社會對開放數據的有效利用。新興的各類隱私計算技術能在一定程度上彌補當前數據安全保護能力的不足,有助于在保障數據開放利用的同時有效解決數據安全問題,有望在公共數據開放若干場景中發揮重要價值。在開放數據的實踐中引入隱私計算技術,有利于構建多主體協同、全周期覆蓋的數據安全保護能力,具體建議包括:對于高風險數據,可從開放原始數據轉向“數據可用不可見”。通過引入隱私計算技術,讓數據利用方僅能獲得數據利用結果,無法獲得與推理原始數據,從而在釋放數據價值的同時,降低數據泄露風險。構建全周期的數據管控能力。利用隱私計算“數據流向可追溯”、“數據用法可控可計量”的技術特性,在數據開放利用的全周期監測各主體行為,既實現對安全風險的早預警、早發現、早處置,也為責任追查與事后救濟提供依據。從集中式開放走向分布式開放。利用隱私計算“原始數據不出庫”的技術特性,數據開放平臺可僅提供數據目錄與元數據,不再匯集各部門各機構的原始數據,以降低數據泄露的風險。020七、附錄 附錄 1 有關數據安全的政策法規(部分)附錄 2 涉及隱私計算的政策法規021報告編寫人員