《中國移動:隱私計算應用白皮書(2021)(49頁).pdf》由會員分享,可在線閱讀,更多相關《中國移動:隱私計算應用白皮書(2021)(49頁).pdf(49頁珍藏版)》請在三個皮匠報告上搜索。
1、隱私計算應用白皮書數智移動 聯合為民中國移動通信集團有限公司中國移動通信集團有限公司信息技術中心信息技術中心20212021年年1 12 2月月前言數字經濟發展中,數據價值融合的需求催生了隱私計算技術的蓬勃發展。2021 年以來,隱私計算在金融、政務、醫療、交通、能源等真實商業場景中落地實施,為各行業發展數字經濟帶來新的契機、注入新的動能。國家層面,一方面,國務院發布 關于構建更加完善的要素市場化配置的體制機制的意見出臺,首次將數據增列為生產要素,數字經濟正在成為驅動我國經濟實現又好又快的增長的新引擎。另一方面,數據安全法與個人信息保護法的相繼發布,為各行業加強數據的合法使用與合規經營提供了指
2、引,也促進了整個數據產業的健康發展。中國移動提前在隱私計算方向布局,在推動數據安全共享、深化數據場景應用、促進數據生態合作方面不斷前行,深入開展聯邦學習的研究及試點實踐,強化多方安全計算、可信執行環境等新技術體系,確立出一套較為完善的隱私計算安全審核機制,通過打造“中國移動隱私計算平臺”與生態建立穩固的鏈接,深化各行業真實場景中落地實踐,致力于運營商數據要素生產力釋放,推動數字經濟高質量發展。本白皮書以探討隱私計算的關鍵技術路徑為出發點,聚焦國內外的隱私計算應用場景以及移動運營商在相關領域的實踐,進一步從技術、應用、法律等視角對隱私計算的發展進行了展望。期望與業界分享,共同促進隱私計算生態的創
3、新、發展、繁榮。目錄FOREWORD隱私計算發展的時代背景1.1 數據要素的市場環境變化推動隱私計算技術的發展1.1.1數據流通的市場需求顯著增強1.1.2數據流通中的數據安全風險加劇1.1.3隱私計算已成為數據保護的關鍵技術1.2 數據要素市場的政策法規完善促進隱私計算的應用1.3 數據要素市場化進程中中國移動的隱私計算實踐隱私計算技術體系2.1 隱私計算的概念2.2 隱私計算的技術路線與發展脈絡2.3 隱私計算的技術體系2.3.1多方安全計算2.3.2聯邦學習2.3.3可信執行環境2.3.4其它隱私計算技術國外隱私計算行業實踐3.1 歐洲隱私計算行業實踐3.1.1政策法規3.1.2應用實踐
4、3.2 美國隱私計算行業實踐3.2.1政策法規3.2.2應用實踐3.3 其他國家地區隱私計算行業實踐3.3.1政策法規3.3.2應用實踐國內隱私計算應用實踐4.1 金融領域應用實踐4.1.1聯合風控4.1.2聯合營銷4.1.3反洗錢與反欺詐4.1.4保險精算4.2 政務領域應用實踐4.2.1智慧城市建設4.2.2中小微企業融資需求對接4.3 醫療領域應用實踐4.3.1疫情/傳染病防控4.3.2全基因組關聯研究 GWAS 分析4.4 其它領域應用實踐4.4.1能源互聯網4.4.2汽車互聯網4.4.3數據跨境流動通信運營商行業隱私計算實踐5.1 隱私計算平臺建設5.2 金融行業隱私計算實踐5.2.
5、1銀行信貸智能風控5.2.2銀行精準營銷實踐5.2.3保險智能風控實踐5.2.4證券沉默用戶激活5.3 智慧政務治理實踐5.3.1電信反欺詐實踐5.3.2智慧人口流動分析5.3.3公共安全態勢感知445.4 醫療精準推薦實踐5.5 其他行業隱私計算實踐5.5.1汽車精準營銷實踐隱私計算發展趨勢展望6.1 政策展望6.2 技術展望6.3 應用展望參考文獻隱 私 計 算 應 用 白 皮 書(2021)01/中 國 移 動 信 息 技 術 中 心1.隱私計算發展的時代背景1.1 數據要素的市場環境變化推動隱私計算技術的發展隨著數字化和信息化浪潮滲透到各行各業,我國數據服務市場已經到了前所未有的大爆發
6、階段,數據要素市場環境也呈現出新形態:1.1.1 數據流通的市場需求顯著增強伴隨著 5G、物聯網、云計算、工業互聯網等技術迅速發展,數據量已然進入爆發增長的階段。海量數據的合理流通釋放出巨大的社會經濟價值。數據如水,能形成大江大河,滋潤萬物生長。當前國內各行業對于數據流通的需求日趨旺盛,IDC于 2021 年 8 月在2021 年全球大數據支出指南中預測,到 2024 年國內大數據市場規模將超過 200 億美元;畢馬威于 2021 年 4 月在2021 隱私計算行業研究報告中指出,國內隱私計算技術營收服務將在 2024 年達到 200 億人民幣。1.1.2 數據流通中的數據安全風險加劇隨著數據
7、科學、人工智能、云計算等技術的快速發展和應用,數據蘊含的信息和價值日益彰顯。數據的核心價值在于連接和共享,數據通過跨業務、跨場景、跨行業的流通,進一步豐富數據的樣本量及維度,進而催生更多的應用場景。由于數據的易刪、易改、易復制等特性,不可避免形成數據泄漏、數據濫用等安全隱患。一方面,流通過程中機密數據和個人隱私存在泄漏風險和安全隱患,加劇了監管機構、數據要素市場參與主體對數據流通的擔憂;另一方面,現有監管條件下,業界仍沒有形成明確統一的數據權屬規則,在數據流通的鏈條中,如何確定數據的歸屬方、保證數據歸屬方的權益,尚待進一步形成共識。1.1.3 隱私計算已成為數據保護的關鍵技術Gartner 在
8、 2021 和 2022 連續兩年將隱私增強計算(Privacy EnhancingComputation)評為重要戰略技術趨勢之一。目前業界普遍共識隱私計算將成為平衡數據價值挖掘和數據隱私保護的有效工具。在數據要素市場化進程中,隱私計算作為一種核心基礎技術,能夠幫助數據流通建立有序可控的共享機制,促進數據要素市場的蓬勃發展。隱私計算通過融合密碼學、人工智能、安全硬件等跨學科技術體系形成一套可以保障數據流通安全合規的基礎設施。從應用目的上來說,隱私計算實現了在數據流通過程中對國家安全、商業機密、個人隱私等敏感信息的保護,并且助力數據安全流通、釋放數據價值。隱 私 計 算 應 用 白 皮 書(2
9、021)/2中 國 移 動 信 息 技 術 中 心1.2 數據要素市場的政策法規完善促進隱私計算的應用2020 年 4 月,中共中央、國務院發布關于構建更加完善的要素市場化配置體制機制的意見,將數據同土地、勞動力、資本、技術等傳統生產要素并列作為一種新型生產要素參與分配?!笆奈濉币巹澗V要提出:建立健全數據要素市場規則,統籌數據開發利用、隱私保護和公共安全,加快建立數據資源產權、交易流通、跨境傳輸和安全保護等基礎制度和標準規范等。數據安全和隱私保護的法律法規也在加強。數據安全法和個人信息保護法的相繼實施,數據要素市場的治理機制日臻完善,都將促進隱私計算技術更加深入和廣泛的應用于數據流通領域,解
10、決數據流通中存在的隱私保護問題。2021 年 5 月,國家發展改革委、中央網信辦、工業和信息化部、國家能源局聯合印發了全國一體化大數據中心協同創新體系算力樞紐實施方案(發改高技2021709 號),明確提出布局全國算力網絡國家樞紐節點,推動建設數據共享開放、政企數據融合應用等數據流通共性設施平臺,試驗多方安全計算、區塊鏈、隱私計算、數據沙箱等技術模式,構建數據可信流通環境。1.3 數據要素市場化進程中中國移動的隱私計算實踐在數據要素市場化進程中,隱私計算作為一種核心基礎技術,能夠幫助數據流通建立有序可控的共享機制,促進數據要素市場的蓬勃發展。中國移動作為信息通信領域的骨干國企,在助力經濟社會轉
11、型的同時,也積淀了非常有價值的數據資產,呈現出超全覆蓋、超多維度、連續不間斷、超大數據資產等特征。針對數據要素市場的發展,中國移動可以利用自身數據的規模優勢和價值優勢,構建產業生態,在公共管理、交通旅游、安全監控、欺詐防控、商圈分析、金融征信等各個領域提供數據共享服務,釋放運營商數據要素生產力,從而增強為經濟社會發展的數據賦能本領。中國移動于 2018 年啟動隱私計算技術的研究與布局,開展聯邦學習開源框架跟蹤研究及試點實踐,規劃和建設梧桐大數據隱私計算系統,并在 2021 年正式發布“中國移動隱私計算平臺”,以此為依托,將移動大數據形成社會性的資源、資產和資本。中國移動始終踐行 CHBN(C,
12、移動市場;H,家庭市場;B,政企市場;N,新興市場)大市場戰略,推動隱私計算能力建設,為數據要素市場安全合規發展提供核心基礎設施。中國移動將進一步發揮自身獨特的能力和資源優勢,與產業各界攜手合作,積隱 私 計 算 應 用 白 皮 書(2021)03/中 國 移 動 信 息 技 術 中 心極推動隱私計算相關標準的編制和實施,推廣隱私計算應用實踐,向千行百業賦能,促進數據要素市場高質量發展,助力各行各業數字化轉型。隱 私 計 算 應 用 白 皮 書(2021)/4中 國 移 動 信 息 技 術 中 心2.隱私計算技術體系2.1 隱私計算的概念隱私計算是面向隱私信息全生命周期保護的計算理論和方法,是
13、隱私信息的所有權、管理權和使用權分離時隱私度量、隱私泄漏代價、隱私保護與隱私分析復雜性的可計算模型與公理化系統1。隱私計算技術是指在保護數據本身不對外泄露的前提下實現數據分析計算的技術體系,它涉及密碼學、分布式計算、人工智能、數據科學等眾多領域。與傳統數據的使用方式相比,隱私計算更專注于數據使用過程和計算結果的保護,其目標是在保證數據安全的前提下實現數據價值最大化。2.2 隱私計算的技術路線與發展脈絡圖 1 隱私計算技術路線與發展脈絡隱私計算是一個系統工程技術,來源于當代密碼學、數學、硬件等多個領域。主要包括多方安全計算、同態加密、可信執行環境、聯邦學習等技術,此外也包括差分隱私、零知識證明、
14、圖聯邦等技術。結合圖 1 所示,分別簡要說明隱私計算中同態加密、多方安全計算、聯邦學習和可信執行環境的發展歷史和標志性事件。1)同態加密技術1978 年 Ron Rivest、Leonard Adleman 和 Michael L.Dertouzos 提出同態加密問題,并在同年提出滿足乘法同態的 RSA 算法。在此之前,密碼學更多的研究數據在存儲和傳輸過程中的靜態安全,而同態加密問題的提出將加密技術的研究從靜態引向動態,是理論上的巨大革新,也開創了隱私計算的先河。2009 年,Gentry提出了首個實用的全同態加密算法,標志著全同態計算時代的開始。2017 年,國際同態加密標準委員會成立,標志
15、著同態加密在全球進入高速發展階段。2)多方安全計算技術隱 私 計 算 應 用 白 皮 書(2021)05/中 國 移 動 信 息 技 術 中 心1981 年,Rabin 首次提出通過 Oblivious Transfer(OT)協議實現機密信息交互,奠定多方安全計算理論基礎。1982 年,姚期智教授在 1981 年 OT 協議信息交互基礎上,在他的論文Protocols for Secure Computations中提出“百萬富翁問題“,即兩個百萬富翁在沒有可信第三方、不透露自己財產狀況的情況下,如何比較誰更富有,這標志著多方安全計算技術的產生。1986 年,姚期智教授提出混淆電路技術,實現
16、了第一個多方(兩方)安全計算方案。1987 年,Goldreich 等人提出了基于電路的秘密共享方案 GMW,并將其應用于多方安全計算。3)聯邦學習技術1996 年 Cheung 首次提出在分布式數據庫中,實現關聯規則(AssociationRules)挖掘,奠定聯邦學習的一些基礎概念。2013 年,王爽教授團隊在 SCI 學術期 刊 Journal of Biomedical Informatics 發 表 的 Expectation PropagationLogisticRegression(EXPLORER):Distributedprivacy-preservingonlinemode
17、l learning論文中提出了數據“可用不可見”問題。2017 年谷歌在官方博客中發文,提出了聯邦學習在移動端的應用。2018 年,楊強教授團隊提出安全聯邦遷移,并于 2020 發表了安全聯邦遷移學習論文,結合聯邦學習和遷移學習并發布 FATE開源系統。4)可信執行環境2006 年,OMTP 工作組率先提出一種雙系統解決方案:即在同一個智能終端下,除多媒體操作系統外再提供一個隔離的安全操作系統,這一運行在隔離硬件之上的隔離安全操作系統用來專門處理敏感信息以保證信息安全,該方案是可信執行環境的前身??尚艌绦协h境(Trusted Execution Environment,TEE),也被稱為機密
18、計算(Confidential Computing)。2011 年,GlobalPlatform(全球最主要的智能卡多應用管理規范組織,簡稱為 GP)開始起草制定相關的 TEE 規范標準,并聯合一些公司共同開發基于GP TEE標準的可信操作系統。2015年Intel發布支持TEE的CPU,2016年Intel TEE技術和聯邦學習結合極大推進了TEE技術在隱私安全方面的應用,近年來國內廠家先后發布基于 TEE 的隱私計算解決方案,已經在商業應用中被廣泛使用。目前,隱私計算概念已經被業界廣泛接受,開始被應用到多個實際商業系統中。同時,硬件、軟件、算法領域都在不斷進行研究改進,以滿足日益增長的業務
19、需求。2.3 隱私計算的技術體系隱 私 計 算 應 用 白 皮 書(2021)/6中 國 移 動 信 息 技 術 中 心目前業內采用的主流隱私計算技術包括三類:多方安全計算、聯邦學習和可信執行環境。2.3.1 多方安全計算多方安全計算(Secure Multi-Party Computation,MPC)由姚期智教授于1982 年提出,主要探討在不泄露隱私的條件下,各參與方利用隱私數據參與保密計算,共同完成某項計算任務。多方安全計算是密碼學的重要分支之一,目前主要用于解決各個互不信任的參與方之間的數據隱私和安全保護的協同計算問題,以實現在不泄露原始數據的條件下為數據需求方提供安全的多方計算2。
20、多方安全計算包括多個技術分支,主要包括秘密分享、不經意傳輸、混淆電路、同態加密、零知識證明等。1)秘密分享秘密分享(Secret Sharing)由著名密碼學家 Shamir 和 Blakley 于 1979 年分別提出34,是現代密碼學的重要分支。直觀的講,秘密分享是指將秘密以適當的方式拆分,拆分后的每一個份額由不同的參與方管理,每個參與方持有其中的一份,協作完成計算任務(如加法和乘法計算)。單個參與方只擁有部分的秘密值,有且僅當足夠數量的秘密值組合在一起時,才能夠重新構造被共享的秘密。在秘密共享系統中,攻擊者必須同時獲得一定數量的秘密碎片才能獲得密鑰,系統的安全性得以保障;另一方面,當某些
21、秘密碎片丟失或被毀時,利用其它的秘密份額仍能夠獲得秘密信息,系統的可靠性得以保障。2)同態加密同態加密(Homomorphic Encryption,HE)是一種通過對相關密文進行有效操作(不需獲知解密秘鑰),從而允許在加密內容上進行特定代數運算的加密方法5。其特點是允許在加密之后的密文上直接進行計算,且計算結果解密后和明文的計算結果一致。在多方安全計算場景下,參與者將數據加密后發送給統一的計算服務器,服務器直接使用密文進行計算,并將計算結果的密文發送給指定的結果方。結果方再將對應的密文進行解密后,得出最終的結果。3)不經意傳輸不經意傳輸(Oblivious Transfer,OT)是由 Ra
22、bin 在 1981 年提出的一種保護隱私的兩方計算協議6。后被拓展為多方計算協議。根據協議,每次發送方發送多條信息,接收方只能獲得自己想要的一條信息。協議使得接收方除選取的內容外,無法獲取剩余數據,并且發送方也無從知道被選取的內容。不經意傳輸對雙方信息隱 私 計 算 應 用 白 皮 書(2021)07/中 國 移 動 信 息 技 術 中 心的保護可用于數據隱私求交等場景。通過不經意傳輸,參與雙方不能獲取到對方的任何數據信息,結果方僅僅只可以獲取到交集數據。不經意傳輸技術常常應用于隱私信息檢索(Private Information Retrieval,PIR),也稱為匿蹤查詢等業務中。4)混
23、淆電路混淆電路(Garbled Circuit,GC)是姚期智教授提出的多方安全計算概念,其思想是通過布爾電路的觀點構造安全函數計算,使得參與方可以針對某個數值來計算答案,而不需要知道它們在計算式中輸入的具體數字。GC 的多方共同計算是通過電路的方式進行的,加法電路、比較電路、乘法電路等,所以相關技術稱為混淆電路7?;煜娐房梢钥闯梢环N基于不經意傳輸的兩方安全計算協議,它能夠在不依賴第三方的前提下,允許兩個互不信任方在各自私有輸入上對任何函數進行求值。其中心思想是將計算電路分解為產生階段和求和階段,兩個參與方各自負責一個階段,而在每一階段中電路都被加密處理,所以任何一方都不能從其他方獲取信息,
24、但仍然可以根據電路獲取結果10。5)零知識證明零知識證明(Zero-Knowledge Proof,ZKP)指的是證明者能夠在不向監控者提供任何有用信息的情況下,使驗證者相信某個論斷是正確的。零知識證明實際上是一種涉及雙方或更多方的協議,即雙方或更多方完成一項任務需要采取的一系列步驟。證明者需要向驗證者證明并使其相信自己知道或擁有某一消息,但證明過程不向驗證者泄露任何關于被證明消息的信息。2.3.2 聯邦學習聯邦學習(Federated Learning,FL)是一種具有隱私保護屬性的分布式機器學習技術,其應用場景中包括?個參與方及其數據?,該技術通過不可逆的數據變換后,在各個參與方之間交換不
25、包含隱私信息的中間運算結果,用于優化各個參與方相關的模型參數,最終產生聯邦模型?,并將?應用于推理2。聯邦學習的核心思想就是在多個數據源共同參與模型訓練時,不需要進行原始數據流轉的前提下,僅通過交互模型中間參數進行模型聯合訓練,原始數據可以不出本地。這種方式實現數據隱私保護和數據共享分析的平衡,即“數據可用不可見”的數據應用模式。按照數據集合維度相似性構成的特點,業界普遍將聯邦學習分為橫向聯邦學習、縱向聯邦學習與聯邦遷移學習。隱 私 計 算 應 用 白 皮 書(2021)/8中 國 移 動 信 息 技 術 中 心特征特征特征樣本樣本樣本縱向聯邦學習橫向聯邦學習ABAABB聯邦遷移學習圖 2 聯
26、邦學習技術的分類1)縱向聯邦學習縱向聯邦學習對應各個聯邦成員提供的數據集樣本有較大的交集,特征具有互補性的情形??v向聯邦學習中,模型參數分別存放于對應的聯邦成員內,并通過聯邦梯度下降等技術進行優化2??v向聯邦學習適用于各個參與方有大量的重疊樣本,但其特征空間不同的情形。典型的案例是跨行業/跨機構的數據聯合建模,如銀行和電信運營商,其用戶重疊度高,數據維度差異大,通過縱向聯邦學習可以在保護數據隱私的條件下構建滿足各種需求的模型。2)橫向聯邦學習當有著相同特征的樣本分布于不同的參與方時,在能夠實現綜合運用各方數據的同時,保證各方數據隱私的算法稱為橫向聯邦學習2。橫向聯邦學習的目的是要利用分布于各方
27、的同構數據進行機器學習建模,其典型應用場景包括醫療數據建模、業務相似的同行業、不同用戶的數據聯合建模等。3)聯邦遷移學習橫向聯邦學習和縱向聯邦學習要求所有的參與方具有相同的特征空間或樣本空間,從而建立起一個有效的共享機器學習模型3。當參與方數據不滿足上述需具有相同的特征空間或樣本空間條件時,聯邦學習可以結合遷移學習技術,使其可以應用于更廣泛的業務。這種組合稱為聯邦遷移學習。2.3.3 可信執行環境1)可信執行環境技術介紹可信執行環境是計算平臺上由軟硬件方法構建的一個安全區域,可保證在安全區域內部加載的代碼和數據在機密性和完整性方面得到保護。其目標是確保一個任務按照預期執行,保證初始狀態和運行時
28、狀態的機密性、完整性。隱 私 計 算 應 用 白 皮 書(2021)09/中 國 移 動 信 息 技 術 中 心圖 3 可信執行環境發展歷程2)可信執行環境主流技術方案及產品(1)國外可信執行環境相關產品ARM、Intel 和 AMD 公司分別于 2006、2015 和 2016 年各自提出了硬件虛擬化技術 TrustZone、Intel SGX 和 AMD SEV 及其相關實現方案,也是目前社區和生態較為成熟的幾類方案。(2)國內可信執行環境相關產品中關村可信計算產業聯盟 2016 年發布了 TPCM 可信平臺控制模塊,為國產化可信執行環境 TEE 技術的發展起到了指導作用。國內的 CPU
29、芯片廠商海光、飛騰、兆芯、鯤鵬分別推出了支持可信執行環境的技術 Hygon-CSV、飛騰 TrustZone、ZX-TCT 和鯤鵬 TrustZone。3)目前主流 TEE 技術對比目前,以 Intel SGX 和 ARM TrustZone 為基礎的 TEE 技術起步較早,社區和生態都已比較成熟。但國產化的芯片廠商在 TEE 方向上已經開始發力,形成我國自主可控的完整社區和生態指日可待。表1 目前主流TEE技術對比技術方案Intel SGXTrustZoneAMD SEV 海光 CSV飛騰TrustZone兆芯 TCT發布時間201520052016202020192017指令集架構X86_
30、64ARMX86_64X86_64ARMX86_64是否支持任意代碼運行是是是是是是硬件安全有無有有無有隱 私 計 算 應 用 白 皮 書(2021)/10中 國 移 動 信 息 技 術 中 心密鑰完整性認證與封存支持不支持支持支持不支持支持內存加密是否是是否否內存完整性保證支持不支持不支持支持不支持支持TEE 安全I/O不支持支持支持支持支持支持可用內存空間1T系統內存系統內存系統內存系統內存系統內存TCB硬件:CPUPackage軟件:Enclave 內的代碼實現硬件:安全虛擬核軟件:安全世界 OS 和TA硬件:AMDsecureprocessor軟件:虛擬機鏡像硬件:海光 SME軟件:虛
31、擬機鏡像硬件:安全虛擬核軟件:安全世界 OS 和TA硬件:CPU&TPCM2.3.4 其它隱私計算技術1)差分隱私差分隱私(Differential Privacy,DP)是 Dwork 在 2006 年針對統計數據庫的隱私泄露問題提出的一種新的隱私保護方法定義9,主要原理是通過在統計結果中加入隨機噪聲來避免由于數據變化導致的結果差異而泄露數據中的個人隱私信息。差分隱私通過引入擾動或噪聲實現對于數據隱私的保護,可以用在對聯邦建模的過程中或者建模結果加入噪聲,保證攻擊者難以從建模過程中交換的統計信息或者建模的結果反推出敏感的樣本信息。2)圖聯邦圖聯邦(Graph Federated Learni
32、ng)是一類將新型的聯邦學習技術與圖計算技術相結合的安全建模方法,用于多方機構聯合在不暴露各自圖數據隱私的情況構建諸如圖神經網絡(Graph Neural Network,GNN)、譜聚類(Spectral Clustering,SC)等圖模型。根據應用場景的不同,現有圖聯邦算法主要分為非關聯圖聯邦、橫向關聯圖聯邦、縱向關聯圖聯邦以及節點關聯圖聯邦。隱 私 計 算 應 用 白 皮 書(2021)011/中 國 移 動 信 息 技 術 中 心圖 4 圖聯邦示意圖隱 私 計 算 應 用 白 皮 書(2021)/12中 國 移 動 信 息 技 術 中 心3.國外隱私計算行業實踐近年來,歐美各國及其他
33、地區在隱私計算的政策、技術和業務領域也進行了積極廣泛的探索實踐。2019 年,信息技術研究分析機構 Gartner 首次將隱私計算列為處于啟動期的關鍵技術;2020 年,Gartner 又將隱私計算列為 2021 年企業機構九大重要戰略科技之一,并預測隱私計算將迅速得到落地應用,預計到 2025 年應用范圍將覆蓋全球一半的大型企業機構。國外企業對隱私計算應用的研究起步較早。第一家專攻多方安全計算解決方案的技術廠商 Partisia 于 2008 年在丹麥成立,主要為客戶商務合同、加密拍賣等場景提供安全方案。谷歌、微軟、Facebook、Intel、IBM 等科技巨頭也紛紛加入隱私計算賽道,并在
34、不同技術路線上發力:微軟主要研究多方安全計算,谷歌提出聯邦學習概念,Intel 致力于可信執行環境實現方案 Intel SGX 的打造等。此外,不少初創公司也入局隱私計算領域,如專注于搭建自研多方安全計算平臺的 Sharemind 和 Privitar,基于密碼學開發 SecurePlus 平臺的 Duality,基于同態加密技術實現深度神經網絡端到端加密的 Zama,構建保護企業信息的密碼學基礎架構設施的 Unbound,率先推出加密 XOR Secret Computing 的 Inpher,通過密鑰管理和保護新標準防止關鍵盜竊和濫用的 Sepior,基于多方安全計算獨特安全模型的 Sec
35、ata,在隱私管轄范圍內安全私密查詢數據的 Enveil,通過隱私增強加密技術驅動數據協作的 Ntharty 等。在隱私計算標準制定方面,電氣和電子工程師協會 IEEE 標準組 IEEE聯邦學習系 統 架 構 和 應 用 指 南 (IEEE 3652.1-2020-IEEE Guide for ArchitecturalFramework and Application of Federated Machine Learning)于 2021 年 3 月19 日發布。該標準系統性闡述了聯邦學習的定義、概念、分類、算法框架規范、使用模式和使用規范等方面,建立了聯邦學習的需求分析模板,厘定了聯邦學
36、習性能及安全測評準則,并將聯邦學習的激勵機制設計理論應用于各種實際場景中。除 IEEE外,國際標準化組織 ISO、國際電信聯盟 ITU 等均在開展隱私計算相關領域的技術標準研制工作。3.1 歐洲隱私計算行業實踐3.1.1 政策法規歐盟于 2016 年發布的通用數據保護條例(GDPR),于 2018 年 5 月 25 日正式生效,是世界范圍內目前較為全面廣泛的數據隱私保護條例。2020 年 7 月,歐隱 私 計 算 應 用 白 皮 書(2021)013/中 國 移 動 信 息 技 術 中 心盟法院(CJEU)判定歐盟-美國隱私盾無效,美國無法再根據 GDPR 接收來自歐盟各機構、機關、辦事處、和
37、專門行政部門(代理機構)的個人數據而無需額外的授權。為尋求合規與發展的平衡,歐盟數據保護委員會(EDPB)于 2020 年 11 月通過“關于補充傳輸工具以確保符合歐盟個人數據保護水平的措施的建議 01/2020”。在 2021 年 1 月 28 日,歐盟網絡安全局(ENISA)發布數據保護和隱私中網絡安全措施的技術分析,該技術指南將多方安全計算確定為適用于復雜數據共享方案的高級技術解決方案。3.1.2 應用實踐在醫療領域,歐盟牽頭組織開展了“機器學習分類帳編排的藥物發現”(MachineLearning Ledger Orchestration for Drug Discovery,簡稱 M
38、ELLODDY)項目:由 10 家頂級藥企在內的共 17 家合作伙伴構建了一個建模平臺,在該平臺上可以利用多家制藥企業的數據,創建更準確的模型,以確定藥物開發最有效的化合物。MELLODDY 項目的參與者 Owkin,作為醫療大數據協作平臺,通過聯邦學習和 AI 技術,在保護患者隱私和專有數據的前提下推進藥物研究,以優化臨床試驗,改善患者的治療效果。Owkin 構建了專有的聯邦學習平臺 Owkin Connect,為醫院、研究中心、技術合作伙伴和生命科學公司之間的合作提供支持。Owkin Connect 的分布式架構和聯合學習功能使數據科學家能夠安全地連接到分散的多方數據集并訓練 AI 模型,
39、而無需匯集數據。圖 5 Owkin Connect 架構概覽14英國的 OpenSAFELY 是一個安全、透明、開源的軟件平臺,用于分析電子健康記錄數據,部署在英國國家醫療服務體系(NHS)兩家最大電子健康記錄提供商的安全數據中心內,以支持對 COVID-19 緊急情況的緊急研究。在 COVID-19 大流行期間,OpenSAFELY 安全分析平臺通過隱私增強技術對 2400 萬患者的記錄進行分隱 私 計 算 應 用 白 皮 書(2021)/14中 國 移 動 信 息 技 術 中 心析,識別與新冠疫情相關的危險因素,為公共衛生做出重大貢獻。西班牙的 Sherpa.ai 公司在 2020 年推出
40、的聯邦學習和差分隱私框架,允許參與者在不共享自身數據的情況下進行協作學習,應用場景涉及多個領域:在醫療業,使用安全和私密的患者數據改進診斷和護理;在銀行業,在不共享客戶數據的情況下保持資金安全;在學術界,助力大學和研究機構整合研究成果同時確保數據私密性;在服務業,構建隱私保護的提供預測服務的智能服務助理。愛沙尼亞的 Cybernetica 公司開發了用于安全處理機密數據信息的數據分析平臺 Sharemind,以及分別基于可信執行環境與多方安全計算技術的兩款隱私計算產品 Sharemind HI 和 Sharemind MPC。通過 Sharemind 平臺,Cybernetica 公司可助力國
41、家更輕松地發現稅務和增值稅欺詐,幫助企業創建私有行業市場報告,讓CEO 可以在不披露商業機密的情況下了解到自家公司與其他公司的對比情況。3.2 美國隱私計算行業實踐3.2.1 政策法規美國各州有獨立的數據隱私法,如加利福尼亞州于 2018 年通過的加州消費者隱私法(CCPA),弗吉尼亞州于 2021 年通過的 消費者數據隱私保護法(CDPA),科羅拉多州于 2021 年通過的 科羅拉多州隱私法(CPA)。美國共和黨提交的 2019美國國家安全與個人數據保護法案,以保護本土企業和國民數據為切入口,限制跨境數據流向,嚴格管控數據的傳輸和存儲,具有鮮明的、針對性的數據保護意識。美國白宮行政管理和預算
42、辦公室(OMB)2019 年發布的聯邦數據戰略和 2020 年行動計劃描述了美國未來十年的數據愿景,將“數據作為戰略資源開發”的核心目標。3.2.2 應用實踐Google 在 2017 年提出“聯邦學習”概念,并應用于自家的輸入法中,通過Gboard 聯邦學習改善輸入下一詞的預測效果。2019 年 Google 通過發布論文對可擴展大規模移動端聯邦系統進行描述,用于改進谷歌輸入法的自動關聯與推薦,同年 8 月開源一個新型多方安全計算開源庫 Private Join and Compute,結合了隱私求交和同態加密兩種基本的隱私計算技術,助力各組織和隱私數據集協同工作,并可針對特定項目使用隨機密
43、鑰進行高度加密,進一步提高隱私性。Google 的聯邦學習從自給自足的 To C 模式逐步發展到企業之間互聯互通的 To B 模式。隱 私 計 算 應 用 白 皮 書(2021)015/中 國 移 動 信 息 技 術 中 心圖 6 Gboard 聯邦學習過程15NVIDIA 在 2019 年 RSNA 大會上推出 NVIDIA Clara FL,它利用分布式協作型學習技術,將患者數據保存在醫療服務機構內部。通過 NVIDIA Clara FL 框架,NVIDIA 與 20 家醫院合作構建了 AI 模型,可以預測患者的氧氣需求,以更好地對COVID-19 患者進行分類。NVIDIA 除了推出自己
44、的聯邦學習產品還扶持了多家涉及聯邦學習業務的公司,如 Rhino Health、Doc.ai 等。Facebook 在 2019 年推出了基于 Pytorch 的多方安全計算框架 CrypTen,深度學習模型可以使用 Crypten 直接轉換為使用多方安全計算的深度學習模型,從而保護數據持有者和模型開發者的隱私信息。微軟研究院自 2011 年開始大規模推進多方安全計算研究,從兩方逐漸拓展至三方和不存在交互行為的多方計算。2018 年,微軟印度研究院推出 EzPC 項目,作為一個高效、可擴展的 MPC 協議,EzPC 是一個加密成本感知編譯器,使用算術和布爾電路組合,通過高級語言執行計算,支持神
45、經網絡訓練和預測等復雜算法。微軟研究院于 2020 年在 41 屆 IEEE S&P 上發表開源項目 CrypTFlow,該項目可以將Google 公司的 TensorFlow 深度學習模型轉換為多方安全計算的形式。Consilient 公司結合聯邦學習技術與反洗錢和反恐融資(AML/CFT)專業知識,致力于為金融機構提供安全、動態和有效的解決方案,協助打擊打擊欺詐、洗錢和資助恐怖主義等日益增多的金融犯罪。始于 2014 年 4 月,在以患者為中心的成果研究所(Patient-CenteredOutcomes Research Institute(PCORI)資助下,以患者為中心的可擴展的國家
46、級有 效 性 研 究 網 絡(patient-centered SCAlable National Network forEffectiveness Research(pSCANNER)利用聯邦學習等隱私計算技術,通過“數據可用不可見”的方式,連接了 17 家現有醫療衛生系統的數據源,覆蓋了超過 3700萬患者。該項目通過創建一個大型、具有高度代表性的醫療網絡來輔助臨床結果研隱 私 計 算 應 用 白 皮 書(2021)/16中 國 移 動 信 息 技 術 中 心究,提高國家進行比較有效性研究(Comparative Effectiveness Research)的能力。由于傳統的數據共享方法
47、經常會影響研究人員和臨床醫生在護理點訪問、匯總和分析患者記錄的能力,pSCANNER 通過使用可擴展的聯邦式網絡基礎設施以及新穎的隱私計算方法克服了這些障礙,從而能夠對從多中心臨床數據庫收集的數據進行近乎實時的比較有效性研究和前瞻性分析。圖 7 pSCANNER 是一個聯合臨床數據研究網絡163.3 其他國家地區隱私計算行業實踐3.3.1 政策法規除以上國家地區外,還有不少國家地區越來越重視個人隱私保護,并出臺了一系列關于個人隱私保護的法律法規,如:巴西的通用數據保護法(LGPD)、印度的個人數據保護法案(PDPB)、加拿大的2020 年數字憲章實施法案、泰國的個人數據保護法(PDPA)、南非
48、的 個人信息保護法(POPIA)、新西蘭的 2020年隱私法、日本的個人信息保護法、韓國的個人信息保護法(PIPA)等。3.3.2 應用實踐澳大利亞的 Presagen 公司致力于連接全球的醫療數據,目前該公司已推出第一款產品 Life Whisperer,該產品通過聯邦 AI 算法來幫助篩選試管嬰兒的胚胎,在評估胚胎活力方面的準確度比專家胚胎學家進行的傳統形態學評估高 25%以上。隱 私 計 算 應 用 白 皮 書(2021)017/中 國 移 動 信 息 技 術 中 心圖 8 Life Whispere 預測試管嬰兒胚胎評分值17以色列的初創公司 Lynx.MD 通過隱私計算技術專注于構建
49、一個使醫療機構、制藥公司和醫療技術公司能夠以安全、合法和保護隱私的方式取得醫療數據的臨床數據共享平臺,以實現快速共享和分析影像、醫生筆記、設備數據、醫療記錄等??傮w來看,國外隱私計算發展呈現如下特點:各國法規政策制定逐漸成熟,標準體系建設逐漸完善;國際科技企業在學術研究和開源生態的建設上更為活躍,在各條技術路線上均進行了有效嘗試與創新;各國創業企業呈現百家爭鳴、百花齊放的局面,商業化產品形態以醫療為主,但產業生態尚未形成激烈競爭或壟斷格局。隱 私 計 算 應 用 白 皮 書(2021)/18中 國 移 動 信 息 技 術 中 心4.國內隱私計算應用實踐近年來我國數據相關立法進程不斷加快,相繼出
50、臺數據安全、個人信息保護領域的法律法規。中華人民共和國數據安全法 中華人民共和國個人信息保護法兩部重要法律于今年的正式頒布實施,更是完善了國家數據相關立法的頂層設計。隱私計算作為數據應用與安全的平衡支點正成為國內數據流通領域最受關注的技術熱點,目前國內已就金融、醫療、政務等行業領域開展相應場景實踐。4.1 金融領域應用實踐隨著我國金融科技的快速發展,大數據技術與金融業務深度融合已經成為推動金融業轉型升級的新引擎,有效助力金融業服務實體經濟。隱私計算技術的出現讓金融數據與其他跨領域數據的融合應用不斷創新,使金融行業數據的整合、共享和開放成為新的趨勢,給金融行業提供了嶄新的發展機遇和強大的發展動力
51、。4.1.1 聯合風控以往銀行對信貸風險評估多基于歷史信貸數據和交易數據,通過整合內外部數據資源進行風控預測。面對金融行業數據的敏感性和數據隱私保護的強監管態勢,數據孤島問題日益影響金融機構的外部數據合作,而數據又是影響風控效果的核心要素。通過隱私計算技術引入跨行業的用戶、企業特征,進行聯邦建模、聯邦預測,可以有效解決跨機構合作中數據隱私與數據共享的矛盾,打破數據壁壘,豐富金融場景數據維度,在雙方或多方合作中保障數據價值交換時的數據安全。另外,利用多方安全計算技術可以實現在數據提供方不獲取查詢內容的情況下,以隱私信息檢索方式增強行業的風控質量,既實現了敏感數據不出庫、不泄漏,又保障了多方數據的
52、安全共享。圖 9 隱私計算下的三要素核驗召回隱 私 計 算 應 用 白 皮 書(2021)019/中 國 移 動 信 息 技 術 中 心在實際場景中,通過聯合多方數據,使用隱私計算技術,對現有風控模型的精準度提升具有顯著的效果。例如在需要進行三要素核驗的銀行信用卡辦理環節,若按照原有的三要素一致性匹配校驗規則,使用親友手機號的用戶會被直接拒絕準入;而如果通過隱私計算技術引入運營商數據進行社交親密度感知,則可對原有的三要素核驗風控規則做出調整,對原有三要素被拒用戶進行召回,彌補三要素校驗風險識別過程中風控攔截的誤傷,提升風控策略的有效性。4.1.2 聯合營銷隨著大數據及人工智能的飛速發展,應用于
53、金融營銷的數據維度不斷豐富,單一金融機構本身的用戶畫像已經無法滿足精準營銷的要求,亟需聯合多方機構、企業的數據豐富用戶畫像,提升營銷效果。但由于數據隱私保護等相關法律法規的日趨嚴厲,各方數據無法出私域,限制了多方機構間的數據合作,使精準營銷的發展陷入瓶頸。通過隱私計算技術可以對多方數據進行聯合建模,在保障數據安全和數據不出私域的情況下,加強不同金融機構之間,以及金融機構與其他第三方機構間的數據價值融合,優化營銷模型。金融機構為了更好地服務客戶、提升服務質量,會常規性引入外部名單性產品進行客群的質量判斷和風險判斷。但考慮到原始數據交互的模式既無法保護用戶隱私,同時也無法避免數據被緩存,金融機構已
54、逐步向“隱私信息檢索”的方式遷移。例如在提供個性化服務時,為了有效利用客服團隊的資源,需要對重點客戶進行定向化的貼身服務。通過隱私信息檢索的方式,可對運營商提供的 VIP 客群清單進行用戶隱私受保護模式下的查詢,即在不暴露用戶個人信息的情況下,完成命中與否的判斷。然后以提供差異化服務方式有效利用有限客服資源進行最大化的客戶價值實現。金融機構在拓展其自身業務過程中,使用隱私計算能力融合多方數據并與其營銷能力整合的模式也具有顯著的效果。例如,金融機構與流量平臺進行數據融合后優化投放客群篩選,提升響應率模型;同時,其結合運營商數據將風控模型前置,對高凈值客群進行提前篩選,并與響應率模型結合,有效提升
55、營銷全流程的轉化率。隱 私 計 算 應 用 白 皮 書(2021)/20中 國 移 動 信 息 技 術 中 心圖 10 隱私計算增強下的投放模型與風險模型前置4.1.3 反洗錢與反欺詐近年來新的洗錢犯罪形式不斷涌現,洗錢犯罪手段日趨智能和隱蔽。金融行業傳統的反洗錢模型為基于內部交易數據、關聯賬號等建立的反洗錢策略集合,其數據的覆蓋面較弱導致模型性能普遍偏低。隨著我國的反洗錢監管理念不斷向智能化風險識別的轉變,隱私計算技術在反洗錢中發揮的作用愈益顯著。通過隱私計算技術融合其余行業與金融行業的數據價值,同時滿足各方隱私保護的合規要求,如將異地跨國通話數、位置軌跡跨境次數、違法網站訪問情況等運營商數
56、據特征與金融機構沉淀的洗錢用戶數據進行融合,通過縱向聯邦建模、多方安全計算技術,顯著提升反洗錢模型的風險識別性能。在反欺詐方面,在保障隱私數據安全的前提下,利用多方安全計算、圖聯邦等技術,結合互聯網、運營商數據的社交關系屬性,可準確鑒定關系鏈條上的欺詐風險,實現對詐騙犯罪團伙的識別。此外,銀行對客戶信貸資金流向監控始終會有著“跨行難”的瓶頸,同樣可利用多方安全計算與圖聯邦技術整合結算數據,共享并匯總客戶的交易流水后形成跨行資金流向網絡,為貸后資金流向提供更多維度的判斷,在信貸詐騙識別方面起到顯著的作用。4.1.4 保險精算保險行業大數法則決定了保險產品的定價與數據密不可分,而保險機構本身所擁有
57、的數據無論從維度還是總量上來看都比較有限,需要引入如醫療數據、互聯網消費數據、通訊類數據、車聯網數據等大量外部數據,輔助完成用戶畫像補全及保險精算模型構建。在數據安全和隱私保護的法規政策日益趨嚴的背景下,傳統的數據包傳輸或通過 API 進行數據標簽調用的方式在安全性、合規性以及商業價值保護等問題上均引發了保險機構及外部數據提供方的擔憂。隨著隱私計算技術的不斷發展及隱私計算平臺易用性的提升,基于隱私計算的保險精算模型構建日益受到保險機構的青睞。例如,在保險機構進行保險產品設計及精算定價過程中,隱私計算技隱 私 計 算 應 用 白 皮 書(2021)21/中 國 移 動 信 息 技 術 中 心術可
58、為保險機構安全鏈接更豐富的外部數據資源,在充分發揮多方數據融合價值的同時最大化保障保險機構及數據提供方的數據安全及數據價值。目前,國內多家大型保險集團、互聯網保險公司等均在積極探索和推進相關領域的應用。4.2 政務領域應用實踐隱私計算技術能在保障政務數據隱私安全的前提下,實現政府機構內部數據價值安全共享、政務數據及社會數據的安全融合,進一步盤活政務數據資產、實現政務數據價值開放流通,有助于提高智慧城市建設及治理能力,增強人民群眾的獲得感、幸福感和安全感。4.2.1 智慧城市建設近年來,智慧城市理念在全國范圍內得到積極倡導和實踐。智慧城市建設是通過推廣和應用信息技術及智能技術,達到全面提高社會發
59、展與管理水平、經濟效率、企業競爭力和人民生活質量的目的的過程。在實際建設過程中,不同政務機構數據、企業數據往往分散在各機構內部,各機構數據獨立存儲、獨立治理、獨立維護。稅務、公安、教育、醫療等垂管機構機構間普遍存在數據標準不統一、數據共享不足、開放利用不夠等問題。故各地方政府希望通過數據共享交換平臺等形式來破解數據割裂的問題。通過隱私計算技術,可以在原始數據不出私域的情況下,對不同機構的數據進行聯合建模、聯合統計等,實現跨地域、跨機構、跨部門間數據的安全融合,釋放政務數據價值。在保護個人信息安全、企業商業機密安全的前提下,建立政務數據共享開放的安全渠道,同時為各機構行政審批事項梳理和業務流程再
60、造提供支持,提升城市管理與公共服務能力,優化治理效率。圖 11 基于隱私計算的政務共享開放平臺4.2.3 中小微企業融資需求對接隱 私 計 算 應 用 白 皮 書(2021)/22中 國 移 動 信 息 技 術 中 心截止到 2020 年,中小微企業占據了企業總數的 99%,其解決了 80%以上的城鄉就業人口問題,負擔了 50%以上的稅收。但銀行等金融機構面對中小微企業信貸需求時,由于缺乏企業生產經營狀況等有效數據,難以準確評估中小微企業信貸風險,從而導致中小微企業融資貴、融資慢等問題。政務數據是評價中小微企業信用風險的重要數據來源。通過隱私計算技術,能夠將社保、稅務、工商、司法等更多有價值的
61、底層政務數據能力定向開放給銀行等金融機構。在各方數據都不出本地的前提下,金融機構能夠基于多源、多維度數據建設更為精準的風控/營銷模型,解決中小微企業信貸申請過程中信息不對稱、不透明的問題,實現政務數據安全對外賦能,助力中小微企業和金融機構的有效融資撮合。各地方金融局、大數據局聯合其他委辦局及本地銀行基于隱私計算平臺搭建的企業融資對接服務平臺,能夠收攏大量滿足當地小微企業個性化需求的銀行信貸產品,優化和創新銀政企融資服務對接流程及服務模式。該平臺通過隱私計算技術打通地方政務及第三方機構數據,形成多維度企業畫像,幫助地方政府主動對本地中小微企業進行信用模型初篩評價,將優質客戶批量推薦給銀行,降低銀
62、行獲客成本,使銀行服務模式由被動轉為主動,暢通企業“首貸”渠道。同時,也實現政府惠企紓困政策平穩銜接。圖 12 中小微企業融資需求對接平臺4.3 醫療領域應用實踐醫療平臺集聚了最私密的個人數據,其為高價值的生產要素。同時,醫療數據的安全應用被認為是對于數據隱私要求最高的場景。如何聯合院內診療數據、生信檢測數據、醫保數據、公衛/疾控數據等醫療數據,實現醫療領域應用場景創新是當前醫療領域共享協作遇到的最大問題。通過隱私計算技術,可在數據隱私保護和數隱 私 計 算 應 用 白 皮 書(2021)23/中 國 移 動 信 息 技 術 中 心據安全的前提下解決醫療數據價值流通障礙問題,保證數據不出本地同
63、樣實現應用和數據價值輸出。4.3.1 疫情/傳染病防控在疫情/傳染病防疫過程中,跨部門跨省市數據共享意愿不強、信息交互手段不足,導致公共服務數據來源單一,進而影響數據分析準確性,使區域聯防能力無法提升。運用隱私計算技術通過多方數據聯合,建立健康醫療數據安全節點、政務數據安全節點。并且各節點能夠與第三方企業節點的地理位置、互聯網搜索數據、人口遷徙數據等敏感數據通過聯邦學習方式實現政企數據融合,進而以在節點之間數據協同的方式建立覆蓋醫療機構、各級各類學校、機關企事業、機場、車站、大型商超、集貿市場等重點單位重點場所的監測網絡,做到傳染病疫情的早發現、早報告、早處置,提高疫情實時分析、集中研判的能力
64、。4.3.2 全基因組關聯研究 GWAS 分析全基因組關聯研究(Genome-Wide Association Studies,GWAS)是指從人類全基因組范圍內找出存在的序列變異,即單核苷酸多態性(Single NucleotidePolymorphisms,SNPs),并篩選出與疾病相關的 SNPs,以幫助進行疾病診斷或是預防的研究方法。它常用于復雜疾病研究,包括腫瘤、糖尿病和高血壓等。利用 GWAS對遺傳機制的研究有助于開發新藥物、發展新療法和開展預防工作,提高整體國民健康水平。由于基因數據具有個人識別性,一旦泄露將造成難以預計的損失,且傷害會蔓延至信息遭泄露個體的血親,“強直性脊柱炎
65、GWAS 分析”項目18基于隱私計算技術保證了數據可用情況下的不泄露。該項目聯合了全國多家醫院、科研機構、基因庫等單位的基因數據,使用隱私計算技術進行不分享明文數據(個體基因數據)的GWAS 分析,解決了 GWAS 依賴大量基因數據的積累、樣本量不足等各項 GWAS研究難題。4.4 其它領域應用實踐4.4.1 能源互聯網面對全球氣候變暖問題,我國明確在 2030 年前和 2060 年前分別實現碳達峰和碳中和。目前,電力和交通的碳排放量約占全行業碳排放量的 70%,推動新能源汽車產業發展已成為節能減排的關鍵抓手。而電動汽車充電負荷具有顯著隨機性,其隱 私 計 算 應 用 白 皮 書(2021)/
66、24中 國 移 動 信 息 技 術 中 心大規模并網必將影響電力系統運行的穩定性和安全性,故電動汽車負荷分析與預測成為近年能源領域的研究熱點。一般而言,電動汽車的充用電數據掌握在多個主體手中,考慮到數據的安全和價值,各方通常只對外提供脫敏后的統計分析數據,致使任意一方難以基于多方數據開展用戶畫像和數據建模。最終導致現有基于部分數據采用專家經驗、數據挖掘等方法建立的負荷分析與預測模型,由于樣本不充足、特征不顯著難以發揮預期成效。隱私計算技術的問世將可有效解決各方主體所掌握的充用電數據無法開放的問題。利用聯邦學習、多方安全計算等新型隱私計算技術,在各電力機構原始數據不出域、不直接交換的基礎上,安全
67、高效地協同使用各方數據,合法合規地進行電力大數據協同建模與分析,構建充電樁、充電站、充電網的多粒度用電畫像,建立城市電動汽車負荷分析與預測模型,解決數據隱私安全、跨域數據協同應用和數據價值挖掘的難題。4.4.2 汽車互聯網據公安部統計,截至 2021 年 6 月底,全國新能源汽車保有量達 603 萬輛,2021年上半年新注冊登記新能源汽車 110.3 萬輛,與去年同期相比增加 77.4 萬輛,增長234.92%。由新能源車所鏈接的車輛基本信息、駕駛人基本信息、駕駛行為數據、駕駛軌跡數據、充電樁數據等背后蘊含的價值日益受到關注。同時,由于此類數據的敏感性,傳統的明文數據交易模式所面臨的隱私數據泄
68、露問題是新能源車相關數據擁有方所無法接受的,隱私計算技術為新能源車相關數據價值安全釋放提供了可行的解決方案。在各方原始數據無需出私域的前提下,可通過隱私計算技術基于多方數據共同完成聯合模型訓練、聯合預測、聯合篩選等,從而助力二手車交易、汽車金融反欺詐、新能源車保險定價、新能源車保險理賠等場景模式創新。目前,國內多家頭部保險公司、新能源車企、新能源車聯網應用與服務商等均在積極探索和推進相關領域的應用落地。4.4.3 數據跨境流動隨著全球經濟一體化進程加快和數字經濟的快速發展,數據跨境流動的需求日益迫切,但與之相關的國家安全、個人數據保護等問題和挑戰也日益突出,成為各國貿易、產業、經濟、政治、社會
69、的核心議題。我國在對數據跨境流動堅持對外開放和對等原則的同時,于當前階段針對數據出境進行嚴格監管。網絡安全法提出關鍵信息基礎設施的個人信息和重要數據應當在境內存儲,確需向境外提供的,應隱 私 計 算 應 用 白 皮 書(2021)25/中 國 移 動 信 息 技 術 中 心當進行安全評估。數據安全法分別從域外適用效力、數據安全審查制度、數據出口管制、數據對等方面對維護數據的正當跨境流動秩序進行了宣示。通過隱私計算技術可使各方在各自加密狀態下分散計算后再融合協作得到聯合計算結果,實現“數據可用不可見”,在數據跨境流動滿足安全合規要求的情形下發揮數據價值。目前,已有合資汽車廠商通過隱私計算技術探索
70、亞太和境外總部之間的用戶數據跨境業務融通,如利用兩側數據聯合統計優化駕駛體驗模型、利用兩側數據進行橫向聯邦建模優化車貸反詐模型等。另外,在跨境支付結算,如何在多方參與的復雜情況下,既保護各方信息安全,又保證各參與方貿易背景的真實性、信息的可溯源性,一直是行業的痛點問題。運用隱私計算技術,可進行支付數據、物流數據等數據源的安全可信融合,有效整合貿易全鏈路信息并運用大數據分析技術對貿易真實性進行實時核驗,同時輔助跨境貿易進行業務管理,實現在安全可信的前提下打造高效的跨境結算服務。隱 私 計 算 應 用 白 皮 書(2021)/26中 國 移 動 信 息 技 術 中 心5.通信運營商行業隱私計算實踐
71、大數據、云計算和人工智能等新一代信息技術的快速發展,使得數據成為基礎性戰略資源和關鍵生產要素。為促進運營商數據要素安全有序流通、釋放運營商數據要素價值、支撐數字經濟社會高質量發展,中國移動一路穩扎穩打,持續深入對隱私計算技術的研究以及應用場景的探索實踐。2018 年,中國移動開始接觸隱私計算技術并開展相關領域的研究。在 2019 年到 2020 年間,中國移動在技術層面逐步深入開展聯邦學習開源框架跟蹤研究,重點涵蓋聯邦學習可信評測方法、框架碎片化等技術;在應用層面,開展試點實踐,探索應用場景落地可行性并持續推進中國移動數據智能生態合作落地。從與國內頭部互聯網企業開展小范圍的測試驗證開始,經過多
72、個應用場景的驗證檢驗,中國移動最終確立出一套較為完善的合作伙伴安全審核機制,為后續打造安全可靠的基于隱私計算的合作生態環境奠定了基礎。通過聯合各行業積極探索隱私計算應用場景,不斷升級技術安全驗證方法及 POC 測試標準。中國移動積極布局多方安全計算、聯邦學習等新技術,規劃建設梧桐大數據隱私計算系統,并在 2021 年正式發布“中國移動隱私計算平臺”。針對中國移動與外部機構的合作,在電信運營商層面,為形成運營商整體數據服務能力提供異構隱私計算平臺互聯共通的基礎;在跨行業融合層面,以“數據可用而不可見”的方式為金融、政府、電商等行業客戶實現與移動數據的融合協同應用提供數據安全保障。中國移動隱私計算
73、平臺的建設,為跨行業開展聯合營銷、聯合風控、聯合科研等合作提供了堅實的技術基礎,是中國移動聯合各行各業深入構建大數據合作生態的能力基石,也是中國移動借助技術創新,放眼未來,助力運營商數據要素的生產力釋放,推動數字經濟高質量發展的不懈追求。未來,中國移動將持續關注隱私計算領域并實現移動隱私計算平臺產品的迭代優化,凝心聚力打造移動集團基于隱私計算的數據智能關鍵基礎設施,促進移動集團數據安全有序對外賦能。隱 私 計 算 應 用 白 皮 書(2021)27/中 國 移 動 信 息 技 術 中 心圖 13 中國移動在隱私計算上的研究歷程和計劃5.1 隱私計算平臺建設中國移動搭建 1+X 的隱私計算平臺,
74、如圖 13 所示,主要涵蓋資源層、數據層和核心算法層、應用層和系統管理層等功能模塊組成,既保持 X 個基礎算法算子小系統的安全性、開放性、擴展性、獨立性;又可實現統一資源層、數據層和系統管理,為將來 1 個底座平臺的互聯互通標準、協議及接口實現奠定良好基礎。隱私計算應用系統是基于對隱私計算底層技術的封裝,結合聯邦框架與 AI 算法,打造高效、安全的系統架構,與集中化大數據服務管控系統互動獲取數據資產,支撐豐富的行業數據服務場景。圖 14 中國移動 1+X 的隱私計算平臺通過引入聯邦學習、多方安全計算等技術,加速自主創新突破,為數智化轉型注入強勁內生動力;規范數據流通關鍵標準,解決數據孤島問題,
75、保障數據要素安全高效流通;持續迭代優化產品,提升服務品質,打造中國移動自主品牌;培育開放融合生態,實現全行業的共同繁榮進步,如圖 15 所示。隱 私 計 算 應 用 白 皮 書(2021)/28中 國 移 動 信 息 技 術 中 心圖 15 中國移動隱私計算發展路徑5.1 金融行業隱私計算實踐5.1.1 銀行信貸智能風控銀行信貸服務業務的核心是進行風險控制。風控管理覆蓋信貸業務的貸前、貸中、貸后全流程,內容涵蓋了從貸前準入、信貸申請反欺詐、信貸額度審批、貸中風險監控、貸后風險預警等。通過構建風控模型進行信貸申請的風險評估是銀行信貸服務業務風險控制的有效手段,風控模型的質量和成效將會對金融信貸業
76、務的收益產生重要影響。隨著數據量級顆粒度、深度的增加,銀行對風控數據模型的需求、應用都在不斷的擴大。由于央行和人行對金融機構數據使用的合規等方面約束不斷加強,風控模型可用數據源的供給渠道在不斷的收縮;同時,在信貸服務場景中,信息欺詐和數據失真情況不斷加重,傳統的銀行風控模型因缺乏多維動態數據支撐,已經無法有效識別風險及進行風險預警。通過在通信運營商與銀行之間搭建基于隱私計算的數據安全共享及聯合建模平臺,銀行能夠安全應用更多維度的運營商動靜態數據,如通話行為標簽、入網時長、信貸分、信用卡分等,為業務提供輔助決策支撐,并能夠通過聯合建模,在各方數據都不出私域的前提下,應用運營商更多底層數據字段及發
77、揮多方數據融合價值,提升銀行風控模型的精準度,如圖 16 所示。圖 16 基于隱私計算的智能風控體系1)個人信貸智能風控個人信貸風控方面,借助隱私計算技術,融合業務欠費情況、運動偏好、理財偏好、工作穩定程度、閱讀偏好等運營商數據、銀行數據、企業數據等多方數據,隱 私 計 算 應 用 白 皮 書(2021)29/中 國 移 動 信 息 技 術 中 心能夠在實現在保障數據安全的前提下進行數據融合,解決個貸業務場景中薅羊毛、信用黑戶、多頭借貸、貸中逾期、壞賬、呆帳等風險環節的監測及預警。通過個人信貸智能風控,為銀行、信貸、電信、保險等行業的業務活動提供強有力的個人客戶風險防控保障。2)小微企業信貸智
78、能風控如圖 17 所示,通過引入企業法人歸屬地偏差、政企業務欠費情況、號碼活躍度、交往圈穩定情況、信用違約信息等運營商側標簽數據,助力銀行準確識別小微企業集群背后的復雜關系鏈條和欺詐風險,構建安全、高效的智慧風控平臺,提升銀行整體風控水平,助力實現銀行小微企信貸業風險識別的精準化、身份核驗手段的多樣化、提供融資服務的差異化,為銀行進行企業信用評價和風險防范提供輔助依據。同時,在數據使用過程中通過采用隱私計算技術進行多方聯合統計、聯合模型訓練及聯合預測,保障各方原始數據不出擁有方本地;按用法、用量進行數據定向授權管理等功能保證數據不會被第三方緩存、轉售或二次使用。圖 17 基于隱私計算的企業風控
79、體系5.2.2 銀行精準營銷實踐1)銀行線上數字化營銷據銀行業協會數據顯示,互聯網的快速發展正在給銀行業的發展帶來巨大的擊:在“互聯網+金融”時代下,銀行如何借勢突圍,高效精準的實現展業,是實現銀行業賌持續增長的基礎,也已成為銀行必須要積極應對的問題。2020年的疫情,極大地推進了銀行的數字化轉型,線下業務和服務都可能的加速轉向線上化、移動化。然而,有些銀行僅僅將線下的營銷方法到了線上,缺乏一套有效的整體規劃和端到端實施方案。具體而言,國內銀行在數字化營銷上存在以下痛點:第一,篩選用戶難,不夠精準化。銀行?然?擁大量客戶靜態數據,但這些數據往往相對?后,無法用于準確挖隱 私 計 算 應 用 白
80、 皮 書(2021)/30中 國 移 動 信 息 技 術 中 心掘客戶需求,導致用戶營銷的方式主要表現為全方位的無目標,?也取得了一定的效果,但效率低下,成本高;第二,觸達用戶難。銀行產品、渠道和營銷?然遷移到線上,但限于用戶動態數據的缺失,銀行在何時和何種方式將營銷內容及時觸達用戶,獲取最?的用戶反,依然缺少對應的手段;隱私計算技術在保障大數據交換時信息安全、保護個人數據隱私、保證合法合規的前提下,根據銀行目標客戶定位,融合銀行自有數據和運營商數據,如運營商業務消費等級、網?偏好、用戶?度信息、運營商信用評價等,幫助銀行構建更加全面的客戶畫像,快速準確的篩選目標客群,減少無效的營銷投放,提高
81、營銷精準度,節約大量成本。如圖18 所示。圖 18 基于隱私計算的廣告推薦系統通過運營商的用戶觸達和數據網關等核心能力,可以根據運營商用戶歷史活躍數據的支持以及個性化觸發能力,智能決策最合適的用戶觸達時機和方式,解決用戶觸達難的問題,如圖 19 所示。圖 19 基于用戶畫像篩選廣告推薦客戶通過聯合篩選、聯合建模、聯合預測等實現運營商和銀行平臺 B 端、C 端數據“虛擬打通”,從尋客、觸達、獲客到留存的全鏈路優化。在安全融合運營商數據價值后,優化銀行的廣告投放ROI,提升客戶留存率,輕松實現精準營銷,如圖 20 所示。隱 私 計 算 應 用 白 皮 書(2021)31/中 國 移 動 信 息 技
82、 術 中 心圖 20 基于隱私計算的精準推薦全流程2)信用卡流失用戶挽留當前信用卡市場競爭激烈,客戶流失嚴重。研究表明,客戶流失率減少 5%,能給銀行帶來 30%-85%的利潤增長,發展一個新客戶的成本是挽留一個老客戶成本的5-7 倍,而挽留客戶成功率是發展新客戶成功率的 16 倍。因此,銀行在發展新客戶的同時,必須著手對存量客戶流失進行管理。即將流失的用戶通常在銀行的行為信息急劇減少,僅使用銀行數據制定的專家規則或模型難以準確判斷即將流失客戶是否具備挽回的價值。針對信用卡用戶流失問題,可以使用銀行內部數據和運營商數據檢測該賬戶用戶是否有流失風險,并且根據用戶的行為信息判斷用戶價值,對流失可能
83、性較大的高價值用戶采取一定的挽留措施。銀行側數據能夠反映客戶的活躍度發展趨勢,而運營商業務消費等級、超前消費意愿、理財意愿、消費活躍程度等數據能夠反映客戶近期是否仍有信用卡使用意愿。圖 21 基于隱私計算的精準推薦全流程如圖 21 所示,采用隱私計算的方式安全打通銀行和通信運營商的數據,從而對客戶當前情況進行更加精準的分析。使用雙方的相關數據進行聯合建模,預測用戶是否存在流失的風險,并對用戶進行打分排序,精準定位出高價值關鍵客戶群體,幫助客戶經理制定針對性的挽回及營銷策略,預防高價值客戶的流失,降低銀行的損失,節約銀行開發客戶所花費成本。5.2.3 保險智能風控實踐隱 私 計 算 應 用 白
84、皮 書(2021)/32中 國 移 動 信 息 技 術 中 心車險保費收入占中國財險份額比例約 50%-60%,是中國財險絕對主力構成。作為金融服務產品,其面臨著高賠付、高頻率、趨于飽和的業務特性,其核心為出險率和理賠成本的博弈。而目前在商業車險改革進一步深化的行業背景下,進一步加強車險風險管理,運用前沿數據融合技術手段,通過數字化智能方式,提高保險公司車險風控管理的綜合能力,將是目前車險風險管理發展的大趨勢。通過運用前沿技術手段,依托大數據、AI 機器學習、知識圖譜等技術,保險公司可以圍繞運營商數據、車管局數據及保險自有數據等多方數據形成更加全局的數據智能,彌補保險公司自有數據不足問題。但傳
85、統的通過匯集明文數據進行數據分析和價值挖掘的方式,隨著用戶隱私保護和數據安全的要求和限制越來越嚴格,面臨著諸多問題。為化解數據融合和數據隱私安全的矛盾,提升車險風險管理效率,中國移動、保險公司和車輛管理部門多方合作,采用多方隱私計算、聯邦學習技術,針對車險高賠付場景人群、人傷賠付高頻場景人群進行風險預警評估。針對保險業存量車險用戶風控需求,梳理三大項業務場景,分別為網約車車主識別場景、出險高風險行為人群識別場景、車險用戶畫像服務,中國移動具備海量連續性數據、多元化標簽數據、豐富大數據處理經驗,可助力保險業通過前置風險管控手段,降低高頻賠付業務占比。綜合使用多方安全計算、聯邦學習等多種隱私計算技
86、術。通過隱私計算平臺實現對業務場景執行任務的總體調度及加密后數據的邏輯運算,各業務參與方通過本地部署的明文計算引擎及數據加解密模塊接入 MPC 計算平臺,實現本地明文數據不出域,僅輸出密文計算因子參與業務邏輯運算,如圖 25 所示。圖 25 基于隱私計算的保險智慧出險計算框架本系統提供多方安全計算及聯邦學習等一系列隱私計算技術,在保險風險評估系統中安全融合運營商及車管局的相關數據維度,在傳統車主貸風險評估方面,運用保險公司已有的用戶歷史投保、出險記錄等數據,同時結合運營商自駕游偏好情況、夜間出行偏好、出行移動范圍等級、區域速度等數據,結合車管局相關個人違章信息、高風險道路位置區域信息、出險檢測
87、站等數據,進行聯合建模,實現對車主類型識別、出現概率評估等業務場景,如圖 26 所示。隱 私 計 算 應 用 白 皮 書(2021)33/中 國 移 動 信 息 技 術 中 心圖 26 基于隱私計算的保險智慧出險業務框架本項目的實施將幫助保險公司在已趨于飽和的車險風控業務中實現多維度數據聯合建模,既保障了各方數據安全,又增強了建模所用數據維度,豐富其對投保用戶的價值、風險、潛力等多維度評分矩陣,使保險公司能夠在充分了解投保用戶的出險概率的前提下,實現保險行業的業賌及品質提升。5.2.4 證券沉默用戶激活證券賬戶沉默用戶是指交易活躍度較低且手續費低于一定閾值的客戶,這些客戶?然為券商注冊用戶,但
88、并不能為券商帶來真實收益。隨著股票投資市場的繁榮發展,券商整體客戶數量逐年上升,沉默用戶的數量也不斷累加。部分沉默用戶仍具有投資意愿,挖掘這部分客戶的潛在價值是券商客戶運營領域需要解決的關鍵問題之一。針對手續費低于一定閾值的證券賬戶,使用券商內部數據和運營商數據檢測該賬戶用戶是否仍有理財投資意向。券商內部數據包含用戶的資產、收入及交易記錄,可以反映用戶的交易趨勢和客戶價值。運營商數據包含用戶投資愛好者、財經關注等級、消費活躍度等數據,可以反映用戶的投資意愿。雙方數據交叉分析即可得出該用戶是否有激活為活躍客戶的潛力和價值。圖 27 基于隱私計算的券商沉默用戶激活業務框架如圖 27 所示,采用聯邦
89、學習的方法,使用通信運營商的數據補充券商本地數據的不足,從而對客戶進行更精準的分析。使用雙方的相關數據進行聯合建模,檢測各沉默用戶個體是否仍存在理財投資的意向,并針對客戶價值進行打分排序,精準隱 私 計 算 應 用 白 皮 書(2021)/34中 國 移 動 信 息 技 術 中 心區分用戶圈層,定位出營銷投入產出比最高的沉默用戶群體,以支撐券商客戶運營團隊進行觸達。5.3 智慧政務治理實踐5.3.1 電信反欺詐實踐電信詐騙是“以非法占有為目的,利用電話、短信、聊天工具等手段,與被害人進行遠程接觸,通過虛構事實、隱瞞真相或者其他欺騙性手段,騙取他人財物數額較大的犯罪行為”。隨著現代通信和移動支付
90、技術的迅猛發展,不法分子欺詐手法不斷升級,單次欺詐行為貫穿第三方聊天工具、運營商、銀行等多個行業及領域。電信詐騙對象不再是對社會資訊相對缺乏的中老年人,而是高度依賴互聯網的年輕人。針對電信反欺詐識別的聯邦模型,將運營商的用戶靜默等級、交際圈穩定程度、運營商業務量變化情況等數據、公安的詐騙號碼庫進行聯合建模,實現電信欺詐聯合預測。同時,結合已有的欺詐識別策略庫,輸出電信詐騙的名單。通過此名單,可以電話短信通知受害人,以降低財產損失,如圖 22 所示。圖 22 基于隱私計算的電信反欺詐系統在該場景中,同時也可結合區塊鏈技術,為如何確定多參與方的貢獻,如何進行事后的數據安全審計,提供有效的激勵機制與
91、安全審計方案。中國移動采用自有的 CMBaaS(China Mobile Blockchain as a Service)區塊鏈平臺,打造“區塊鏈+聯邦學習”的多方數據共享模型訓練引擎,將 AI 模型訓練、推理過程和結果上鏈,結合聯盟鏈去中心化、開放、防篡改的特性,保證多方聯合建模和預測過程中原始數據不出域,僅通過交互加密的計算因子,且整個訓練和預測過程可溯源、可監控、可審計、可信賴。運營商反欺詐識別的聯邦模型梯度上鏈流程,主要是:聯邦參與方進行數據特征提取和本地模型訓練,模型梯度參數通過區塊鏈上鏈服務進行數據上鏈,經過 CMBaaS 的智能合約判斷,并通過區塊鏈共識算法后,生成新的區塊,如圖
92、 23 所示。隱 私 計 算 應 用 白 皮 書(2021)35/中 國 移 動 信 息 技 術 中 心圖 23 基于隱私計算的反欺詐模型梯度上鏈訓練流程基于區塊鏈的聯邦學習,所有的交互都在同態加密和哈希編碼技術上實現,移動和公安方并沒有數據的直接傳輸,僅交互加密的模型中間參數,且交互的動作上傳至區塊鏈,確保了數據融通的安全性和審計性,如圖 24 所示。圖 24 基于隱私計算的反欺詐算法框架5.3.2 智慧人口流動分析伴隨著當前城市化進程的不斷推進,城市規模擴大迅速,城市內人口的數量增長迅猛,各級城市政府單位面臨著巨大的管理壓力,亟需推動城市人口治理的創新改革。黨的十九屆四中全會首次將數據增列
93、為生產要素,中共中央、國務院印發的關于構建更加完善的要素市場化配置體制機制的意見將數據列為五大核心要素之一。充分發揮數據基礎性資源和戰略性資源的作用,探索以數據為關鍵要素的新增長方式,對政策指導和經濟發展具有重要意義。以聯邦學習為技術核心,打造中國移動和人社廳的跨域安全聯合建模能力,在滿足用戶隱私保護、數據安全和政府法規的要求下,基于運營商用戶的業務使用數據、位置數據和山東省人社廳的標簽數據,建立大學生、農民工、企業勞動力等群體態勢分析場景,為人社廳人口治理和政策優化提供有力支持,如圖 30 所示。隱 私 計 算 應 用 白 皮 書(2021)/36中 國 移 動 信 息 技 術 中 心圖 3
94、0 人社廳+運營商隱私計算建模流程方案在保障數據交換時的信息安全、保護終端數據和個人數據隱私、保證合法合規的前提下,在多參與方、多節點之間開展高效率計算。在此體系下,構建人口流動監測綜合解決方案,通過 Web 端以及大屏端,展示人口監測應用成果,將通過人工智能手段分析、數據挖掘出的大學生、農民工等群體流動數據,以圖表等可視化形式直觀展現并發布??蓮暮暧^和微觀多角度了解全省流動情況,對政策優化起到一定的指導決策作用,如圖 31、32 所示。圖 31 基于隱私計算的智慧人社全流程圖 32 基于隱私計算的智慧人社分析系統5.3.3 公共安全態勢感知基于運營商公安聯合實驗室,隱私計算平臺為公安系統提供
95、模型上傳、運行、狀態查詢和結果集查詢四個接口。在保障公安隱私數據沒有泄漏風險的前提下,利用安全計算技術實現對目標群體聚集地的統計分析。通過目標群體樣本、交往圈、位置特征等信息,完成區域風險評估模型計算,利用地圖上顏色深淺表示事件發生隱 私 計 算 應 用 白 皮 書(2021)37/中 國 移 動 信 息 技 術 中 心概率高低,使公安部門更清晰的了解整體情況,達到預防群體性事件發生和管控的目的。該場景預警范圍全面覆蓋某市,必要時可擴展至全省范圍預警。為了保護數據隱私、滿足合法合規的要求,中國移動運用聯邦學習方法解決數據孤島問題。聯邦學習過程分為自治和聯合兩部分,如圖 33 所示。圖 33 基
96、于隱私計算的公共安全態勢感知計算框架在公共安全態勢感知場景中,基于安全求交技術,在公安、運營商數據分別不出域的情況下安全融合雙側數據,精準獲取地圖區域態勢感知信息。公安側以私有云這種輕量級方式參與雙方交互運算,最終以 API 接口或圖層方式進行結果調用,在底層運用隱私計算新技術的同時保留公安側原有用戶習慣,有效助力社會穩定維護工作,如圖 34 所示。圖 34 基于隱私計算的公共安全態勢感知業務場景5.4 醫療精準推薦實踐健康導航服務平臺能夠提供預約掛號、排隊叫號、報告查詢、體檢預約、在線藥房等服務。平臺運營方一直在探索互聯網運營方式,但傳統的推薦營銷手段因受用戶數據量限制,營銷效果欠?。運營商
97、省分公司擁有海量用戶的人生階段情況、工作時長、夜間活躍程度等維度數據,而傳統方式平臺運營方無法有效使用運營商的數據價值,新增場景的存量用戶客群推薦、新用戶的適用場景推薦等推薦模型預測效果不?。因此,亟需通過技術手段在保障雙方數據隱私的情況下,進行聯合模型構建,提升平臺推薦模型的準確性。通過引入聯邦學習技術,在多方本地化部署的基礎上,服務端、客戶端及協調隱 私 計 算 應 用 白 皮 書(2021)/38中 國 移 動 信 息 技 術 中 心方通過網絡互聯進行聯合建模,實現數據不出庫、不共享數據,有效解決數據孤島問題。聯合模型充分利用運營商省分公司大數據優勢和健康導航平臺行業經驗,建設健康導航平
98、臺APP用戶彈窗問診功能推薦,以提高App推薦的精準性,如圖28所示。圖 28 基于隱私計算的醫療精準推薦全流程實現邏輯,健康導航平臺根據業務需求發起訓練,然后經協調方和運營商做數據對齊,完成后開始與運營商交換參數并訓練模型。具體步驟如下,如圖29所示:圖 29 醫療精準推薦訓練流程運營商與省衛健委共同打造省級統一醫療健康服務平臺,能夠實現問診、體檢等場景的精準推薦。同時打造“場景?啟動模塊”、“用戶?啟動模塊”解決對新增場景的用戶群推薦,和新增用戶的業務場景推薦等問題,有效提升就醫用戶滿意度。5.5 其他行業隱私計算實踐5.5.1 汽車精準營銷實踐自 2018 年以來,中國汽車銷量連續 3
99、年遭遇下跌,行至 2021 年,汽車運營模式已經“不得不變”;傳統模式曾大獲成功,但到了存量時代,傳統獲客線索發生退化、單車獲客成本上漲、運營生態悄然改變,企業應該尋找到數字化營銷轉型的最優路徑,避免有限的財力與精力被浪費。隨著汽車行業的數字化、智能化發展,高質量的汽車用戶使用行為數據成為汽車行業可持續發展的核心要素。但是由于汽車隱 私 計 算 應 用 白 皮 書(2021)39/中 國 移 動 信 息 技 術 中 心行業存在數據孤島、脫敏后的數據隱私安全性和數據監管等問題,汽車行業數據在多方機構之間無法完成數據互通共享,主要表現在潛在客群群體無體系、對客戶業務訴求不明確、客戶體驗、客戶失聯無
100、追蹤、獲客效果轉化無大增長。為此,中國移動依托在物聯網、云計算、人工智能、大數據等方面的技術積累,打造汽車產業開放性的連接生態,聯合多方融通數據建立共享的縱向聯邦計算平臺,最大化的保障數據安全,最終實現多方安全計算技術與汽車營銷場景的深度融合,為汽車行業提供專業的大數據技術服務支持。通過?車意向預判模型,了解客戶意向強度、需求量以及推薦價位預估等,對已有線索進行快速篩選,圈定高質量種子人群。綜合多維度用戶特征進行分析,聯系客戶消費能力、常駐城市、娛樂偏好、人生階段等維度數據,基于多平臺多渠道多數據進行聯合建模、聯合計算,使得有效訓練數據顯著增加,利用持續迭代的深度學習算法模型,從海量預選人群中
101、提取高意向目標客群并提供個性化服務,如圖35 所示。圖 35 潛在客戶精準畫像運營商與車企基于隱私計算平臺,原始數據在本地計算與存儲,最終根據車企客戶需求,選擇合適觸達方式進行目標客戶觸達,如圖 36 所示。圖 36 基于隱私計算的汽車智能營銷計算框架運用隱私計算打破數據孤島,聯合建模釋放商業價值。一方面,挖掘潛在新能源、SUV、MPV 等車型潛在客戶、高價值客戶,為企業提供更優的獲客方案。另一方面,也為車企存量用戶的保有運營提供策略,幫助車企進行其客戶的分層管理,助力車企產品運營與優化。隱 私 計 算 應 用 白 皮 書(2021)/40中 國 移 動 信 息 技 術 中 心6.隱私計算發展
102、趨勢展望隱私計算技術正處于蓬勃發展的階段,具有廣闊的應用前景和巨大的潛在價值,但也存在著技術及商業化發展等方面的難題,需要產業共同協作解決。中國移動倡導成立數據要素化發展技術與產業聯盟,希望凝聚業界應用、服務、技術、標準、認證相關企業或實體的力量,共同打造隱私計算應用生態,促進隱私計算技術及產業的快速發展。聯盟鼓勵各方積極參與,共同解決技術發展難題、建立互聯互通標準、探索數據合作的新模式以及公平可信的激勵機制。6.1 政策展望1)加快制定和完善國家產業發展政策和法律法規隱私計算技術是保障數據有序合規流通協作的基礎技術,需要通過制定和完善國家產業發展政策,引導和促進行業間形成合作共識,有效激發行
103、業活力并推動技術成熟和廣泛應用;同時需要積極制定相關的法律法規,明確數據權屬,按照不同角色定位來界定各個參與方的責權范圍,規范數據合作行為,為數據跨行業合作和流通以及聯邦學習技術發展提供制度和政策保障。2)加強隱私計算的數據安全保護與依法合規為降低隱私計算技術在應用過程中出現的數據泄露風險和避免違規使用個人信息行為的發生,在開展隱私計算應用過程中要貫徹落實國家數據安全法、個人信息保護法等相關法律法規要求,不斷完善內部數據的全生命周期管理,建立健全產品上線前的安全評估機制,以技術加管理的方式,從設計方案、模型構建、密碼算法、責任約定、安全協議等多角度、多方面開展安全評估,加強數據的安全性保護。同
104、時,要嚴格落實用戶知的知情同意原則,對用戶數據處理前以明示的方式向用戶告知個人信息處理的目的、方式和方法,在經用戶同意后方可開展用戶信息的建模分析,確保用戶信息使用的合規性。3)建立評測認證機制和相應機構安全和隱私保護是隱私計算技術可用的基礎,通過引入同態加密、秘密分享等安全技術,制定節點之間的模型參數交互協議,在節點間建立了相對比較完善的建模流程。但目前業界缺乏可驗證、可測量的評測體系和方法來評估協議的一致性,確保加密的模型參數不包含敏感信息且沒有原始數據任何形式的泄露。需要建立一套針對隱私計算技術及相關產品的評測指標體系,并在此基礎上建立評測認證機制并由相應的機構承擔評測和認證工作。隱 私
105、 計 算 應 用 白 皮 書(2021)41/中 國 移 動 信 息 技 術 中 心4)構建分級分類的隱私計算產品及平臺的認證體系目前業界聯邦學習的實現框架、核心算法和交互協議等方面存在很大差異,為聯邦學習系統安全帶來巨大挑戰。我們可以通過在國內外的標準化組織中積極推進、制定和建立聯邦學習安全相關的標準體系,詳細定義聯邦學習的各項安全指標及其具體技術要求,同時,結合實際應用場景,借鑒信息系統安全等級保護體系、要求及定級指南,制定聯邦學習系統的分級分類體系要求,詳細定義每個級別具體的量化指標,并據此建立聯邦學習系統的安全能力分級標準。在制定聯邦學習安全相關標準的基礎上,進一步制定各項安全指標的評
106、估、評測方法,據此建立起針對聯邦學習系統的安全評估方法和評測認證機制,推動專業化機構承擔評測認證職能,為業界的聯邦學習系統和產品進行評測與認證;并以評測報告與認證標識作為聯邦學習系統和產品安全可信的重要參考依據。6.2 技術展望隱私計算技術已經在數據安全交互和協同中發揮了積極的作用,得到了快速發展和越來越多的應用。面向未來更加廣泛深入的規模應用和構建良好產業生態,隱私計算技術還需要在提升效率、降低開銷、開展安全保障的評估和評測、擴展適配更多算法和協議、實現不同框架的兼容和互聯互通等方面進行深入研究,促進隱私計算技術的進一步成熟。1)促進不同技術框架和產品之間互聯互通針對目前業界隱私計算技術框架
107、眾多,彼此無法互通協作的突出問題,迫切需要解決不同技術框架和產品之間的互聯互通問題。一個機構無需部署多個系統,而是通過一套服務,與外部各種機構進行大數據協同的連接合作。對于企業或實體,研究跨行業跨平臺的轉換和對接技術,實現最大程度的互聯互通,讓各方基于數據實現更好的合作。2)推進國際國內隱私計算技術的標準化當前,國內外眾多標準化組織已開始制定或發布以框架和功能為主的隱私計算相關技術標準。相關技術標準已經開始從基礎的功能標準向產品性能、安全性等方向拓展,加速構建更加完善的隱私計算技術標準體系。中國移動已牽頭或參與在TMF、IEEE 以及國內的信安標委、CCSA 等標準化組織設立 13 個標準,重
108、點圍繞隱私計算在技術框架的互聯互通、安全評估與測試、數據價值評估和激勵機制以及未來通信網絡中的應用場景等方面開展標準制定工作。隱 私 計 算 應 用 白 皮 書(2021)/42中 國 移 動 信 息 技 術 中 心6.3 應用展望1)探索更多領域的特色應用隱私計算應該在行業內與行業間進一步豐富和擴展應用案例。隱私計算在行業內,可以打破跨企業跨部門的數據協同壁壘,融合更多的樣本數據或特征數據建立模型,提升模型效果。隱私計算在不同行業數據協同的產業場景中的實際落地,給技術研究和演進發展提供了切實有效的需求驅動和方向指引,產業界的不同行業和企業需要積極挖掘業務場景、研發基于隱私計算的跨行業跨領域的
109、數據應用,不斷豐富應用案例。2)與相關領域新技術深度融合發展隨著隱私計算技術得到越來越多的關注,其與當前各領域新技術融合發展的趨勢將更加明顯。比如:通過將隱私計算技術與區塊鏈技術進行融合,可以有效解決數據合作過程的可信和可追溯,進一步增強了整個技術方案的安全性;通過將邊緣計算技術與隱私計算技術融合,可以將具備安全和隱私保護特性的能力部署在邊緣計算節點上,增強了邊緣側的業務擴展能力和安全保障能力;通過將隱私計算技術引入 5G+網絡甚至未來 6G 網絡的業務場景中,將進一步拓展未來 DICT 領域的業務發展空間。3)建立數據價值評估和激勵機制,探索可行的商業模式由于各參與方數據分布的不均衡,數據價
110、值與數據貢獻也不相同。如何保障各方的利益,實現參與方數據變現,是構建以隱私計算為基礎的數據流通生態以及實現商業化運作的關鍵。需要積極研究數據擁有方對聯合模型的參與度和貢獻度的評估方法,建立公平合作、共享共贏的激勵機制,將有利于吸引更多數據擁有方參與隱私計算,從而建立起健康可持續發展的跨行業數據流通生態;同時積極探索和驗證“參與貢獻數據價值,平等分享數據獲益”的良性可持續發展商業模式,從而催生跨界業務創新,構建基于大數據的產業合作生態,共同促進技術成熟和產業發展。中國移動愿與合作伙伴一起在隱私計算技術和應用領域持續探索和創新,拓展更多的業務場景,提供更豐富的應用解決方案,解決應用落地中的技術、合
111、作及商業等層面的問題,共同推進數據要素價值的充分發揮和市場化發展,構建和完善產業生態,為國家數字化轉型升級和數智化創新發展保駕護航。隱 私 計 算 應 用 白 皮 書(2021)43/中 國 移 動 信 息 技 術 中 心參考文獻1.李鳳華,李暉,賈焰等,隱私計算研究范疇及發展趨勢。通信學報第 37 卷第 4 期,2016年4月2.彭南博,王虎等,聯邦學習技術及實戰。中國工信出版集團電子工業出版社,2021年3月3.Beimel A,Secret-Sharing Schemes:A Survey.International Conferenceon Coding and Cryptology
112、2011:11-464.ShamirA,HowtoShareaSecret,Commun.ACM,22(11):612-613,November 19795.Rivest R L,Adleman L,Dertouzos M L,On data banks and privacyhomomorphisms.Foundations of Secure Computation,1978:169-1796.Michael O.Rabin,How to Exchange Secrets with Oblivious Transfer,Technical Report,(Harvard Universit
113、y),20057.Andrew C.Yao,Protocols for Secure Computations.23rd AnnualSymposium on Foundations of Computer Science(sfcs 1982)8.楊強,劉楊等,聯邦學習。中國工信出版集團電子工業出版社,2020年4月9.Dwork C,McSherry F,Nissim K,and Smith A,Calibrating Noise toSensitivity in Private Data Analysis.Third Theory of Cryptography Conference(TC
114、C 2006)March 200610.楊強,黃安埠等,聯邦學習實戰。中國工信出版集團電子工業出版社,2021年5月11.國家工業信息安全發展研究中心中國隱私計算產業發展報告(20202021)12.隱私計算聯盟、中國信通院云大所隱私計算白皮書(2021年)13.中國移動通信有限公司研究院,聯邦學習技術發展與應用白皮書,2021年5月14.來源于https:/ 私 計 算 應 用 白 皮 書(2021)/44中 國 移 動 信 息 技 術 中 心17.來源于https:/ X,Zheng H,Dou Z,et al.A novel privacy-preserving federatedgenome-wide association study framework and its application in identifyingpotential risk variants in ankylosing spondylitisJ.Briefings in Bioinformatics,2020,22(Suppl 3).