《隱私計算聯盟:隱私計算通信應用研究報告(2022年)(40頁).pdf》由會員分享,可在線閱讀,更多相關《隱私計算聯盟:隱私計算通信應用研究報告(2022年)(40頁).pdf(40頁珍藏版)》請在三個皮匠報告上搜索。
1、 隱私計算通信應用 研究報告(2022 年)隱私計算聯盟 2022 年 12 月 版權聲明 本報告本報告版權屬于版權屬于隱私計算聯盟、中國信息通信研究院云計算隱私計算聯盟、中國信息通信研究院云計算與大數據研究所與大數據研究所,并受法律保護,并受法律保護。轉載、摘編或利用其它方轉載、摘編或利用其它方式使用式使用本報告文字或者觀點的,應本報告文字或者觀點的,應注明注明“來源:來源:隱私計算聯隱私計算聯盟、中國信息通信研究院云計算與大數據研究所”盟、中國信息通信研究院云計算與大數據研究所”。違反上述。違反上述聲明者,本聲明者,本院院將追究其相關法律責任。將追究其相關法律責任。編 寫 委 員 會 主要
2、編寫單位主要編寫單位(排名不分先后):隱私計算聯盟、中移動信息技術有限公司、聯通數字科技有限公司、天翼電子商務有限公司 參與編寫單位參與編寫單位(排名不分先后):深圳市洞見智慧科技有限公司、京東科技信息技術有限公司、杭州趣鏈科技有限公司、杭州锘崴信息科技有限公司、上海零數眾合信息科技有限公司、同盾科技有限公司、浙江吉利數字科技有限公司、中興通訊股份有限公司 編寫組主要成員編寫組主要成員(排名不分先后):王思源 閆樹 袁博 楊靖世 賈 軒 白玉真 童錦瑞 宋佳楠 魏 凱 姜春宇 呂艾臨 畢劍鋒 張 帆 茹志強 崔玲龍 閆 龍 李大中 章 慶 徐 潛 余文青 薛 婧 楊 輝 楊 博 孫中偉 徐 靜
3、 陸一文 唐丹葉 李 幟 蘭春嘉 楊 珍 黃翠婷 陳 濤 李晨龍 吳 凱 張再軍 黃 崢 隱私計算通信應用研究報告(2022 年)I 前 言 我國高度重視數據安全流通技術的發展應用,在過去的一年內多個部門密集出臺了一系列戰略、規劃和政策,強調數據要素流通的重要性,提出數據安全流通的建設方案。通信行業為人與人之間的信息交流、傳遞提供了媒介,在信息化高速發展過程中積累了海量的通信數據,這些數據覆蓋全面、特征豐富、真實性高、數據連續性高,蘊含著極高的應用價值和應用潛力。然而,通信數據中也包含了大量敏感信息,在現行的 網絡安全法、數據安全法、個人信息保護法等一系列法律法規要求下,傳統數據流通模式難以同
4、時兼顧數據價值釋放與數據安全保護。隱私計算技術作為保障數據安全流通的有效方式,提供了“數據可用不可見”“數據可控可計量”的數據服務新范式,在保障數據安全前提下實現了數據流通效果,從而為需求方企業安全地獲取和利用外部數據提供了技術可能。以隱私計算技術為依托,推動通信行業數據與各行業共享賦能,可以在風險管控、營銷分析、態勢洞察等多個場景提供數據共享服務。在保證數據安全的前提下,充分發揮通信數據應用價值,助力各行業數字化發展實踐。隱私計算聯盟聯合通信運營商及業內相關技術企業共同完成了本報告的編寫工作。報告對隱私計算在通信行業的應用特性及典型場景進行全面梳理,深入挖掘潛在的創新應用場景,為行業發展提供
5、參考指引。隱私計算通信應用研究報告(2022 年)II 目 錄 一、隱私計算發展背景.1 二、隱私計算通信應用特性.2(一)通信數據特征及價值.2(二)隱私計算通信應用特性.4 三、隱私計算助力通信數據價值釋放.6(一)賦能金融.6(二)賦能政務.16(三)賦能其他行業.22 四、通信行業隱私計算創新應用.26(一)智慧城市.26(二)云邊協同.28(三)算力網絡.30 五、總結與展望.32 參考文獻.34 隱私計算通信應用研究報告(2022 年)1 一、隱私計算發展背景 近年來,數字經濟已成為推動我國經濟增長的主要引擎之一。國內數字經濟規模由 2017 年的 27.2 萬億元增至 2021
6、年的 45.5 萬億元,總量穩居世界第二,年均復合增長率達 13.6%。在數字經濟時代下,萬物互聯,各行各業的一切活動和行為都將數據化。2019 年 10 月,黨的十九屆四中全會首次從國家發展戰略高度,將“數據”定位為新型生產要素。2020 年以來,中央政策文件中多次強調培育數據要素市場,推動數據要素市場化配置?,F如今,數據要素市場建設已成為政策布局和產業發展的關注重點,是促進數據自主有序流動、提高配置效率、發揮數據價值的關鍵環節。然而,數據中往往含有大量敏感信息,大規模數據的收集、共享和發布等操作存在泄露隱私數據的風險,給用戶帶來困擾,甚至危及社會利益和國家安全。近年來,全球各地逐漸提出一系
7、列法律條例來管控組織機構對用戶隱私數據的使用,這讓以往跨機構直接共享數據的計算模式不再可行。聚焦國內動態,僅 2022 年第一季度,國家層面就發布了多項政策來對個人隱私數據采集、傳輸、使用、監管等多方面進行了規定。2022 年 1 月 12 日國務院發布并實施的 “十四五”數字經濟發展規劃中明確指出,要進一步強化個人信息保護,規范身份信息、隱私信息、生物特征信息的采集、輸出和使用,并且要求加強對收集使用個人信息的安全監管能力。中國人民銀行也正式發布了 個人金融信息保護技術規范,從安全技術和安全管理兩個方面,對個人金融信息保護提出了規范性要求。此外,近年來我國密集出臺隱私計算通信應用研究報告(2
8、022 年)2 實施的 中華人民共和國網絡安全法、中華人民共和國數據安全法,中華人民共和國個人信息保護法等數據安全保護相關法案,都為隱私計算技術的立法和監管支持奠定了堅實的基礎。隱私計算技術作為保障數據安全流通的有效方式,乘時乘勢高速發展,已逐漸成為促進數據要素跨域流通和應用的核心技術。產業需求快速增長,隱私計算走出學院派與實驗室,廣泛與行業應用場景相結合,賦能數據價值的安全、合規流轉。各類隱私計算廠商也如雨后春筍一般不斷涌現,激發了隱私計算技術可用性的快速提升。通過對原始數據加密、去標識化或假名化處理,計算過程及結果只傳遞經處理后的數據,隱私計算技術實現了原始數據不出域,保證了原始數據持有權
9、不變且不受損,僅讓渡了數據使用權,實現了數據的持有權和使用權相互分離,保障了數據主體的合法權益。另一方面,隱私計算通過限定數據用法、用量,解決了原始數據無限復制、盜用、濫用的問題。在保護數據要素流通中各參與方的合法權益的同時滿足了數據要素安全流通使用的需求,確立了數據產權配置的全新路徑,逐漸成為促進數據要素跨域流通和應用的核心技術,廣泛應用于金融、政務、通信、醫療、能源等諸多領域。二、隱私計算通信應用特性(一)(一)通信數據特征及價值通信數據特征及價值 我國通信行業在高速發展過程中積累了海量的通信數據,這些數據覆蓋全面、特征豐富、真實性高、數據連續性高,蘊含著極高的應用價值和應用潛力。在數據覆
10、蓋范圍方面,我國目前手機持有率高達隱私計算通信應用研究報告(2022 年)3 96%,截至 2022 年 7 月底,三家基礎電信企業的移動電話用戶總數達 16.72 億戶。由此可見,通信運營商的海量數據有著極高的用戶覆蓋度。在數據采集深度方面,截至 2022 年 8 月底,中國移動互聯網用戶數達到 14.59 億戶,用戶日均使用時長達 7 小時,月均使用 218.1小時。用戶產生的通信數據不僅包括用戶基本信息、通話行為,隨著手機終端在移動互聯網中的高頻使用,通信數據進一步覆蓋到用戶的上網行為、消費行為、生活軌跡等各個維度。在數據真實性方面,我國當前已全面實施了手機號碼實名制,通信運營商可采集到
11、的通信數據具有較高的真實性,能夠客觀地反映出用戶各方面的特征。在數據連續性方面,通信運營商采集的通信數據記錄周期長、留存時間長,覆蓋了用戶從入網到離網全生命周期的海量數據。結合通信數據在各應用場景中落地的具體情況,對通信數據做出了以下的分類和梳理(如圖 1)。根據數據源的不同可以將通信數據劃分為用戶數據和業務數據兩大類型。用戶數據包括了 IP 地址、入網設備信息等終端信息,姓名、年齡、生日等實名身份資料,區域人口實時密度、生活軌跡等位置數據,網站及 APP 瀏覽記錄、瀏覽次數、瀏覽時長等上網行為數據,通話和短信記錄、常用聯系人等社交關系數據,電話、網絡繳費等通信消費數據。業務數據包括了寬帶、手
12、機等業務套餐數據,客戶咨詢與客服回復等客服數據,企業入網信息等政企數據。隱私計算通信應用研究報告(2022 年)4 圖 1 通信數據分類及用途 通信數據可被廣泛應用于金融、政務、互聯網、醫療等行業,豐富的數據特征有助于企業構建更加完善的用戶畫像,增強風控、營銷等業務模型的準確性,進而提升實際業務效果。然而,上述通信數據中包含了部分個人敏感信息,如用戶身份信息、位置數據、上網行為和政企數據等,根據現行的網絡安全法、個人信息保護法、數據安全法 等法律法規的相關要求,這些信息不能直接明文參與計算。因此,在傳統數據流通共享模式下,難以同時兼顧數據價值釋放與數據安全保護。隨著隱私計算技術的成熟,針對這一
13、問題也開始逐漸有了新的解決思路。(二)(二)隱私計算通信應用特性隱私計算通信應用特性 數據作為通信行業的關鍵性生產要素以及戰略資源,推動安全的通信數據市場流通使用,對推動社會經濟發展和滿足國家對于數據要數據源數據類型應用價值備注業務套餐聯合互聯網企業對內進行5G權益套餐精準營銷客服數據提供相關企業用于智能機器人、智能客服系統搭建政企數據給金融機構貸款提供企業征信信息終端信息身份信息位置數據人口流動密度測算,集合企業工商信息進行客流分析、商鋪選址;聯合CDC、公安部分用于疫情防控追蹤;上網行為數據衍生常用網站和APP等偏好信息的用戶畫像,聯合電商企業精準營銷通話、短信數據挖掘常用聯系人數據等社交
14、關系數據,用于反詐和人員關系知識圖譜構建,進而聯合互聯網精準推薦通信消費給金融機構貸款和理財產品提供用戶信用分析通話次數,通話時長,短信發送記錄用戶電話、網絡繳費用于信用分析聯合公安、人行、金融機構進行黑名單共享、通信反詐、金融風控;聯合其他運營商進行5G基站共建共享業務數據用戶數據數據細分寬帶、手機套餐客戶咨詢與客服回復企業入網信息ip,入網設備信息用戶實名身份證、性別等行為軌跡瀏覽的網站或APP,瀏覽次數,瀏覽時長等隱私計算通信應用研究報告(2022 年)5 素安全合規的要求具有重大意義。以隱私計算技術手段為依托,推動通信行業數據與各行業共享賦能,可以在風險管控、營銷分析、態勢洞察等多個領
15、域提供數據共享服務,發揮通信數據應用價值,助力各行業數字化發展實踐。隱私計算通信應用具有以下特點:應用數據豐富。通信數據中的營銷類相關指標,如網購偏好、消費意愿、理財產品購買偏好、消費等級及活躍程度等信息,能夠幫助其他企業構建完善的客戶畫像,同時提高營銷意愿評分判斷準確率。通信數據中的風控類相關指標,如用戶的通話行為數據、入網時長數據、信用分相關數據等,可以為金融信貸業務等提供良好風控指標數據,企業維度的信用違約信息、號碼活躍程度、歸屬地差異等,能夠幫助銀行判斷小微企業信貸風險。應用行業廣泛。通信數據常被采用對外賦能的形式,解決其他行業數據孤島問題。在金融領域中,銀行、證券、保險等金融機構都有
16、廣泛的通信數據聯合應用案例。在政務領域中,借助通信數據維度廣、數據跨度大等優勢,結合隱私計算技術,能夠在保障政務數據安全的基礎之上,有效發揮多方數據價值。此外,通信數據也被廣泛應用于互聯網、醫療、汽車等行業的實際業務場景中。應用場景集中。通信數據被各個行業廣泛運用,具體應用場景則相對集中,主要包括聯合風控、聯合營銷和態勢洞察分析等場景。聯合風控場景的通信數據應用,集中于信貸領域個體用戶或企業相關的聯合風控、反洗錢與反欺詐場景等;聯合營銷場景的通信數據應用,集中于潛在客戶喚醒營銷、金融信用卡客戶評分及觸達、營銷畫像構隱私計算通信應用研究報告(2022 年)6 建等場景;態勢洞察分析場景的通信數據
17、應用,集中于政務領域的群體聚集性統計、區域態勢信息分析等場景。應用效果顯著?;陔[私計算技術,通信數據在多個行業都有豐富的應用案例體現。在聯合風控場景中,充分應用通信運營商的底層數據字段,有效發揮多方數據融合價值,提升了風控模型的精準度。在聯合營銷場景中,借助通信運營商的大數據優勢,幫助企業共同構建更加全面的客戶畫像,快速準確地篩選目標客群,減少無效的營銷投放,提高營銷精準度,節約大量成本。三、隱私計算助力通信數據價值釋放 通信數據的應用集中于賦能外部行業領域。通信領域主要作為數據提供方參與隱私計算應用,基于隱私計算技術解決其他行業數據孤島問題,以“數據可用不可見”的方式為金融行業、互聯網企業
18、、政府公共機構等提供合規應用通信數據解決實際問題的途徑。在應用層面,業內開展了大量試點實踐,探索應用場景落地可行性并持續推進通信數據智能生態合作落地。通過聯合各行業積極探索隱私計算應用場景,不斷升級技術安全驗證方法及測試標準。在跨行業融合層面,以“數據可用不可見”的方式為金融、政務、電商等行業客戶實現與通信數據的融合協同應用提供數據安全保障。(一)(一)賦能賦能金融金融 1.銀行信貸智能風控 銀行信貸服務業務的核心是進行風險控制。風控管理覆蓋信貸業隱私計算通信應用研究報告(2022 年)7 務的貸前、貸中、貸后全流程,內容涵蓋了從貸前準入、信貸申請反欺詐、信貸額度審批、貸中風險監控、貸后風險預
19、警等。通過構建風控模型進行信貸申請的風險評估是銀行信貸服務業務風險控制的有效手段,風控模型的質量和成效將會對金融信貸業務的收益產生重要影響。隨著數據量級顆粒度、深度的增加,銀行對風控數據模型的需求、應用都在不斷的擴大。然而,當前監管機構對數據使用合規等方面的約束不斷加強,風控模型可用數據源的供給渠道在不斷地收縮;同時,在信貸服務場景中,信息欺詐和數據失真情況不斷加重,傳統的銀行風控模型因缺乏多維動態數據支撐,已經無法有效識別風險及進行風險預警。通過在通信運營商與銀行之間搭建基于隱私計算的數據安全共享及聯合建模平臺,使銀行能夠安全地利用運營商的動、靜態數據,如通話行為標簽、入網時長、信貸分、信用
20、卡分等,為業務提供輔助決策支撐?;陔[私計算技術實現的多方聯合建模,在各方數據都不出私域的前提下,充分應用通信運營商更多的底層數據字段,并有效發揮多方數據融合價值,提升銀行風控模型的精準度,如圖 2 所示。圖 2 基于隱私計算的智能風控體系 運運營商商特特征征銀行行特特征征銀行行原原始始特特征征銀行行衍衍生生特特征征運運營商商原原始始特特征征運運營商商衍衍生生特特征征特特征征探探查報告告聯合合統計銀行行客客戶列列表表運運營商商客客戶列列表表共共有有客客戶安安全全求求交交獲取雙方共有客戶不泄露原始數據聯合合統計原始數據不出庫完成特征探查、衍生聯合合建建模模原始數據不出庫完成特征探查、衍生銀行行數
21、數據據運運營商商數數據據安安全全求求交交用用戶信信息息不不泄泄露露本本地地模模型型本本地地模模型型全全局局模模型型隱私計算通信應用研究報告(2022 年)8 個人信貸風控方面,借助隱私計算技術,在保障數據安全的前提下融合業務欠費情況、理財偏好、工作穩定程度、閱讀偏好等通信運營商數據以及銀行自有數據,解決個貸業務場景中信用黑戶、多頭借貸、貸中逾期、壞賬、呆賬等風險環節的監測及預警,為銀行、信貸、電信、保險等業務活動提供強有力的個人客戶風險防控保障。圖 3 基于隱私計算的企業風控體系 小微企業信貸風控方面,如圖 3 所示,通過引入企業法人歸屬地偏差、政企業務欠費情況、號碼活躍度、交往圈穩定情況、信
22、用違約信息等運營商側標簽數據,助力銀行準確識別小微企業集群背后的復雜關系鏈條和欺詐風險,構建安全、高效的智慧風控平臺,提升銀行整體風控水平,助力實現銀行小微企信貸業風險識別的精準化、身份核驗手段的多樣化、提供融資服務的差異化,為銀行進行企業信用評價和風險防范提供輔助依據。在數據使用過程中通過采用隱私計算技術進行多方聯合統計、聯合模型訓練及聯合預測,保障各方原始數據不出擁有方本地;按用法、用量進行數據定向授權管理等功能保證數隱私計算通信應用研究報告(2022 年)9 據不會被第三方緩存、轉售或二次使用。2.銀行聯合精準營銷 隨著大數據及人工智能的飛速發展,可應用于金融營銷的數據維度不斷豐富,單一
23、金融機構本身的用戶畫像已經無法滿足精準營銷的要求,亟需聯合多方機構、企業的數據豐富用戶畫像,提升營銷效果。由于相關法律法規對數據安全、隱私保護等方面的管理日趨嚴格,各方持有的數據無法跨私域應用,限制了多機構間的數據合作,使多方聯合精準營銷的應用發展陷入瓶頸。通過隱私計算技術對多方數據進行聯合建模,在保障數據安全和數據不出私域的情況下,加強不同金融機構之間、金融機構與其他第三方機構間的數據價值融合,優化營銷模型。金融機構為了更好地服務客戶、提升服務質量,會常規性引入外部名單類數據產品進行客群的質量判斷和風險判斷??紤]到原始數據交互的模式既無法保護用戶隱私,也無法避免數據被緩存,近年來已逐步向隱私
24、信息檢索(Private information retrieval,簡稱 PIR)的方式遷移。例如,在提供個性化服務時,為了有效利用客服團隊的資源,需要對重點客戶進行定向化貼身服務。通過 PIR 的方式,可對運營商提供的 VIP 客群清單在用戶隱私受保護模式下進行查詢,在不暴露用戶個人信息的情況下,完成命中與否的判斷。根據查詢結果采用差異化服務的方式,合理利用有限客服資源,最大化挖掘、獲取客戶價值。如圖 4 所示,金融機構在拓展其自身業務過程中,使用隱私計算能力融合多方數據并與其營銷能力整合的模式具有顯著的效果。例如,隱私計算通信應用研究報告(2022 年)10 金融機構與流量平臺進行數據融
25、合后優化投放客群篩選,提升響應率模型;同時,結合通信運營商數據將風控模型前置,對高凈值客群進行提前篩選,并與響應率模型結合,有效提升營銷全流程的轉化率。圖 4 隱私計算增強下的投放模型與風險模型前置 在銀行線上數字化營銷方面,借助隱私計算技術,在保障數據交換時數據安全、隱私保護、合法合規的前提下,根據銀行目標客戶定位,融合銀行自有數據和運營商數據,如運營商業務消費等級、網購偏好、用戶忠誠度信息、運營商信用評價等,幫助銀行構建更加全面的客戶畫像,快速準確地篩選目標客群,減少無效的營銷投放,提高營銷精準度,節約大量成本。如圖 5 所示。圖 5 基于隱私計算的廣告推薦系統 隱私計算通信應用研究報告(
26、2022 年)11 通過運營商的用戶觸達和數據網關等核心能力,可以根據運營商用戶歷史活躍數據的支持以及個性化觸發能力,智能決策最合適的用戶觸達時機和方式,解決用戶觸達難的問題,如圖 6 所示。圖 6 基于用戶畫像篩選廣告推薦客戶 通過聯合篩選、聯合建模、聯合預測等實現運營商和銀行平臺 B端、C 端數據“虛擬打通”,從尋客、觸達、獲客到留存的全鏈路優化。在安全融合運營商數據價值后,優化銀行的廣告投放 ROI,提升客戶留存率,實現精準營銷,如圖 7 所示。圖 7 基于隱私計算的精準推薦全流程 在信用卡流失用戶挽留方面,可以使用銀行內部數據和運營商數據檢測某賬戶所屬用戶是否有流失風險,并根據用戶的行
27、為信息判斷用戶價值,對流失可能性較大的高價值用戶采取一定的挽留措施。銀隱私計算通信應用研究報告(2022 年)12 行側數據能夠反映客戶的活躍度發展趨勢,而運營商業務消費等級、超前消費意愿、理財意愿、消費活躍程度等數據能夠反映客戶近期是否仍有信用卡使用意愿。如圖 8 所示,采用隱私計算的方式安全打通銀行和通信運營商數據,從而對客戶當前情況進行更加精準的分析。使用雙方提供的數據進行聯合建模,基于聯合模型進一步預測用戶是否存在流失的風險,并對用戶進行評分排序,精準定位出高價值關鍵客戶群體,幫助客戶經理制定針對性的挽回及營銷策略,預防高價值客戶流失,降低銀行損失,節約銀行開發客戶所花費的成本。圖 8
28、 基于隱私計算的精準推薦全流程 3.保險智慧出險管控 當前,車險保費收入占中國財險份額比例約 50%-60%,是財險絕對主力構成。作為一類金融服務產品,其面臨著高賠付、高頻率、趨于飽和的業務特性,產品收益的核心體現于出險率和理賠成本的博弈。在商業車險改革進一步深化的行業背景下,進一步加強車險風險管理,運用前沿數據安全融合技術手段,通過數字化、智能化的方式,提高隱私私計算算平平臺臺密態數據密態數據用用戶信信息息,賬戶關關系系發卡卡信信息息,余余額信信息息拖拖欠欠信信息息,刷刷卡卡交交易易信信用用卡卡A AP PP P次次數數/時長信信用用卡卡內內容容瀏覽標簽次次數數/時長運運營商商信信用用卡卡融
29、融合合模模型型流失用戶檢測模型高價值用戶挽回隱私計算通信應用研究報告(2022 年)13 保險公司車險風控管理綜合能力,將是車險風險管理發展的趨勢。通過運用前沿技術手段,依托大數據、AI 機器學習、知識圖譜等技術,保險公司可以圍繞通信運營商數據、車管局數據及保險自有數據等多方數據共建更加全面的數據智能模式,彌補保險公司自有數據不足的問題。隨著用戶隱私保護和數據安全的要求和限制愈發嚴格,通過匯集明文數據進行數據分析和價值挖掘的傳統方式面臨諸多問題。為化解多方數據價值釋放與數據安全保護的矛盾,提升車險風險管理效率,通信運營商、保險公司和車輛管理部門多方合作,采用多方安全計算、聯邦學習等技術,針對車
30、險高賠付場景人群、人傷賠付高頻場景人群進行風險預警評估。存量車險用戶風控需求主要集中在網約車車主識別、出險高風險行為人群識別、車險用戶畫像三項業務場景,借助通信運營商具備的海量連續性數據、多元化標簽數據、豐富大數據處理經驗,可助力保險機構通過前置風險管控的手段,降低高頻賠付業務占比。通過隱私計算平臺實現對業務場景執行任務的總體調度及加密后數據的邏輯運算,各業務參與方通過本地部署的明文計算引擎及數據加解密模塊接入隱私計算平臺,實現本地明文數據不出域,各方僅輸出密文計算因子參與業務邏輯運算,如圖 9 所示。隱私計算通信應用研究報告(2022 年)14 圖 9 基于隱私計算的保險智慧出險計算框架 在
31、傳統車主風險評估方面,運用保險公司已有的用戶歷史投保、出險記錄等數據,同時結合運營商自駕游偏好情況、夜間出行偏好、出行移動范圍等級、區域速度等數據,結合車管局相關個人違章信息、高風險道路位置區域信息、出險檢測站等數據,進行聯合建模,實現對車主類型識別、出險概率評估等業務場景,如圖 10 所示。圖 10 基于隱私計算的保險智慧出險業務框架 此類項目的實施將幫助保險公司在已趨于飽和的車險風控業務中實現多維度數據聯合建模,既保障了各方數據安全,又增強了建模所用數據維度,豐富其對投保用戶的價值、風險、潛力等多維度評分矩陣,使保險公司能夠在充分了解投保用戶的出險概率的前提下,實申申辦用用戶保保險公公司司
32、1.申辦車險2.查詢請求3.返回風險值運運營商商隱私私計算算平平臺臺車管管局局保保險公公司司車險風控控模模型型梯度更新梯度更新梯度更新隱私計算通信應用研究報告(2022 年)15 現保險行業的業績及品質提升。4.證券沉默用戶激活 證券沉默用戶是指交易活躍度較低且手續費低于一定閾值的客戶,這些客戶雖為券商注冊用戶,但并不能為券商帶來真實收益。隨著股票投資市場的繁榮發展,券商整體客戶數量逐年上升,沉默用戶的數量也不斷累加。部分沉默用戶仍具有較高投資意愿,挖掘這部分客戶的潛在價值是券商客戶運營領域需要解決的關鍵問題之一。針對手續費低于一定閾值的證券賬戶,使用券商內部數據和通信運營商數據聯合檢測該賬戶
33、所屬用戶是否仍有理財投資意向。券商內部數據包含用戶的資產、收入及交易記錄,可以反映用戶的交易趨勢和客戶價值。運營商數據包含用戶投資愛好、財經關注等級、消費活躍度等數據,可以反映用戶的投資意愿。雙方數據交叉分析即可得出該用戶是否有激活為活躍客戶的潛力和價值。圖 11 基于隱私計算的券商沉默用戶激活業務框架 如圖 11 所示,采用聯邦學習的方法,使用通信運營商的數據補充券商本地數據的不足,從而對客戶進行更精準的分析。使用雙方的相關數據進行聯合建模,檢測各沉默用戶個體是否仍存在理財投資的券券商商運運營商商安全計算節點股股票票A AP PP P次次數數/時長理理財A AP PP P次次數數/時長金金融
34、融理理財標簽次次數數/時長資產數數據據收收入入數數據據交交易易數數據據安全計算節點沉沉默默用用戶激激活活隱私計算通信應用研究報告(2022 年)16 意向,并針對客戶價值進行打分排序,精準區分用戶圈層,定位出營銷投入產出比最高的沉默用戶群體,以支撐券商客戶運營團隊進行精準觸達。(二)(二)賦能政務賦能政務 1.電信詐騙識別預警 電信詐騙是一種以非法占有為目的,利用電話、短信、聊天工具等手段,與被害人進行遠程接觸,通過虛構事實、隱瞞真相或者其他欺騙性手段,騙取他人財物數額較大的犯罪行為。隨著現代通信和移動支付技術的迅猛發展,不法分子欺詐手法不斷升級,單次欺詐行為貫穿第三方聊天工具、運營商、銀行等
35、多個行業及領域。電信詐騙對象不再是對社會資訊相對缺乏的中老年人,而是高度依賴互聯網的年輕人。針對電信反欺詐識別的聯邦模型,將運營商的用戶靜默等級、交際圈穩定程度、運營商業務量變化情況等數據與公安詐騙號碼庫采用聯邦學習技術進行聯合建模,實現電信欺詐聯合預測。同時,結合已有的欺詐識別策略庫,輸出電信詐騙名單。通過此名單,能夠以電話、短信渠道通知受害人,進而降低財產損失,如圖 12 所示。隱私計算通信應用研究報告(2022 年)17 圖 12 基于隱私計算的電信反欺詐系統 在該場景中,也可結合區塊鏈技術,為如何確定各參與方的貢獻程度、如何進行事后的數據安全審計等問題,提供有效的激勵機制與安全審計方案
36、。采用區塊鏈融合聯邦學習的技術方案,將所有的交互都通過同態加密和哈希編碼技術實現,避免通信運營商和公安方數據的直接傳輸,僅交互加密的模型中間參數,且交互的動作上傳至區塊鏈,加強了數據融通過程中的安全性和可審計性,如圖 13 所示。隱私計算通信應用研究報告(2022 年)18 圖 13 基于隱私計算的反欺詐算法框架 2.智慧人口流動分析 伴隨著當前城市化進程的不斷推進,城市規模擴大迅速,城市內人口數量增長迅猛,各級城市政府單位面臨著巨大的管理壓力,亟需推動城市人口治理的創新改革。以聯邦學習為技術核心,打造通信運營商與人社廳的跨域安全聯合建模能力,在滿足隱私保護、數據安全和法律法規的要求下,基于運
37、營商用戶的業務使用數據、位置數據和地方人社廳的標簽數據,建立大學生、農民工、企業勞動力等群體態勢分析場景,能夠為人社廳人口治理和政策優化提供有力支持,如圖 14 所示。隱私計算通信應用研究報告(2022 年)19 圖 14 人社廳+運營商隱私計算建模流程 在此體系下,構建人口流動監測綜合解決方案,通過 Web 端以及大屏端展示人口監測應用成果,將通過人工智能手段分析、挖掘出的大學生、農民工等群體流動數據,以圖表等可視化形式直觀展現并發布,可從宏觀和微觀多角度了解該區域各群體流動情況,對政策優化起到一定的指導決策作用,如圖 15 及 16 所示。圖 15 基于隱私計算的智慧人社全流程 隱私計算通
38、信應用研究報告(2022 年)20 圖 16 基于隱私計算的智慧人社分析系統 3.公共安全態勢感知 公共安全不僅要保護廣大人民群眾的生命財產安全,還保衛著地區穩定和社會發展,但是基層公安日常工作極其繁重,包括:各類人群管控、受理群眾報警求助、強化信息工作、社區安全防護、轄區治安和消防檢查等。向數據要警力,實現對公共安全管理、應急服務的實時監控分析,輔助主管單位進行安全檢查規劃和優化工作,用信息化手段提高公共安全防控能力,避免突發事件的影響,降低生命財產損失,提高公眾服務能力。在現行的相關法律法規要求下,公安有關部門的數據應嚴格保密,通信運營商持有的用戶樣本數據同樣不允許泄露。因此,在公共安全領
39、域迫切需要探索和利用新型技術手段,以解決數據流通和數據安全的矛盾,構建數據可信流通環境,提升數字化公共安防服務水平。依托隱私計算技術構建數據安全流通平臺,為公安系統提供模型上傳、運行狀態查詢和結果集查詢等接口。在保障公安隱私數據沒有泄漏風險的前提下,利用多方安全計算技術實現對目標群體聚集地的隱私計算通信應用研究報告(2022 年)21 統計分析。通過目標群體樣本、交往圈、位置特征等信息,完成區域風險評估模型計算,利用地圖上顏色深淺表示事件發生概率高低,使公安部門更清晰地了解整體情況,達到預防群體性事件發生和管控的目的。該應用場景能夠全面覆蓋市級范圍預警,在必要時可進一步擴展至省級范圍預警。在公
40、共安全態勢感知場景中,基于安全求交技術,在公安、運營商數據分別不出域的情況下安全融合雙側數據,精準獲取地圖區域態勢感知信息。公安側以私有云等輕量級方式參與雙方交互運算,最終以 API 接口或圖層方式進行結果調用,在底層運用隱私計算新技術的同時保留公安側原有用戶習慣,有效助力社會穩定維護工作,如圖 17所示。圖 17 基于隱私計算的公共安全態勢感知業務場景 隱私計算通信應用研究報告(2022 年)22(三三)賦能其他行業賦能其他行業 1.醫療精準推薦 健康導航服務平臺能夠提供預約掛號、排隊叫號、報告查詢、體檢預約、在線藥房等各類醫療健康服務。平臺方一直在探索互聯網運營方式,然而受用戶數據量限制,
41、傳統營銷模式的效果欠佳。運營商擁有用戶所處階段情況、工作時長、夜間活躍程度等維度數據,合理利用通信運營商數據,能夠有效加強健康服務平臺方在新增場景的存量用戶客群推薦、新用戶的適用場景推薦等模型的預測效果。因此,亟需通過技術手段在保障雙方數據隱私安全的前提下,進行聯合模型構建,提升平臺推薦模型的準確性。引入聯邦學習技術,在多方本地化部署的基礎上,服務端、客戶端及協調方通過網絡互聯進行聯合建模,實現原始數據不出庫,僅共享數據應用價值,有效解決數據孤島問題。聯合模型充分利用運營商的大數據優勢和健康導航平臺行業經驗,建設健康導航平臺彈窗問診等醫療健康服務功能,實現精準推薦,提升準確率,如圖 18 所示
42、。隱私計算通信應用研究報告(2022 年)23 圖 18 基于隱私計算的醫療精準推薦全流程 健康導航服務平臺根據自身業務需求發起訓練任務,經協調方和通信運營商進行數據對齊,完成后即可與通信運營商交換參數并訓練模型。具體步驟如圖 19 所示:圖 19 醫療精準推薦訓練流程 隱私計算通信應用研究報告(2022 年)24 在實踐過程中,通信運營商與地方衛健委逐步探索聯合建立統一醫療健康服務平臺,實現問診、體檢等場景的精準推薦。同時,打造場景冷啟動、用戶冷啟動等功能模塊,以解決對新增場景的用戶群推薦,和新增用戶的業務場景推薦的問題,有效提升就醫用戶滿意度。2.汽車精準營銷 自2018 年以來,中國汽車
43、銷量連續3年遭遇下跌,行至2021 年,汽車運營模式已經“不得不變”。汽車行業在傳統模式下曾大獲成功,但到了存量時代,傳統獲客線索發生退化、單車獲客成本上漲、運營生態悄然改變,相關企業亟須探索數字化營銷轉型的最優路徑,避免有限的資源被浪費。隨著汽車行業的數字化、智能化發展,高質量的汽車用戶使用行為數據成為汽車行業可持續發展的核心要素。但是,汽車行業存在脫敏數據的隱私與安全性難以保證、數據孤島、數據監管等挑戰,導致汽車行業數據在多機構之間無法有效完成數據互通共享,在業務側表現出潛在客群無體系、對客戶業務訴求不明確、客戶服務無追蹤、獲客效果轉化增長低等問題。針對汽車精準營銷的一系列問題,通信運營商
44、依托其在物聯網、云計算、人工智能、大數據等多方面的技術積累,打造汽車產業開放性的連接生態,聯合多方融通數據建立共享的縱向聯邦計算平臺,最大化的保障數據安全,最終實現多方安全計算技術與汽車營銷場景的深度融合,為汽車行業提供專業的大數據技術服務支持。通信運營商與車企共同建立隱私計算平臺,確保原始數據僅在本地計算與存儲,最終根據車企客戶需求,選擇合適渠道進行目標客戶觸達,如圖 20隱私計算通信應用研究報告(2022 年)25 所示。圖 20 基于隱私計算的汽車智能營銷計算框架 購車意向預測模型能夠幫助車企了解潛在購車客戶的購買意向強度、需求量以及預估價位等信息,根據已有線索可進行快速篩選,圈定高質量
45、種子人群。綜合客戶消費能力、常駐城市、娛樂偏好、人生階段等多維度用戶特征數據進行分析,基于多平臺、多渠道、多數據進行聯合建模、聯合計算,進一步擴展有效訓練數據,利用持續迭代的深度學習算法模型,從海量預選人群中提取高意向目標客群并提供個性化服務,如圖 21 所示。圖 21 潛在客戶精準畫像 隱私計算通信應用研究報告(2022 年)26 運用隱私計算打破數據孤島,聯合建模釋放商業價值。一方面,在挖掘各類車型潛在客戶、高價值客戶的過程中,能夠為企業提供更優的獲客方案。另一方面,也為車企存量用戶的保有運營提供策略,幫助車企進行其客戶的分層管理,助力車企產品運營與優化。四、通信行業隱私計算創新應用(一)
46、(一)智慧城市智慧城市 隨著數字化技術的發展和智能化生活方式的轉變,人們對城市的服務能力及服務效率提出了更高要求,促使智慧城市、數字孿生的概念應運而生。通過整合交通、文旅、能源、教育、公共信息等各行業、各領域數據,使城市要素虛擬化、數字化,令網絡虛擬空間中的城市與現實中的城市相互映射、實時聯系,便捷地實現綜合監測、集中管理、治理。在傳統觀點中,數據擁有者專注于建設自身的安全體系,隱私保護是一種“被動”的行為,對其他參與方數據安全級別的驗證是困難的。然而,智慧城市建設旨在實現政務、交通、產業等城市治理工作數字化,其帶來的海量數據中不乏居民信息、征信數據等個人隱私信息或高敏感度的機密數據,其面臨的
47、風險包括幾個方面:一是,大量隱私數據集中在云平臺,使得針對平臺發起的攻擊格外危險;二是,智慧城市中的許多業務涉及不同政府機構間或企業間,以及跨行業的信息流轉,過程中數據可能被相關方沉淀、保存,帶來隱私信息泄露的風險;三是,許多場景需要多個機構對數據進行聯合挖掘和評估,即各方提供大量的原始數據以得出最終結果,此過程中有原始數據泄露的隱私計算通信應用研究報告(2022 年)27 風險;四是,流通過程中如果某一方提供了不完整或被篡改的數據,最終結果都可能受到影響,因此保障數據算法的可驗證、可度量也至關重要。隱私計算在智慧城市中的應用將為這種情況帶來改觀,通過技術手段為各方提供一個安全的數據流通平臺,
48、使各方在合作進行數據挖掘、建?;蛴柧殨r,只能利用到數據價值而看不到數據本身,可以獲取計算的結果而無法獲取原始數據,并且該安全特性可以通過技術手段進行論證。例如,在通過治安大數據掌握城市中高危人員、車輛的活動情況以預測和防范公共安全事件的實踐中,通過應用可信執行環境與不經意傳輸技術(oblivious transfer,簡稱 OT)實現黑盒的數據傳輸、加工處理。在使用數據時查詢請求會被 OT 協議混淆,查詢者僅可獲取預期的正確數據,且數據提供方無法確定查詢者輸入的具體信息。圖 22 基于隱私計算的智慧城市系統架構 隱私計算通信應用研究報告(2022 年)28(二二)云邊協同云邊協同 隨著網絡部署
49、的逐步完善,5G 網絡能力逐步得到體現,其高帶寬、低時延等特點能夠提升云邊協同體系的效率。多接入邊緣計算(Multi-access Edge Computing,簡稱 MEC)作為 5G 關鍵技術之一,是滿足 5G 網絡性能和延遲要求,改善客戶體驗的重要途徑之一,能夠提供人工智能等應用和服務。部署大量高性能計算設備的云計算模式能夠完成海量數據的計算和存儲,但是數據通常需要由終端設備采集上傳,數據傳輸過程會面臨傳輸帶寬瓶頸及時延問題。邊緣計算既能將本地數據存儲在邊緣側,又可將部分計算任務在邊緣側執行,有效緩解了網絡傳輸負載壓力,縮短網絡通信時延。就近處理的邊緣計算作為中心化處理的云計算向用戶端的
50、延伸,兩者聯合構建起云邊協同計算體系。邊緣端完成本地范圍的數據存儲和計算工作,云端完成數據的匯聚和全局數據的挖掘分析,進而滿足更多的場景需求。隨著網絡安全法、數據安全法、個人信息保護法的相繼出臺,如何安全合規地應用數據成為了當前行業內關注的熱點問題?;陔[私計算的云邊協同模式為解決這一問題提供了有效技術手段。邊緣側終端收集到的數據通常攜帶大量個人隱私數據,若直接上傳云端存在數據安全和隱私泄露風險,即使只保留在邊緣本地,也存在用戶隱私數據的被動泄露風險?;陔[私計算的模式能夠保證數據不出邊緣端本地,由云端協同完成聯邦模型的訓練,并更新各邊緣端本地模型,提供低時延的多樣性模型和數據服務。隱私計算通
51、信應用研究報告(2022 年)29 圖 23 基于隱私計算的云邊協同系統架構 在云邊協同的網絡模式中,邊緣端通常是數據存儲和本地模型訓練的一方,云端通常是負責中間結果和模型聚合的一方,在此過程中,隱私計算的三種技術路線:多方安全計算、聯邦學習和可信執行環境均能夠得到很好的應用。計算過程中不傳遞原始數據,僅將邊緣側本地計算產生的中間數據通過同態加密、秘密分享等方法傳輸到云端,有利于保護邊緣端的隱私數據。邊緣端服務器也可將數據遷移到 TEE硬件環境下完成可信計算。因此,在云邊協同的基礎上,基于隱私計算的數據與模型應用能夠運用在 MEC 框架中,在保障數據安全的前提下實現拓撲結構的智能聯接,提供高性
52、能計算以及多樣性服務。目前,業界針對云邊協同和隱私計算的技術應用尚處于探索階段。在應用隱私計算過程中,數據需要經過各類密碼技術處理,會帶來較云云端端TEE環境邊緣端端安安全全共共享享數數據據(同同態加加密密、秘秘密密分分享享等等)TEE環境TEE環境本本地地計算算數數據據存存儲密態數據密態數據密態數據基基于于隱私私計算算技技術實現的的聯合合統計分分析析、聯合合機機器器學學習等等車輛傳感器數數據據采采集集移動終端隱私計算通信應用研究報告(2022 年)30 大的算力開銷。并且,在數據傳輸和計算階段,相應的密碼協議需要嵌入到通信網絡協議中,這對網絡協議和架構提出了更多的優化要求。隨著多源異構網絡的
53、融合,萬物互聯將進一步釋放數據驅動力,推動各行業數字化轉型發展,云邊協同場景應用也將變得更為復雜,終端設備的異構性以及終端數據的異構性、多源性會導致數據安全和隱私保護問題日益嚴峻,隱私計算在云邊協同場景下的需求也將得到更多維度的釋放。(三三)算力網絡算力網絡 算力網絡是一種根據業務需求,在云、網、邊之間按需分配和靈活調度計算資源、存儲資源以及網絡資源的新型信息基礎設施。在算網場景下,算力分布泛在,算力提供者提供算力資源,算力消費者使用算力資源進行數據的計算、存儲。傳統模式下,算力消費者將需要計算的數據進行網絡傳輸,傳輸過程中使用經典加密算法對數據進行保護,算力資源節點對數據進行解密,使用解密后
54、的原始數據計算、存儲,數據的所有權發生轉移,可能面臨無限制的拷貝、復制風險,數據隱私也很難得到有效保護。隱私計算通信應用研究報告(2022 年)31 圖 24 基于隱私計算的算力網絡系統架構 在基于隱私計算的可信算力交易模式下,算力消費者提供的不是原始數據,而是數據的使用權,根據需求確定交易數據的隱私保護規則、交易數據的用法與用量。算力資源節點根據確定的規則采用各類隱私計算技術實現安全的數據匯聚計算,得到的計算結果通過零知識證明等方式驗證計算正確性。該模式有效避免了參與方提供數據的拷貝與復制風險,保障隱私數據不被泄露。結合隱私計算的算力網絡交易模式具備以下三點優勢:一是原始數據不離開本地,降低
55、數據提供方的安全顧慮;二是數據可用不可見,數據提供方可控制隱私保護規則和數據用法用量,在挖掘數據價值的同時保障數據安全。三是支持豐富的應用場景,包括聯合統計、聯合查詢、聯合建模、聯合預測等。數數據據提提供供者者算算力力網網絡密態數據規則密態數據規則隱私保護機器學習密態數據分析可信節點可信節點可信節點交易控制原始數據提供者,對數據存所有權,確定數據使用的隱私規則,用法用量。根據自身需求定制或購買的價值數據。使用數據和隱私計算服務,但不擁有數據。數數據據使使用用者者計算算服服務提提供供企企業根據需求,提供數據處理、數據挖掘、隱私計算服務等。數數據據整整合合處理理企企業購買原始數據使用權,并租用算力
56、對數據進行清洗、整合、脫敏,并將處理過的數據存儲在平臺,不允許回傳本地。隱私計算通信應用研究報告(2022 年)32 五、總結與展望 借助隱私計算技術,能夠在保證數據安全的前提下充分發揮通信數據應用價值,助力各行業數字化發展實踐,對充分釋放數據要素價值和推動社會經濟發展具有重大意義。在傳統應用上,順應時代趨勢,增強了數據安全保護能力。在創新應用上,為解決新場景落地過程中面臨的實質問題提供了較大幫助。未來,隱私計算仍面臨著安全與性能難以兼顧、異構平臺壁壘帶來的“數據群島”問題等諸多挑戰有待解決。在安全與性能平衡方面,隱私計算通信應用中,不乏一些對性能和安全要求較高的場景,如何在保證安全的同時最大
57、化效率和數據價值,成為未來需要解決的關鍵問題之一。針對隱私計算安全與性能平衡的問題,未來應關注以下幾點:通過算法優化、硬件加速等手段,從技術側實現創新突破,在固定的安全水平上,優化性能;形成統一的隱私計算安全評價方法,實現安全可驗證、可度量;從應用場景出發,結合數據分類分級,制定符合業務場景需求的安全分級框架。在跨平臺互聯互通方面,在通信數據賦能金融、政務等領域的過程中,通信運營商需要與各行業的相關機構進行連接,多平臺部署的情況明顯,耗費大量資源并提高了使用成本。針對隱私計算互聯互通問題,未來應協同多方助力形成互聯生態:隱私計算通信應用研究報告(2022 年)33 建立隱私計算互聯互通標準化技
58、術規范;除技術攻關,仍需突破適配應用方業務場景,解決業務問題;技術提供方、數據提供方、應用需求方、標準化組織、檢測認證機構等行業多方共同探索,構建完善的互聯互通生態網絡。隱私計算通信應用研究報告(2022 年)34 參考文獻 1 國務院辦公廳.要素市場化配置綜合改革試點總體方案EB/OL.2021.http:/ 國 務 院.“十 四 五”數 字 經 濟 發 展 規 劃 EB/OL.2021.http:/ 中共中央,國務院.關于加快建設全國統一大市場的意見EB/OL.2022.http:/ 中國隱私計算產業發展報告(2020-2021),國家工業信息安全發展研究中心,2021.5 Gartner
59、 2022 隱私技術成熟度曲線,Gartner,2022.6 Shamir A.How to share a secretJ.Communications of the ACM,1979,22(11):612-613.7 Blakley G R.Safeguarding cryptographic keysC/Managing Requirements Knowledge,International Workshop on.IEEE Computer Society,1979:313-313.8 隱私計算聯盟,中國信通院云大所.隱私計算白皮書(2021 年)R.2021.9 Yao A C.P
60、rotocols for secure computationsC/23rd annual symposium on foundations of computer science(sfcs 1982).IEEE,1982:160-164.10 Yao A C C.How to generate and exchange secretsC/27th Annual Symposium on Foundations of Computer Science(sfcs 1986).IEEE,1986:162-167.11 ARM.ARM Security Technology-Building a S
61、ecure System using TrustZone Technology.ARM Technical White Paper,2009.12 閆樹,袁博,呂艾臨等.隱私計算推進數據”可用不可見”的關鍵技術M.電子工業出版社,2022-03-01.13 魏凱,閆樹,呂艾臨.數據要素市場化進展綜述J.信息通信技術與政策,2022(08):59-64.14 Gentry C.Fully homomorphic encryption using ideal latticesC/Proceedings of the forty-first annual ACM symposium on Theor
62、y of computing.2009:169-178.15 Anati I,Gueron S,Johnson S,et al.Innovative technology for CPU based attestation and sealingC/Proceedings of the 2nd international workshop on hardware 隱私計算通信應用研究報告(2022 年)35 and architectural support for security and privacy.New York,NY,USA:ACM,2013,13(7).16 McMahan B
63、,Moore E,Ramage D,et al.Communication-efficient learning of deep networks from decentralized dataC/Artificial intelligence and statistics.PMLR,2017:1273-1282.17 Yang Q,Liu Y,Chen T,et al.Federated machine learning:Concept and applicationsJ.ACM Transactions on Intelligent Systems and Technology(TIST)
64、,2019,10(2):1-19.18 Dash B,Sharma P,Ali A.Federated Learning for Privacy-Preserving:A Review of PII Data Analysis in FintechJ.International Journal of Software Engineering&Applications,2022,13(4):1-13.19 Gentry C.A fully homomorphic encryption schemeM.Stanford university,2009.20 賈軒,白玉真,馬智華.隱私計算應用場景綜述J.信息通信技術與政策,2022,48(5):45-52.21 閆樹,呂艾臨.隱私計算發展綜述J.信息通信技術與政策,2021,47(6):1.