《北京金融科技產業聯盟:2025基于數據空間的金融數據可信流通研究報告(73頁).pdf》由會員分享,可在線閱讀,更多相關《北京金融科技產業聯盟:2025基于數據空間的金融數據可信流通研究報告(73頁).pdf(73頁珍藏版)》請在三個皮匠報告上搜索。
1、基于數據空間的金融數據可信流通研究報告北京金融科技產業聯盟2025 年 4 月版權聲明本報告版權屬于北京金融科技產業聯盟,并受法律保護。轉載、編摘或利用其他方式使用本報告文字或觀點的,應注明來源。違反上述聲明者,將被追究相關法律責任。編制委員會編委會成員:何軍聶麗琴徐曉劍編寫組成員:張洪鵬陳雨薇郄軍利田璞楊華沈蓓瑾徐祎周雍愷戚文彬王琪陳鐘正靳晨楊天雅王慧敏王超陳曦昌文婷吳昌泉王立冬編審:黃本濤國鈺魏中宣1參編單位:中信銀行股份有限公司華為技術有限公司中國工商銀行股份有限公司中國銀聯股份有限公司華控清交信息科技(北京)有限公司上海富數科技有限公司藍象智聯(杭州)科技有限公司螞蟻科技集團股份有限公
2、司杭州金智塔科技有限公司亞信科技(中國)有限公司2目錄一、總體概述.3(一)發展背景.3(二)研究目標.5(三)研究方法.6二、金融數據流通現狀及挑戰.8(一)涵義理解.8(二)發展現狀及趨勢.9(三)發展需求.15(四)面臨挑戰.16三、數據空間發展.18(一)數據空間定義.18(二)國際數據空間發展及實踐.19(三)我國數據空間發展及實踐.26四、金融數據可信流通方案研究.31(一)金融數據可信流通典型場景.31(二)金融數據可信關鍵角色.32(三)數據資源流通模式.34(四)金融數據可信流通方案架構.37(五)金融數據可信流通方案關鍵技術.38五、典型場景應用與技術驗證.49(一)中信銀
3、行總分行數據流通管控實踐場景.49(二)工銀金租數據流通場景.52(三)銀聯安全生物特征支付場景.54(四)金智塔小微企業智能授信風控創新實踐場景.57(五)華為公司與伙伴數據流通實踐場景.60(六)富數科技基于多源數據的金融風控數據空間場景.62(七)螞蟻科技三農普惠金融服務場景.64六、總結及建議.68(一)主要結論.68(二)相關建議.693一、總體概述(一)發展背景(一)發展背景數據成為新型生產要素,釋放數據要素價值成為國家戰略。在金融行業,隨著金融數字化轉型的加速,數據在金融行業中扮演的角色越來越重要。數據不僅支撐日常業務操作,還是推動創新、提升效率的關鍵要素。然而,伴隨這種趨勢,數
4、據安全和隱私保護成為了一個重大挑戰。金融機構依賴于大量數據來開展業務,包括但不限于個人信用信息、交易數據和市場分析,數據使用場景也更加多樣化,數據使用從單域延伸到跨域甚至跨組織,數據泄漏、數據濫用成為主要風險。這些數據的安全管理和高效利用對于維護金融穩定、提升服務質量、增強競爭力至關重要。隨著金融科技的發展,如何對數據存儲、流通、使用進行安全管理,保障數據安全和隱私,成為了業界面臨的一個重大挑戰。目前,數據保護領域已經發展出多種技術和方法。其中一類是常規的數據加密、數據訪問控制、數據脫敏等數據安全技術,用以保障數據在存儲、處理、傳輸過程中的安全。例如,傳統基于角色的訪問控制(RBAC)模型被廣
5、泛應用于 IT 系統中,以管理用戶對敏感數據的訪問權限。另外一類是隱私計算技術,主要包括多方安全計算、聯邦學習、機密計算等,這類技術通常用于針對高敏感數據保護,實現類似“可用不可見”的效果。然而,當前業界普遍采用的上述技術受使用場景等約束,已經難以滿足4數據要素流通新時代對數據保護的要求,可信數據空間為數據安全保護提供了新的選擇。數據空間理念和架構來源于國際數據空間協會(IDSA,International Data Spaces Association),其作為數據空間理念的啟動者和賦能者,聚焦數據主權,提出了去中心化、數據主權可控的“數據空間”理念及架構。當前,該組織已經匯聚了來自 30
6、多個國家的 180 多名成員,其國際數據空間參考架構模型(IDSRAM,InternationalDataSpacesReferenceArchitecture Model)已具備廣泛的業界影響力。2023 年數據空間正式進入歐盟立法數字法案,已經成為歐盟數據戰略中數字基礎設施的重要組成部分。在國內,可信數據空間已經成為實現數據資源共享共用的數據流通利用基礎設施。國家數據局成立后,多次提出要積極推進數據空間等數據流通技術研發和集成應用,實現數據在不同主體間“可用不可見”“可控可計量”,布局建設數據基礎設施,為數據可信、高效流通提供有力的基礎支撐。2024 年 11 月,國家數據局發布可信數據空
7、間發展行動計劃(20242028 年),明確可信數據空間發展的總體思路、目標和計劃。其中,提出以建設可信可管、互聯互通、價值共創的數據空間為重點,分類施策推進企業、行業、城市、個人、跨境 5 類可信數據空間建設運營,為充分釋放數據要素價值,激發全社會內生動力和創新活力,構建全國一體化數據市場提供有力支撐。并明確提出到 2028 年,5可信數據空間標準體系、技術體系、生態體系、安全體系等取得突破,建成 100 個以上可信數據空間,形成一批數據空間解決方案和最佳實踐,基本建成廣泛互聯、資源集聚、生態繁榮、價值共創、治理有序的可信數據空間網絡。在金融行業,如何引導和支持可信數據空間發展,推動金融機構
8、積極參與可信數據空間建設,促進金融數據要素合規高效流通使用,充分釋放數據要素價值,已成為一個重要課題。(二)研究目標(二)研究目標可信數據空間是基于共識規則,聯接多方主體,實現數據資源共享共用的數據流通利用基礎設施,是數據要素價值共創的應用生態,是支撐構建全國一體化數據市場的重要載體。本課題圍繞金融行業數據要素價值釋放,研究基于可信數據空間如何促進數據資源有效共享流通。本課題圍繞金融數據流通的行業現狀、數據空間理念及其技術發展、金融數據可信流通場景及方案、可信數據空間驗證及實踐等方面開展研究,并給出結論和政策建議。具體目標包括:分析金融數據流通的行業現狀,識別發展趨勢和潛在挑戰。研究金融數據的
9、理論和內涵,以及其在金融行業中的重要性。研究可信數據空間理念和技術發展趨勢,總結重點行業數據流通實踐經驗,分析其在金融數據流通中的應用潛力。6 研究總結可信數據空間在金融行業落地場景,設計金融可信數據空間的方案架構,識別關鍵技術。通過技術驗證,展示金融數據可信流通方案的實際效果和可行性。給出實踐驗證結論,提出促進金融數據可信流通的政策建議,以支持金融數據的可信流通和數據價值的釋放。(三)研究方法(三)研究方法本課題采取政策分析、文獻分析、定量分析、實地調研、專家座談、集中討論等方式進行課題研究分析。通過制定研究計劃、資料研究、定期例會、現場調研、專家研討,完成研究,給出總體路徑和重要舉措。必要
10、情況下,聯合廠商搭建數據空間技術平臺開展場景驗證、技術指標分析等方式配合課題工作開展。1.1.制定計劃制定計劃討論制定課題方向及研究框架,并將任務進行分解,制定調研提綱并列出具體人員任務清單,明確各階段研究工作重點。2.2.資料研究資料研究各成員單位充分利用國內外研究機構的專業書籍、專業研究報告和數據庫等研究成果,按照數據空間政策制度、數據空間技術、數據產品與服務、數據空間廠商企業、數據空間落地場景、數據空間生態等構成維度,分門別類收集、整理、研究數據空間相關案例資料。3.3.現場調研現場調研7根據需要進行現場調研,掌握數據產業發展最新動態,理論結合實踐保障課題輸出質量。4.4.專家研討專家研
11、討項目組將組織專家調研會。請與會專家為課題研究內容、階段成果進行討論,給出建議。5.5.實驗驗證實驗驗證邀請數據空間相關企業、研究院所搭建驗證平臺與環境,組織金融等行業機構進行方案功能驗證和測試等,以獲得數據空間技術第一手資料,為研究報告內容提供依據。6.6.編撰報告編撰報告根據研究團隊成員在資料研究、現場調研、專家研討等工作成果,編寫報告并組織匯報。8二、金融數據流通現狀及挑戰(一)涵義理解(一)涵義理解金融數據的可信流通,是推動金融行業數字化轉型的重要保障和必然趨勢。在中共中央、國務院數字中國建設整體布局規劃及“數據要素”三年行動計劃(2024-2026 年)政策的指引下,金融作為重點領域
12、,將加速推動數字技術創新應用,提升服務水平。金融行業作為信息化建設起步較早、成熟度較高的行業之一,長期以來積累了龐大的數據量和豐富的數據類型,金融數據不僅具備一般數據的特性,更包含了國民個人信息、企業資金流轉、社會經濟活動等內容,在業務運營中涉及大量的客戶信息、交易數據和市場信息。隨著數據治理體系的完善,使金融數據具有體量大、質量好、價值高,敏感性強等特點,金融數據融合應用具備了天然優勢。金融數據應用場景豐富,涵蓋客戶風險評估、反欺詐、精準營銷、智能投顧等多個領域。然而,金融行業的數據具有高度敏感性,且其行業具備金融強監管屬性,如何使金融數據在嚴格遵守中華人民共和國數據安全法、中華人民共和國網
13、絡安全法、中華人民共和國個人信息保護法、銀行保險機構數據安全管理辦法等法律法規的前提下,合法合規地釋放數據價值,避免數據成為“孤島”成為當下行業探討熱題。9金融數據的可信流通,實質上是在保障數據安全與隱私的前提下,探索數據價值最大化的過程。這要求金融行業不僅要加強內部數據治理,提升數據質量與安全防護能力,還需與外部監管機構、技術服務商等緊密合作,共同構建數據流通的信任機制與合規框架。通過技術創新保護數據主體的權益,促進數據的合規共享與價值釋放。(二)發展現狀及趨勢(二)發展現狀及趨勢1 1.政策指引政策指引(1 1)美國數據強國戰略:戰略性的安全防護、制度化的數)美國數據強國戰略:戰略性的安全
14、防護、制度化的數據開放和市場化的數據交易據開放和市場化的數據交易美國正通過一系列戰略部署和技術革新,不斷強化其數據治理體系,推動數據資源的防護、共享、開放和商業化流通。美國的數據戰略不僅聚焦于安全防護,還積極促進數據的開放利用和市場培育,展現出其在數據資源流通技術發展上的決心和前瞻性。一是一是數據安全防護體系的強化。美國通過發布零信任戰略,轉變傳統的網絡安全觀念,以數據為中心構建安全攻防體系。同時,成立網絡空間與數字政策局,強化政府治理能力,并建設高安全基礎設施,確保重要數據的安全。二是二是政府數據開放的深化。美國實施 開放政府數據法案,推動非敏感數據的最大限度開放,并通過 Data.gov
15、等統一數據開放平臺,向社會提供了大量的政府數據集,促進了數據的開放利用。10三是三是數據商業化流通交易的推進。美國培育成熟的數據經紀市場,提供數據集查詢和交易撮合服務,形成了多元化的數據交易模式。同時,通過數據經紀人責任制與透明法案等政策法規,加強了行業監管和自律,提高了數據交易的透明度和規范性。美國在數據資源流通技術領域的發展現狀和趨勢表現為戰略性的安全防護、制度化的數據開放和市場化的數據交易。通過這一系列措施,美國正不斷鞏固其在全球數據治理和流通技術領域的領先地位,為數據驅動的創新和經濟增長提供堅實的基礎。(2 2)歐盟構建數字堡壘:制定全面的制度規則、建立統一)歐盟構建數字堡壘:制定全面
16、的制度規則、建立統一的基礎設施和推動建設行業數據空間的基礎設施和推動建設行業數據空間歐盟正致力于構建一個統一的數據市場,通過制定全面的制度規則、建立統一的基礎設施和推動行業數據空間的建設,以增強其數字產業的實力和在數字時代的全球競爭力。歐盟的數據資源流通技術發展現狀和趨勢體現了其對數據安全與隱私保護的堅定承諾,以及對數據共享和流通的積極推動。一是一是建立數據安全“歐盟規則”。歐盟通過 歐洲數據戰略和2030 數字羅盤等戰略文件,確立了數據治理的框架,并以 GDPR 為核心,建立了嚴格的隱私保護法規體系,同時制定 數據法案和數據治理法案,推動數據的可信共享。二是二是構建統一基礎設施。歐盟推進 G
17、aia-X 體系的建設,旨在實現數據和服務的自由、安全整合和共享,采用創新的“1+2+3”11架構,促進各類主體的參與,并輔以量子通信基礎設施 EuroQCI,增強數據傳輸和存儲的安全性。三是三是搭建行業數據空間。以 Gaia-X 為支撐,歐盟在關鍵行業領域打造公共數據空間,促進行業內數據的流通和創新應用,同時通過數據空間連接各個數據源和使用者,形成一個開放、安全、可信的數據共享環境。歐盟在數據資源流通技術領域的發展現狀和趨勢表現為對數據安全與隱私保護的高標準要求,對統一基礎設施的創新建設,以及對行業數據空間的積極推進。這些措施不僅加強了歐盟的數據治理能力,也為數字經濟的發展和創新提供了堅實的
18、基礎,推動了其數字化轉型的進程。(3 3)日本:構建安全與創新并重的數據流通新紀元)日本:構建安全與創新并重的數據流通新紀元日本正通過其國家綜合數據戰略,積極塑造一個既注重個人信息安全又促進數據驅動創新的數據資源流通環境。該戰略以數據安全保護為基礎,統一數據生態架構為支撐,數據銀行模式為創新點,展現了日本在數據資源流通技術發展上的戰略布局和未來趨勢。日本在個人信息保護方面雖然起步較晚,但通過個人信息保護法的實施與修訂,不斷強化對人臉識別信息和數據跨境傳輸的監管,體現了其在保護個人信息方面的堅定立場和適應數字化發展需求的靈活性。同時,日本通過構建全國性的數據共享生12態架構,明確了數據產業鏈各環
19、節的整合作用和各類數據參與者的角色,旨在解決數據分散治理的難題。此外,日本在培育數據銀行方面采取了創新措施,以信托機構為起點,推動數據信托服務的發展,進而促進數據交易市場的成熟,為日本數字信任體系的建設奠定了基礎。通過“數據流通環境整備研究會”的工作,日本政府正致力于通過官民合作,實現跨領域數據流通,以數據銀行為基礎,推動數字社會的發展和數據的高效利用。日本的國家綜合數據戰略不僅反映了其對數據安全和個人信息保護的重視,也顯示了其在構建數據生態和推動數據流通方面的前瞻性和創新力,預示著日本在數據資源流通技術領域將迎來更加安全、高效、協同的發展未來。(4 4)中國:將可信數據空間視為實現數據資源共
20、享共用的)中國:將可信數據空間視為實現數據資源共享共用的數據流通利用基礎設施數據流通利用基礎設施為促進我國數字經濟健康發展,確保數據資源作為國家戰略性資產的有效流通,我國正積極應對數據流通面臨的法律法規滯后、技術安全風險等多項挑戰。為此,國家高度重視數據安全保護體系建設,不斷加強相關法律法規的制定和完善,旨在打造一個全面的數據安全保護框架。當前中國數據要素流通產業發展已經完成頂層設計,各地都在積極開展創新實踐,發展新型數據產業,包括數據交易所、行業數據空間、數據跨境流通等。在激發數據價值發揮的同時,中13國數據安全立法進程在加快完善。中華人民共和國數據安全法(2021)、中華人民共和國個人信息
21、保護法(2021)相繼落地施行,與中華人民共和國網絡安全法(2017)共同構成了數據安全治理法律領域的“三駕馬車”。在法律框架下,各地方性數據安全條例政策不斷涌現,以數據流通關鍵環節和主體為中心,明確數據流通安全規則。國家數據局發布可信數據空間發展行動計劃(20242028年),將可信數據空間定義為實現數據資源共享共用的數據流通利用基礎設施,是數據要素價值共創的應用生態,是支撐構建全國一體化數據市場的重要載體。計劃提出,到 2028 年,可信數據空間標準體系、技術體系、生態體系、安全體系等取得突破,建成 100 個以上可信數據空間,形成一批數據空間解決方案和最佳實踐,基本建成廣泛互聯、資源集聚
22、、生態繁榮、價值共創、治理有序的可信數據空間網絡,各領域數據開發開放和流通使用水平顯著提升,初步形成與我國經濟社會發展水平相適應的數據生態體系。2 2.行業規劃行業規劃金融行業正處于數字化轉型的重要階段,數據作為新型生產要素,對推動經濟社會的高質量發展具有重要意義。安全可控的金融數據流通共享是釋放數據價值的關鍵前提,然而隱私泄露、數據濫用等安全風險仍制約著數據要素的深度應用。14從金融行業來看,人民銀行及相關機構頒布的一系列金融行業數據安全規范,支撐起金融數據安全的體系框架,為金融數據能力和安全建設提供了依據和指引。2021 年人民銀行印發金融科技發展規劃(20222025 年),明確指出在保
23、障安全和隱私前提下,推動數據有序共享與綜合應用,激活數據潛能,有力提升金融服務質效。2024 年 11 月,中國人民銀行等七部門聯合印發推動數字金融高質量發展行動方案,提出夯實數據治理與融合應用能力基礎,加強數據資產積累,全面整合內外部數據,實現全域數據的統一管理、融合共享。強化數據挖掘分析和數據可視化能力建設,形成對業務經營、風險管理、內部控制的基礎數據支撐。推進金融領域“數據要素”試點,運用大數據、隱私計算等科技手段,融合應用多維數據,優化金融產品和風控模型,提升金融服務和風險管控質效。行動方案同時提到,要培育高質量金融數據市場,加強金融領域數據資源開發利用,探索開展金融行業數據空間建設。
24、在依法安全合規前提下,支持客戶識別、信貸審批、風險核查等多維數據在金融機構間共享共用和高效流通,建立健全數據安全可信共享體系。金融機構作為數據要素市場的核心參與主體,在營銷獲客、風險管控等業務場景中深度依賴內外部數據資源。隨著國家法律法規和金融行業相關規范、指南的陸續出臺和落實完善,金融行業數據安全保護及合規審查的要求日趨嚴格。需要強調的是,數15據安全治理并非追求絕對化管控,而應構建隱私保護、安全可控與價值釋放的動態平衡機制。在滿足合規要求的前提下,堅持“敏感數據安全優先,非敏感數據效率優先”原則,促進數據要素流通,提升數據要素流通效能,充分激活數據資產價值。(三)發展需求(三)發展需求1.
25、1.完善數據全流程合規治理與監管體系完善數據全流程合規治理與監管體系。為了保障金融數據的安全流通,需著眼數據全生命周期,建設依法合規、高效貫通的數據流通規則標準體系,覆蓋采集、整理、聚合、存儲、分析、流轉等環節。同時,嚴格遵守相關法律法規,確保數據來源合法、交易主體資質明晰,并兼顧安全保護。監管機構應加強對金融機構數據安全管理的監督和指導,利用技術手段提高監管效能,確保市場主體在法律法規約束下開展數據資源處理及交易活動,實現數據高效流動與數據安全保護的平衡。2.2.加強金融數據分類分級保護與流通加強金融數據分類分級保護與流通。金融數據作為關鍵生產要素,其使用場景和用途用量千差萬別。隨著數據流通
26、范圍、期限及使用場景的變化,金融數據的安全保護和流通模式需相應調整。數據的分類分級授權使用是保障金融數據安全流通的關鍵。針對不同類別和級別,應建立差異化的授權使用規范,明確數據資源持有者、數據加工使用者、數據產品經營者等各方在數據流通過程中的權利與義務,規范數據交易行為,健全產權保護制度。3.3.構建完善市場生態構建完善市場生態。為了推動金融數據流通的健康發展,需要構建完善的市場生態和流通規則。規范數據流通行為、打擊16數據泄露和濫用等違法行為。同時,推動場內化、標準化的大型金融數據交易生態的形成,拓寬數據流通渠道和種類。(四)面臨挑戰(四)面臨挑戰金融數據的流通與共享對于提升金融機構的經營效
27、率、客戶服務水平以及實現業務創新和產品創新具有重要意義。然而,金融數據流通也面臨著諸多挑戰,需要業界各方共同努力加以解決。1.嚴法律帶來強要求嚴法律帶來強要求。國家通過中華人民共和國網絡安全法、中華人民共和國個人信息保護法、中華人民共和國數據安全法等法律法規,對金融數據的采集、使用、存儲和傳輸設定了高標準,確保了數據的合規性和安全性。然而,這些法律法規的實施增加了金融機構的管理成本和合規難度。同時,行業監管機構如銀保監會、證監會等不斷提升監管力度,發布了一系列數據安全管理辦法,要求金融機構建立健全的數據安全管理體系,進一步提升了金融機構的管理成本。2.2.高標準帶來嚴要求高標準帶來嚴要求。隨著
28、金融數據的重要性日益凸顯,業內提出了多項數據安全治理標準,如 金融業數據能力建設指引、金融數據安全數據生命周期安全規范等。這些標準雖然有效完善了安全保障體系,但也提高了金融機構的管理成本,并增加了合規難度。金融機構需要投入更多精力,從而限制了金融數據的有效流通。3.3.風險防控加劇封閉性風險防控加劇封閉性。金融機構對數據的高敏感、高價值認識導致其“不愿流通”、“不敢流通”以及“不會流通”,使17得金融數據被封閉在“孤島”中,限制了金融數據在市場中的流通。另一方面,數據泄露和濫用等問題的頻發,加劇了金融機構對數據流通的謹慎態度,為了避免潛在的法律風險和聲譽損失,金融機構在數據流通方面采取了更加嚴
29、格的管控措施,這進一步加劇了數據的封閉性,使得數據流通的難度進一步加大。18三、數據空間發展(一)數據空間定義(一)數據空間定義早在 2016 年前后,德國弗勞恩霍夫協會提出了“數據空間”這一概念,隨后成立了工業數據空間協會(Industrial DataSpace Association,IDSA)。隨著數據空間理論架構和實踐的不斷探索和完善,這一理念逐步從專注工業領域的“工業數據空間”(Industrial Data Space)升級為覆蓋各個行業的“國際數據空間”(International Data Space),跨越國界,連接全球。2022 年,中國信息通信研究院兩化所在國際數據空間
30、參考架構的基礎上,攜手多家機構和廠商,結合本土實踐,提出了“可信數據空間”(Trusted Data Matrix,TDM)的概念。TDM 不僅繼承了 IDS 的核心理念,即在數據主權原則下構建安全、受保護的數據流通環境,還進一步強化了數據流通的安全性、透明度和效率。TDM 通過體系化的技術安排,如數據使用控制、數字身份認證、數據合約數字化等,確保數據流通協議的確認、履行和維護,解決了數據提供方、使用方、服務方、監管方等主體間的安全與信任問題。數據空間概念提出情況及發展情況詳見表 1。表 1 數據空間概念提出及發展情況概念名稱概念提出定義發展現狀國際數據空間(IDS)2016 年德國弗勞恩霍夫
31、協會在數據主權原則下,通過安全數據交換和可信數據共享的政策和機制連接不同公有云平臺的體系結構,旨在構建受保護的數據生態系統。從制造業起步逐漸覆蓋其他行業:共計數據空間 134 個,其中公共數據空間17 個,行業數據空間 46 個,測試床71 個。19可信數據空間(TDM)2022 年 3 月信通院兩化所在現有信息網絡上搭建數據集聚、共享、流通和應用的分布式關鍵數據基礎設施,通過體系化的技術安排確保數據流通協議的確認、履行和維護,解決數據提供方、使用方、服務方、監管方等主體間的安全與信任問題。發布及牽頭多項規范標準:可信工業數據空間系統架構 1.0 白皮書、可信數據空間系統測試規范可信數據空間互
32、聯互通技術規范IEEE P3158 可信數據空間系統架構國際標準ITU-T SG20 TR數據共享控制模型在國家數據局的發文中,對可信數據空間給出如下定義:可信數據空間是基于共識規則,聯接多方主體,實現數據資源共享共用的數據流通利用基礎設施,是數據價值共創的應用生態,是支撐構建全國一體化數據市場的重要載體??尚艛祿臻g具備數據可信管控、資源交互、價值創造等關鍵能力??尚艛祿臻g的核心價值在于通過加密技術、訪問控制等手段,確保數據在傳輸、存儲、處理各環節中的安全,防止數據泄露與篡改,同時采用隱私計算、數據脫敏等技術,實現數據“可用不可見”,保護個人隱私與商業機密。(二)國際數據空間發展及實踐(二
33、)國際數據空間發展及實踐國際數據空間(IDS)是一個以促進安全可信業務生態系統中的標準化數據交換和數據鏈接為目標的研究項目,旨在建立一個去中心化的數據共享平臺,允許不同規模和領域的獨立合作伙伴信任外部各方如何管理其數據,同時促進合作構建創新數據服務。20IDS 的核心是創建一個安全的數據環境,其中數據所有者可以定義對其數據的使用限制,并且這些限制可以在數據共享之前被數據消費者接受。這種以數據為中心的交換方式,不僅保障了數據主權,還通過標準化互操作性,支持了不同數據生態系統之間的數據交換。圖1 國際數據空間參與角色如圖所示,IDS 參與角色包含:核心參與者包含數據提供方、數據需求方;中間機構包含
34、身份認證機構、數據中介、應用商店、詞匯中介、票據交換所等;軟件開發者包含應用開發者和連接器開發者;空間治理機構包含認證機構和評估設施以及標準化組織。21圖2 國際數據空間核心組件IDS 核心組件包含:連接器(Connector)是數據空間中聯通數據與服務的網關,也為各應用程序(App)和軟件提供可信任的運行環境。身份提供組件(Identity Provider)創建、維護和管理一個數據空間內參與者的身份信息及其有效期。合約磋商組件(Contract Negotiation)提供包含創建和協商在內的合約管理服務。策略引擎組件(Policy Engine)負責按數據合約條款執行數據使用策略。策略監
35、測組件(Monitoring)負責跟蹤并反饋策略執行情況。在實踐方面,IDS 倡議已被多個國際研究機構和工業企業所接受,他們共同努力建立一個跨越國界的數據共享生態系統。2020 年 2 月,歐盟委員會發布“歐洲數據戰略”,首次提出構22建九大類數據空間(后增至 17 類),例如歐洲健康數據空間(European Health DataSpace),并提出“單一數據市場”理念,強調鞏固“數據主權”。隨后,英國推出國家數字孿生體原則形成數據空間實施理念,德國聯盟協會構建參考架構,推動數據空間技術標準落地,日本以互聯產業開放框架為核心推動分布式數據共享模式發展。1.1.歐盟委員會發布歐盟委員會發布
36、歐洲數據戰略歐洲數據戰略 形成工業數據空間頂層形成工業數據空間頂層規劃規劃2020 年 2 月,歐盟委員會發布歐洲數據戰略明確提出創建一個單一的歐洲數據空間-一個真正的單一數據市場,向來自全球的數據開放。其中圍繞數據主權和開放共享的立法將成為工業數據空間建設的主要抓手,在 2020 年第四季度針對數據開放及使用方式、行業內及跨行業的數據互操作性等開展立法研究。在 202 年第四季度的數據法案中解決共同生成的工業數據使用權問題,并探索企業愿意共享數據和促進數據生成方面的商業模式。另一方面,基礎設施建設將成為工業數據空間建設的主要推進手段,將加強對云基礎設施的投資,投資時間跨度將從 2021年到
37、2027 年,投資金額將達到 40 億到 60 億歐元?;谘芯繉W界對“歐洲開放科學云”不斷增長的經驗,歐盟委員會將支持建立以下九個歐洲公共數據空間:23歐洲工業(制造業)公共數據空間,以支持歐盟工業的競爭能力 和表現,允許挖掘制造業的非個人數據使用的潛在價值(2027 年預計 達 1.5 萬億歐元)。歐洲綠色協議公共數據空間,通過挖掘數據的巨大潛力,支持綠色協議在以下幾個方面的優先行動,包括氣候變化、循環經濟、零污 染、生物多樣性、森林濫伐、合規保證等?!熬G色數據為人”(GreenData4all)和“拯救地球”(地球數字孿生)兩項計劃將涉及具體措施部署。歐洲出行數據公共空間,確立歐洲在智能
38、交通系統發展領域的領先地位,既包括車聯網,也包括其他交通工具的數據聯網。此項數據空間將方便當前和未來交通和出行數據庫的數據獲取、歸集和共享。歐洲健康數據公共空間,這一方面對預防、診斷、治療疾病方面的領先非常必要,另一方面也是作出有依據、基于證據的醫療決策以促進醫療保健系統數據的可獲得性、有效性和可持續性的必要措施。歐洲金融數據公共空間,通過加強數據共享、創新、提高市場透明度、促進可持續發展刺激金融,為歐洲商業和更加一體化的市場提供金融準入。歐洲能源數據公共空間,采用以客戶為中心的安全和令人信賴的方式,更有力地推動數據獲取和跨行業共享,因為這將促進技術創新和支持能源系統的去碳化進程。24歐洲農業
39、數據公共空間,通過處理和分析農業生產及其他數據來強化農業部門的可持續產能和競爭力,使得能在農場級別上實現精細和定制的生產方法的應用。歐洲公共管理數據公共空間,一是在歐盟和成員國層面提高公共支出、支出質量、反腐敗的透明度和問責力度,二是滿足執法需求、保障歐盟法律有效執行和確保技術創新,涉及“監管科技”、“備案科技”和“法律科技”等支持從業人員和公共利益服務的應用。歐洲技能數據公共空間,旨在減少教育培訓系統與人力市場需求方面的技能錯配。2.2.英國推出英國推出 國家數字孿生體原則國家數字孿生體原則 形成數據空間實施理念形成數據空間實施理念英國數字建造中心發布了英國國家數字孿生體原則,旨在于通過頒布
40、國家級的數字孿生體構建原則,統一各個獨立行業開發數字孿生體的標準,達成孿生體之間高效、安全的數據共享,釋放出數據資源整合的價值,優化傳統英國在社會、經濟、環境方面的發展模式。原則著重指出,數據空間必須依據合理的質量數據來進行構建,確保各參與主體能夠依照一定的規范展開數據的集成處理,保證參與共享的數據資源質量擁有高可靠性。將建立基于行業實踐的數據開放接口當作主要的切入點。原則在遵循整體安全原則的基礎之上,借助開放式應用程序編程接口(API)盡可能25地開放數據,并且支持運用一種通用的方法提高各數字孿生體之間數據集的互操作性。3.3.德國聯盟協會構建參考架構德國聯盟協會構建參考架構,推動數據空間技
41、術標準落地推動數據空間技術標準落地2016 年,德國工業 4.0 開啟了工業數據空間子項目,此項目由德國弗勞恩霍夫應用研究促進協會負責推動。該項目旨在構建一個值得信賴的數據交易共享網絡,為此建立了一整套工業數據空間參考架構模型。其綜合考慮了數據使用者、數據提供者、認證中心、中間代理商等十種主體在數據共享流通中所發揮的作用,精心設計了涵蓋數據主權、數據交易、數據定價等內容的完整商業模型、交易流程以及軟件開發規范,并且為各個主體提供了標準化的軟件接口“連接器”,從技術解決方案的層面保障了數據安全交換以及主權的完整性。后續,由工業數據空間項目衍生成立了國際數據空間協會,所涉及的數據范疇從工業制造延伸
42、至整個數字經濟領域。截至 2024 年,德國有 23 個案例發布在Data Spaces Radar 上,占據案例總量的首位,充分反映了德國在全球數據空間建設方面的領先態勢。4.4.日本工日本工業價值鏈協會以互聯產業開放框架為核心推動分業價值鏈協會以互聯產業開放框架為核心推動分布式數據共享模式發展布式數據共享模式發展2019 年,日本工業價值鏈協會發布了互聯產業開放框架(以下簡稱“CIOF”),這一舉措意味著日本工業數據空間布局正式拉開帷幕。與德國工業數據空間項目有所不同,日本模式聚焦于互聯產業開放框架,規避數據主權問題,運用分布式平臺的26方式推動數據共享。其通過數據流通合同的形式,對工業數
43、據的使用許可范圍、供需雙方的權利和義務,以及數據使用過程中衍生出的其他問題予以明確界定?;诜植际狡脚_,由數據的提供方和使用方直接進行對接,探索并形成雙方均認可的數據字典,以此保障數據流通的獨立性。與此同時,現場數據和相關數據資產由 CIOF 系統直接進行管理,并借助區塊鏈技術確保數據按需加密和傳輸,從而有效防止數據偽造。當下,日本工業價值鏈協會正在積極推進一項涵蓋日本 100 強企業的工業數據共享項目,將運用區塊鏈技術來降低數據泄露的風險以及運營成本。(三)我國數據空間發展及實踐(三)我國數據空間發展及實踐中國不僅是制造大國,也是數據資源與應用方面的大國。預計到 2025 年,中國的數據總量
44、會攀升至世界首位,在全球的占比有望超出 27%,進而成為數據規模最大、數據類型最為豐富的國家之一。當前我國的數據共享流通尚處在起始階段,需要參考發達國家頂層設計、交易共享等方面的先進實踐經驗基礎上,構筑契合我國發展現狀的數據共享流通架構,從而更進一步推動數據要素的市場化進程。我國在數據空間的發展和實踐方面,也已經展現出了積極戰略布局。在國家層面,數據空間被視為支撐經濟社會數字化轉型的關鍵新型基礎設施。通過整合現有的政務云平臺、數據資源平臺和信息共享平臺等,結合“數據要素”三年行動計劃的27實施,我國正加快金融、工業、農業、商貿、交通等多個行業的數據空間基礎設施建設。在區域層面,我國正推動構建以
45、中心城市為核心的區域數據樞紐,如北京、上海、廣州等,這些樞紐將覆蓋不同的地理區域,形成跨層級、跨地域的數據流通架構。同時也在鼓勵不同行業和區域數據空間的互聯互通,構建起全國一體化的數據生產流通平臺。在政策和標準制定方面,我國也在積極推動。例如,工信部印發的工業大數據發展指導意見和工業互聯網創新發展三年行動計劃,都強調了探索建立工業數據空間、推動數據開放共享的重要性。同時,中國信息通信研究院發布的可信工業數據空間系統架構白皮書,為可信工業數據空間的初步架構和標準體系提供了指導??傮w來看,我國數據空間的發展和實踐正處在一個快速起步推進的階段,不僅在基礎設施建設方面取得了成效,而且在政策支持、技術應
46、用和標準制定等方面也展現出了清晰的方向。隨著技術的不斷成熟和應用場景的不斷拓展,數據空間有望成為推動我國數字經濟發展的重要力量。1.1.相關政策密集出臺,引導數據有序利用相關政策密集出臺,引導數據有序利用在 2017 年,國家“十三五”先進制造技術領域科技創新專項規劃明確指明,要致力于研發企業智慧數據空間構建技術系統,并開展平臺的典型應用。2020 年,關于工業大數據發28展的指導意見進一步強調,將通過探尋建立工業數據空間、加速區塊鏈等技術于數據流通中的應用、健全工業大數據資產價值評估體系等途徑,從技術手段、定價機制、交易規則等眾多方面發力,激發工業數據市場的活力,推動數據的市場化配置。202
47、1年 11 月,“十四五”大數據產業發展規劃清晰提出要“率先于工業等領域構建安全可信的數據共享空間”。2024 年 11 月,國家數據局發布可信數據空間發展行動計劃(20242028 年),將可信數據空間發展帶到新階段。其中提出以建設可信可管、互聯互通、價值共創的數據空間為重點,分類施策推進企業、行業、城市、個人、跨境可信數據空間建設運營,為充分釋放數據要素價值,激發全社會內生動力和創新活力,構建全國一體化數據市場提供有力支撐。并明確到 2028 年,可信數據空間標準體系、技術體系、生態體系、安全體系等取得突破,建成 100 個以上可信數據空間,形成一批數據空間解決方案和最佳實踐,基本建成廣泛
48、互聯、資源集聚、生態繁榮、價值共創、治理有序的可信數據空間網絡。2.2.各區域及行業積極開展數據空間探索實踐各區域及行業積極開展數據空間探索實踐2020 年,北京印發關于推進北京市金融公共數據專區建設的意見,大力推動金融公共數據專區的建設。通過匯集多維數據,有效提升了金融服務的效率,為普惠金融的發展以及智慧城市的建設提供了有力支持。該專區主要聚焦于特定的領域或場景,推動政企數據的融合,提升數據開放的程度,促進數據資源29在社會層面的利用。其運營模式由市經信部門進行統籌協調,授權市屬國有企業開展專業化運營,以此確保數據使用的公益性以及技術的安全性。此外,在北京的基礎設施建設、技術應用層面,充分利
49、用區塊鏈隱私計算等技術,實現數據可用不可見,推動專區數據流通的科技創新。2023 年 11 月,北京數據基礎制度先行區啟動運行,提出到 2030 年,完全建成北京數據基礎制度先行區,打造數據要素市場化配置的政策高地、可信空間和數據工場。2023 年,深圳數字交易所聯合多方成功達成了國內首筆基于數據空間技術的場內數據業務合作,塑造了我國首個在智能制造領域的數據空間應用范例。這一具有里程碑意義的事件,象征著可信數據空間技術在國產商業領域實現了實質性的落地。這不僅彰顯了可信數據空間技術在國產商業化方向的可行性,還為行業數據要素的高效流通、合規使用提供了全新的解決辦法。該案例運用自主可控的可信數據空間
50、架構,通過構建產業數據要素的可信流通體系,達成了數據的安全流轉和可信共享,切實解決了數據協同、監控和溯源的難題,為產業數據要素的交易給予了堅實的技術支撐,為數據驅動的實體經濟發展注入了嶄新的動力。3.3.圍繞可信工業數據空間開展生態建設圍繞可信工業數據空間開展生態建設由中國信息通信研究院聯合多家單位在 2021 年發起成立可信工業數據空間生態鏈(TDMC),聯盟成員單位包括國有企業、工業制造企業、互聯網企業、技術公司、科研院校、數據交易服務機構等。聯盟立足于搭建工業數據要素可信流通、共享的生態30合作與促進平臺,開展可信工業數據空間技術、標準和產業研究,共同探索工業數據要素可信流通的新模式和新
51、機制,推動技術落地應用、開展試點示范,推進可信工業數據空間發展,服務工業企業,為實施工業互聯網相關政策提供必要支撐。自成立以來,聯盟共發布可信工業數據空間系統架構 1.0、可信工業數據流通關鍵技術研究報告、可信工業數據流通應用案例集等成果,并推動 ITU、IEEE 等國內外標準組織中的技術標準研制工作,首個 IEEE 數據空間標準 IEEE 3158-2024Standard forTrusted Data Matrix System Architecture已于 2024 年 6 月6 日發布。2021 年中國工業互聯網研究院聯合相關部屬事業單位、科研院所、工業互聯網平臺企業共同發起成立工業
52、互聯網平臺創新合作中心,同年海爾卡奧斯發起工業數據空間技術組。技術組以促進工業數據空間行業高質量發展為目標,旨在推動共建統一標準下的可信數據生態系統,促進數據流動與數據共享,建設安全、開放、合作、有序的工業數據空間命運共同體,形成多個面向不同領域、行業的工業數據空間試點。技術組旨在促進工業數據空間安全與治理領域的技術研究及應用,提升工業企業數據治理能力,助力以數據為關鍵要素的數字經濟發展。技術組已發布工業數據空間場景案例集等成果。31四、金融數據可信流通方案研究(一)金融數據可信流通典型場景(一)金融數據可信流通典型場景數據在銀行業等金融行業都得到廣泛的應用,數據流通價值體現在能夠有效提升業務
53、效能、優化資源配置、強化風險控制能力、促進業務創新發展。應用場景包括信貸風險評估、交易欺詐識別、精準營銷、供應鏈金融、運營優化、智能投顧、量化投研、風險定價、金融反欺詐、反洗錢等多方面。例如,銀行機構與運營商數據實現聯合建模及可信數據流通,建立手機銀行登錄行為異常識別模型和電信反欺詐服務,極大提升銀行電信反欺詐的效果和效率。1.1.賦能創新產品,精準貼合需求賦能創新產品,精準貼合需求由于數據壁壘能夠在金融數據可信流通中得到解決,金融機構能夠更全面進行風險評估,產品設計完全基于客戶需求,真正向客戶提供個性化金融產品,并把個性化產品的營銷流程嵌入合作平臺場景中。2.2.融合多方數據,提升營銷效率融
54、合多方數據,提升營銷效率在金融數據可信流通架構下,金融機構數據、公共數據實現融合,避免公共數據涉及的用戶數據及外部數據交互過程中出現隱私泄露風險。金融機構可提前對客戶進行業務預核實,將平臺算法自動與客戶信息庫進行匹配,并通過建模將符合初篩條件的對象信息和公共數據通過金融數據可信流通方式向營銷部門進行反饋,快速匹配營銷策略,提高營銷效率。323.3.預測用戶行為,實現營銷預判預測用戶行為,實現營銷預判借助金融數據可信流通方式,金融機構將合規收集更多維度數據,以此來預測客戶行為,推算用戶購買能力、風險偏好、授信額度、承保概率等因素,并對用戶進行有針對性觸達。4.4.提升業務流程,優化客戶體驗提升業
55、務流程,優化客戶體驗保險公司可以借助金融數據可信流通方式實現智慧理賠,客戶進行理賠時,壽險公司通過隱私計算平臺發送理賠數據請求,醫療機構、社保局、稅務局分別將患者的就診數據、結算單據、醫保結算、電子發票等通過隱私計算節點同壽險公司理賠數據進行計算,全面提升賠案處理效能。5.5.全景化角度下的大數據風控升級全景化角度下的大數據風控升級通過采用金融數據可信流通,在利用多維度的數據為客戶做更精準的畫像同時,可結合其他新興技術有效解決“數據隱私”和“數據孤島”問題,全景化提升金融機構的風控能力。金融數據可信流通在提升金融服務效率和體驗、降低金融風險和成本、創新金融產品和模式等方面有著顯著作用,在金融領
56、域的應用場景具有較大空間,隨著金融數據可信流通與各個金融場景的深度融合,將進一步提升金融服務質效,為新質生產力“蓄勢賦能”。(二)金融數據可信關鍵角色(二)金融數據可信關鍵角色33數據資源流通是一個復雜的多方參與和協作的過程,明確數據流通參與方角色職責對于構建有效的數據流通體系至關重要。從業務視角看,可信數據空間主要包含以下利益相關方:圖3可信數據空間關鍵角色1.數據提供方:提供在可信數據空間中流通交易的數據,并對數據使用策略進行授權;2.數據使用方:在可信數據空間中提出流通交易的需求,并按數據使用策略接收并使用數據;343.數據空間運營方:建立合規、互信、安全的技術體系,搭建和維護數據交易和
57、流通平臺,制定數據交易規則、流程、定價機制,促進數據供需雙方的對接和交易流通,釋放數據價值。4.數據服務方:支撐可信數據空間提供流通交易、可信合規、增值服務、基礎設施等各類活動,為各利益相關方提供相應的中間服務,其可由數據交易所、數據商以及第三方專業服務機構等擔任,輔助可信數據空間中各類業務的開展;5.可信數據空間監管方:在可信數據空間中,對各利益相關方的行為進行監督管理,保障國家數據安全和各參與方權益,推動數據要素市場健康發展。在可信數據空間中,這些角色相互協作、相互制約,共同推動數據流通利用。數據提供方和數據使用方可直接開展數據流通交易,也可通過數據交易所等中間服務方進行集中流通交易。在實
58、際操作中,角色之間關系并非一成不變,一個組織可能承擔多個角色,并且隨著市場發展還可能出現新的角色。(三)數據資源流通模式(三)數據資源流通模式金融數據資源流通應用場景豐富,導致數據資源流通模式多樣,本研究根據實際應用場景提煉出點對點流通、點對多流通、多點互聯流通三種流通模式,可基本覆蓋數據資源流通場景。用戶根據具體情況選擇合適的流通模式,或者同時采用多種流通模式,以實現數據資源最優流通模式選擇。35模式一模式一:點對點模式。該模式在數據共享流通場景中最為常見(如圖 4 所示)。以銀行風控數據流通為例,銀行與數據提供方提前線下協商后,數據提供機構將銀行所需數據交付給銀行。在此過程中,數據提供方(
59、機構或數據廠商)提供數據,數據使用方(銀行)需要數據進行加工后支撐風控業務。圖 4點對點模式模式二模式二:點對多模式。隨著數據流通的普及,參與方數量增多,同一個數據資源往往出現多個數據使用方,每個使用方需求不同,點對點的數據共享流通方式給數據提供方帶來較大不便,因此數據提供方將數據進行加工,形成標準化的數據產品或服務,同時提供給多個數據使用方(如圖 5 所示)。例如:多家機構共享同一份客戶數據樣本,進行 AI 模型訓練。點對多模式使得數據的共享與流通在效率上有較大提升。36圖 5點對多模式模式三模式三:多點互聯模式。隨著數據流通參與方增多,各相關方對數據使用范圍、深度和安全提出不同要求,出現了
60、多點互聯模式。在該模式中,各參與方通過數據市場進行數據的發布、檢索,同時該類模式提供完整的覆蓋各類角色的數據流通業務流程,構成數據可信流通模式(如圖 6 所示)。37圖 6多點互聯模式以上三種金融數據可信流通模式各有特點,適用于不同的數據流通場景。在基于數據空間的數據可信流通方案中,通??芍С稚鲜鋈N數據流通模式,在實際應用中,可根據業務需求選擇合適的流通模式。(四)金融數據可信流通方案架構(四)金融數據可信流通方案架構金融數據可信流通的方案架構(如圖 7 所示),自下而上分別為:數據流通支撐設施層、數據調度處理層、數據控制層以及數據運營服務層。38圖 7 金融數據可信流通方案架構流通支撐設施
61、層是數據共享流通的基礎與載體,包括計算資源、存儲資源、網絡資源等基礎支撐設施。數據調度處理層實現數據可靠供給和合規流通,保障數據能夠供得出、流得動。數據控制層實現了數據共享流通的安全可信與透明,保障數據生命周期安全可控。數據運營服務層實現了合規倍增的價值鏈,使數據能夠用得好,充分釋放數據價值。(五)金融數據可信流通方案關鍵技術(五)金融數據可信流通方案關鍵技術1.1.數據訪問控制數據訪問控制數據訪問控制定義對具有價值的信息資源的訪問都應該通過認證。用戶在進行訪問之前,通常會被要求提供正確的認證。最常見的認證方法是39提供用戶名和密碼的組合。然而用戶名和密碼是靜態認證方式,很容易被破解。對于具有
62、高價值的信息,應采用強度更高的認證方法。訪問控制通過組合多種認證要素可以有效的提高認證強度。按用戶身份及其所歸屬的某項定義組來限制用戶對某些信息項的訪問,或限制對某些控制功能的使用的一種技術。數據訪問控制的作用通過對身份認證和確認,實現控制只允許哪些人可以訪問數據和哪些人不可以訪問數據。2.2.數據使用控制數據使用控制數據使用控制技術定義數據使用控制是對傳統訪問控制機制的擴展,支持復雜的策略控制要求,是實施數據流通后數據權益保護的關鍵機制。訪問控制技術僅僅是在某個指令執行前發揮作用,一旦操作完該指令,訪問控制便再也不會對數據有任何作用。數據使用控制是將數據控制權始終保持在數據提供方,使得數據提
63、供方的控制策略能夠在數據全生命周期進行執行。數據使用控制將數據使用控制延伸到數據使用方,例如控制數據在使用方使用一定時長或一定次數后自動執行刪除。通過數據使用控制技術將數據控制權始終控制在數據提供方手中。40訪問控制vs使用控制圖 8 訪問控制與使用控制的對比通過 4W2H 的模型化描述可以更進一步體現使用控制的能力特性,使用控制策略可以控制使用方的目標角色(Who)在確定的時間(When)和位置(Where)通過何種應用(How To)以多大量級(How Many)訪問和處理數據(Do What)。圖 9“4W2H”控制策略數據使用控制的典型能力如表 2 所示:41表 2 數據使用控制能力編
64、號使用控制能力1基于時間段的使用控制2基于時長的使用控制3基于用戶的使用控制4基于地域的使用控制5基于數據接收方安全級別的使用控制6基于應用的使用控制7基于數據使用次數的使用控制8要求數據流通加密的使用控制9要求數據流通前脫敏的使用控制10要求數據使用后發送日志的使用控制11要求數據使用后通知數據權益方的使用控制12要求數據使用超過一定期限后刪除的使用控制13要求數據使用方落盤加密的使用控制14控制數據使用方能否轉發數據 數據使用控制技術的作用數據使用控制為數據提供方提供了在數據跨域流動場景中對數據權益的保護,在執行交換關鍵和敏感數據交易中,數據使用控制技術強制執行數據提供方制定的數據限制策略
65、,始終將數據控制權限、知情權限和拒絕權限始終保持在數據提供方手里,打消了數據提供方數據流通利用的顧慮。3.3.數據空間連接器數據空間連接器 數據空間連接器的定義數據空間連接器是數據空間的核心組件,作為參與方接入數據空間的入口,負責數據空間中數據資源的安全可控交換。它是實現可信數據流通的關鍵基礎能力模塊。數據空間連接器的作用42數據空間連接器提供數據接入、可控交換、數據消費能力,通過數據連接器可實現數據提供方和數據消費方之間數據的流通和可控使用,在數據空間連接器內執行數據訪問和數據使用控制策略,確保數據交換過程的安全性和可追溯性。4.4.智能合約智能合約 智能合約技術的定義將傳統合約數字化,并以
66、信息化方式傳播、驗證或執行的計算機協議。與傳統合約相比,智能合約不依賴第三方執行合約,讓合約驗證和執行過程更加便捷。合約允許多方用戶共同參與制定一份智能合約,通過 P2P 網絡擴散并存入區塊鏈,并自動執行,從而能夠保證合約條款的安全可靠,讓雙方進行可信交易,并且這些交易可追蹤且不可逆轉。在金融數據交易過程中,通過智能合約技術能夠縮短交易流程。一體化智能合約技術的作用智能合約不需要第三方執行,并且可以自動執行。另外智能合約可以實現自動化交易托管,減少交易流程中耗費的時間成本。5.5.數據脫敏數據脫敏 數據脫敏的定義數據脫敏是指對某些敏感信息通過脫敏規則進行數據的變形,實現敏感隱私數據的可靠保護。
67、目前數據脫敏較常見應用在涉及客戶安全數據或者一些商業性敏感數據的情況下,在不違反系統規則條件下,對真實數據進行改造并提供測試使用,如身份43證號、手機號、卡號、客戶號等個人信息都需要進行數據脫敏。數據脫敏類別可分為結構化數據脫敏和非結構化數據脫敏。數據脫敏的作用數據脫敏可以將數據漂白,抹去數據中的敏感內容,同時保持原有的數據特征、業務規則和數據關聯性。保證開發、測試、培訓以及大數據類業務不會受到脫敏的影響,達成脫敏前后的數據一致性和有效性。6.6.數據數據編織編織 數據編織的定義數據編織是一種統一的數據管理架構,通過智能化和自動化的方式,將分布在不同位置、不同形態的數據資源進行統一集成和協同管
68、理,實現數據的無縫連接、治理和服務。它為組織提供一個跨平臺、跨環境的統一數據管理視圖。數據編織的作用數據編織通過全局命名空間的打造,實現數據資產的可視、可管、可用。數據編織技術實現數據的無縫連接和協同,提供統一的數據訪問接口,支持跨平臺數據集成,并具備智能化的數據治理能力。通過數據編織,組織可以降低數據管理的復雜度,提升數據質量和可用性,加速數據價值實現。提供統一的數據視圖和訪問接口,使用戶能夠跨多個系統和平臺訪問數據。447.7.數據加密技術數據加密技術 數據加密的定義數據加密技術原理是將一個信息(或稱明文)經過加密鑰匙及加密函數轉換,變成無意義的密文,而接收方則將此密文經過解密函數、解密鑰
69、匙還原成明文。加密技術是實現網絡安全技術的基石,其中加密鑰匙是確保數據安全性的關鍵。數據加密的作用數據加密技術的主要目標是保護數據的機密性和完整性,防止未經授權的訪問和篡改。通過使用強加密算法和密鑰管理策略,數據加密可以確保數據在傳輸和存儲過程中的安全性。數據加密技術可以應用于各種場景和平臺,包括云服務、網絡傳輸等。它可以根據不同的安全需求,選擇不同的加密算法和加密強度,以適應各種應用環境。數據加密技術通常與數字簽名等驗證機制結合使用,可以確保數據的完整性和真實性。數字簽名可以驗證數據在傳輸過程中是否被篡改,并驗證數據的來源是否可靠。在數據加密技術中,密鑰的管理至關重要。密鑰是加密和解密數據的
70、核心,因此必須采取嚴格的密鑰管理措施,包括密鑰的生成、分發、存儲、銷毀等,以防止密鑰泄露和濫用。8.8.可信執行環境可信執行環境 可信執行環境的定義45可信執行環境(以下簡稱 TEE)是主處理器內的安全區域。它運行在一個獨立的環境中且與操作系統并行運行。這個并行系統相對于傳統系統更加安全,它確保加載的代碼和數據的機密性和完整性都得到保護。在 TEE 中運行的受信任應用程序可以訪問設備主處理器和內存的全部功能,而硬件隔離保護這些組件不受主操作系統中運行的用戶安裝應用程序的影響。TEE 通過加密和隔離保護不同的受信任應用程序??尚艌绦协h境的作用可信執行環境在中央處理器上構建一塊受保護的計算執行空間
71、與其他區域隔離,保證在該環境下所加載的數據和執行的程序的安全性、完整性。在可信執行環境內部,應用運行也是相互獨立的,不能無授權互訪問。9.9.安全多方計算安全多方計算 安全多方計算定義安全多方計算問題是在一個分布式網絡上計算基于任何輸入的函數,每個輸入方在這個分布式網絡上都擁有一個輸入,而這個分布網絡確保輸入的獨立性,計算的正確性,而且除了各自的輸入外,不透露任何可用于推導其他方輸入和輸出的信息。主要有混淆電路、同態加密、秘密分享三種形式。安全多方計算主要面向的是在多個參與方的環境下,每一個參與方都擁有自己的私密信息,同時又希望利用其他的信息來共同完成計算一個函數的過程。46 安全多方計算的作
72、用安全多方計算提供了一種基于密碼學的解決方案,重點解決金融數據在計算過程中的隱私安全問題,在不泄露原始數據的前提下,實現多方協同計算,使得參與方無法得到除計算結果之外的其他信息,保障金融數據的安全共享、流通、計算和交易。10.10.聯邦學習聯邦學習 聯邦學習定義聯邦學習是一個機器學習框架。在多參與方或多計算結點之間開展高效率的機器學習。聯邦學習做到各個參與方的自有數據不出本地,而后通過加密機制下的參數交換方式,在保障數據隱私的情況下,建立一個虛擬的共有模型。這個虛擬模型相當于聚合在一起建立的最優模型。在建立模型的過程中,各個參與者的身份和地位相同,而聯邦系統幫助大家建立了安全共享的策略。另外根
73、據原始數據的分布規律,常用的聯邦學習模式主要有橫向聯邦學習、縱向聯邦學習和遷移聯邦學習。聯邦學習的作用能夠保證參與各方在保持獨立性的情況下,進行信息與模型參數的加密交換,并同時讓各自的模型獲得成長。11.11.區塊鏈存證區塊鏈存證 區塊鏈存證定義區塊鏈數據存證,就是把數據標識(哈希值)存到區塊鏈上,達到防篡改、可追溯、數據來源可信任的目的。一般情況下,通47過鏈上鏈下協同工作,采用文件與哈希值分離的方式,鏈上只保存文件的哈希值,原文件保存在鏈下。只要計算出文件的哈希值,與鏈上的哈希值比對,就知道文件是否被篡改。區塊鏈存證的作用區塊鏈存證最大作用就是防篡改。尤其針對電子合同,區塊鏈存證功能加強了
74、智能合約存證期間的不可篡改性。12.12.數據沙箱數據沙箱 數據沙箱定義數據沙箱是一種可信管控技術,通常通過硬件或軟件技術實現代碼和數據的隔離,例如虛擬機、容器等技術。它提供了一個隔離的環境,用于在安全的邊界內執行外部代碼和數據,確保應用程序不會對主機系統或數據造成損害,允許數據使用方在安全和受控的區域內對數據進行分析和處理。數據沙箱的作用數據沙箱通過隔離技術實現數據的防泄漏,能夠保障數據在安全環境中使用和分析,不會被泄露到沙箱外部。13.13.密態計算密態計算 密態計算定義密態計算是一類在數據加密狀態下直接進行處理和計算的技術,能夠在保護數據隱私的同時實現數據的分析和利用。數據在全生命周期中
75、始終處于“看不見”的加密狀態,實現“可用不可見”。48 密態計算的作用通過密態計算旨在實現從數據進入系統到計算完成,再到輸出結果的全生命周期保護。無論是在數據存儲、傳輸,還是在多步驟、多算子的復雜計算中,密態計算都能夠保證數據在整個流程中始終保持密態化。這種全鏈路加密的特性,顯著降低了流通和加工等中間環節的數據泄露風險。49五、典型場景應用與技術驗證(一)中信銀行總分行數據流通管控實踐場景(一)中信銀行總分行數據流通管控實踐場景1.1.場景及需求場景及需求在中信銀行內部,為了滿足分行經營管理、績效管理等系統使用數據的需求,總行定期按照預設規則給各分行下發分行所轄范圍內的數據,其中包括敏感數據和
76、非敏感數據,同時分行按照外部機構或內部合規管理要求,按需向總行申請使用數據,其中部分場景涉及客戶敏感數據。圖 10 總分行數據可信流通數據在總、分行流通過程中,有明確的數據安全策略,并在數據流通前采取了嚴格事前審批、數據流通過程中對數據進行加密、對數據使用過程中進行隔離管控等技術措施保護敏感數據。但當前對于數據申請方獲取數據后的使用策略,缺少精細化的技50術管控手段,對于數據流通、使用全過程難以做到最小必須、可感知、可管控、可審計。亟需探索一種數據可信流通方案,支撐總分支行數據高效流通,統一安全隱私策略管控,在保證數據權益的前提下,建立信任,提升數據流通效率。2.2.技術驗證方案技術驗證方案圖
77、 11 總分行數據管控中信銀行聯合華為公司開展聯合創新,在總分行部署可信數據空間方案,通過可信數據空間技術的應用,實現敏感數據安全優先、非敏感數據效率優先的總體目標,在數據下發源頭即植入數據安全策略,在分行側各類數據使用場景中,全過程校驗安全策略校驗。實現總分行兩端、系統和用戶之間端到端的數據使用安全控制?;跀祿鎯Y源池實現數據流動安全控制、數據使用安全控制能力?;跀祿旨壏诸悩撕炋峁娭圃L問控制策略,滿足51數據資源流動過程中的基礎合規保障。面向業務應用提供數據流動、數據使用控制能力,滿足數據按需流動、限時限期使用等安全策略要求?;诳尚艌绦协h境構建安全底座,提供面向業務應用及用戶的更
78、加豐富的數據使用控制能力。例如依據業務需求及策略要求限定使用時間、使用地點、使用次數、使用方式、如何使用等精細化使用控制手段,確保用戶符合最小必須要求合規使用;3.3.預期效果預期效果技術價值:實現數據使用過程可感知、可管控、可審計,建立面向數據細顆粒度(如文件或字段)的使用安全控制,同時增加多重控制維度,實現“4W2H”(Where、Who、When、Do What、How to、How Many)最小化控制,基于最小必須原則滿足總行統一數據管控策略要求。業務價值:中信銀行軟件開發中心基于數據空間開展企業及行業數據流通探索,有效促進了內外部數據流通整合,支撐全域數據的統一管理、融合共享,助力
79、金融產品和風控模型優化,提升金融服務和風險管控質效。同時,及時響應國家“數據要素”行動計劃,探索金融行業數據空間建設,為金融機構間數據共享共用和高效流通,為培育高質量金融數據市場貢獻力量。52(二)工銀金租數據流通(二)工銀金租數據流通場景場景1.1.場景及需求場景及需求2022 年初人民銀行印發金融科技發展規劃(2022-2025年),將充分釋放數據要素潛能作為重點任務,高度重視客戶信息數據治理工作,建設外部數據流通的生態體系,確保我行在安全、合規的前提下深度融入外部數據要素流通市場,提升內部外部數據融合場景賦能,助力我行搶占數據要素流通市場的先機和制高點。在反欺詐數據交易合規防控中,尚缺乏
80、有效的手段以保證客戶信息的準確性,且在當客戶信息發生變化時,無法及時獲取相關情況更新客戶信息。此外,隱私泄露、數據安全和數據孤島等問題無法保證客戶數據可信流通。工商銀行依托聯邦學習平臺,利用大數據分析、聯邦學習等技術,積極推進數據要素的內引外拓,充分發揮數據精準直達優勢提高企業在營銷展業、風險防控、內控合規等方面的運行質效,同時為開展客戶智能營銷和金融科技創新提供精準的發力方向。工商銀行數據交易平臺是同業首家建成的面向互聯網開放的數據交易平臺,目前已入駐企業 34 家,上架 380 余項數據產品,撮合交易 1676 萬元。平臺立足金融行業,涵蓋精準營銷、信貸風控、反欺詐、反洗錢等多個業務領域,
81、已完成與上海數據交易所的深度對接,實現在數據交易平臺展示上數所掛牌的 38853項金融類數據產品的詳細信息,是同業首家對接數據交易所的數據要素流通平臺。2.2.技術驗證方案技術驗證方案基于數據交易平臺完成數據資產的交易流通,利用聯邦學習平臺完成數據資產的交付,利用隱私計算技術,將工銀金租反洗錢系統和總行咨訊平臺中的工商數據進行對接,通過工銀金租客戶的數據與工商數據的部分字段對比,從而校驗工銀金租客戶信息準確性;利用區塊鏈技術,實現數據權益鑒別、數據完整性核驗、數據使用記錄追溯等業務訴求,提供數據確權、數據鑒真及存證溯源服務,并對全流程交互信息進行可信存證監控,以支撐數據登記、數據交易、數據交付
82、、使用審計等數據全生命周期流程的閉環。圖 12 數據流通場景圖543.3.預期效果預期效果技術價值:通過聯邦學習技術,在原始數據不出域的情況下,實現多方合作聯合建模,在隱私保護跨機構數據共享的前提下,數據撞庫成功率達 90%以上,提高客戶信息準確性,有效進行風險防控。聯邦學習技術,全面賦能數據要素的有效流通,提高數據賦能水平,增強企業競爭力。社會價值:工商銀行軟件開發中心基于數據交易平臺搭建的工銀金租數據流通項目,能夠助力銀行全業務、全流程的安全保障,形成全行用數的外部數據生態體系,實現數據對業務的及時賦能和數據驅動智能化決策,賦能普惠金融,助力鄉村振興等實體經濟。(三)銀聯安全生物特征支付(
83、三)銀聯安全生物特征支付場景場景1.1.場景及需求場景及需求數字經濟時代,用戶生物特征信息的應用面臨越來越高的合規風險?;谏锾卣餍畔⑦M行用戶身份識別的生物識別技術,在金融、安防、電子商務等諸多場景實現了廣泛應用。一般通過客戶端采集生物特征信息,將用戶的明文數據傳輸到云端服務端進行特征值的提取和驗證。對于用戶而言,生物特征信息需明文傳送至云端;對于金融機構而言,保留用戶生物特征信息也需要承擔數據泄露的風險。在金融支付場景中,更需要平衡業務需求與個人信息保護之間的關系。在人臉特征識別之支付場景中,為保障數據安全,金55融機構收集的人臉圖片或特征信息不能完整存儲于一方,需要在多方協同下完成身份驗
84、證與識別。為滿足此應用需要,形成了基于安全多方計算和基于可信執行環境兩種實現方案。2.2.技術驗證方案技術驗證方案人臉識別支付是一種利用人工智能技術,特別是神經網絡,來識別個體面部特征并進行身份驗證的支付方式。系統通過卷積神經網絡(CNN)從輸入的圖像中自動提取出人臉的深層特征,將圖像數據轉換為低維度的特征向量,通過與已存儲的用戶面部特征相匹配,從而完成支付過程中的身份驗證?;诎踩喾接嬎闳四樧R別支付中,通過多方安全計算(簡稱“MPC”)秘密分享的方式將生物特征隨機切分成碎片存儲至兩個獨立的實體,任一參與方都無法恢復完整的生物特征,降低了泄露風險。同時,基于 MPC 安全多方計算技術進行人臉
85、圖像特征提取和特征比對計算,確保生物特征數據的安全和計算結果的正確性、完整性。在實用性方面,采用明密文混合運算優化深度神經網絡的離線特征提取,采用秘密分享、同態加密混合計算優化 1:N 特征比對在線處理。在不改變用戶生物特征識別處理流程的基礎上,有效提升 MPC 安全生物特征處理效率,滿足人臉識別支付場景的生產可用要求。56圖13 基于安全多方計算的人臉識別框架3.3.預期效果預期效果該項目于 2021 年 4 月入箱人民銀行上海金融科技創新監管試點第二批應用試點,依托基于隱私計算技術的數據要素安全流通基礎設施,完成卡組織和某銀行雙邊網絡的多方安全計算系統部署。2023 年 4 月由北京金融科
86、技創新監管工具實施工作組宣布完成出箱。項目綜合運用了隱私計算安全多方計算技術,深度結合人臉識別場景,為中華人民共和國個人信息保護法等法律法規中對于用戶生物特征(人臉)信息的安全合規使用要求提供了解決方案。在用戶敏感信息存儲方面,提出了生物特征分散存儲的模式。為確保用戶生物特征(人臉)信息的合規使用,將用戶人臉特征信息經處理后形成計算因子,分散存儲在多個機構,即使單個機構的計算因子泄露,也無法恢復完整的用戶人臉信息。同時,單個機構保存的計算因子無法獨立完成交易驗證過程。在隱私計57算應用方面,通過技術優化使得隱私計算安全多方計算在人臉特征提取、特征比對等處理的性能能夠逐步滿足生物特征識別場景的生
87、產可用要求。安全多方計算在分片特征上的比對性能,當前響應時間已經達到秒級以內,使得整體產品能夠達到真正生產可用的水平。(四)金智塔小微企業智能授信風控創新實踐場景(四)金智塔小微企業智能授信風控創新實踐場景杭州金智塔科技有限公司聯合某公司打造的 隱私計算助力小微企業智能授信風控創新實踐 項目響應了國家關于數字經濟、普惠金融的政策要求,通過平臺實施落地,降低銀行風險的同時,化解了小微企業的貸款難、貸款貴的問題,有力的推動了金融機構與小微企業高質量發展,助力浙江共同富裕示范區建設。1.1.場景及需求場景及需求2021 年 11 月 20 日,中央政治局委員、國務院副總理劉鶴指出,金融機構要加大對企
88、業創新的支持,探索利用數字技術為企業增信,解決小微企業及個體戶融資難問題。但小微企業缺乏固定資產,有效抵押物不足,且信息透明度較差,難以提供真實有效數據用于風險評估。銀行急需多維數據全面評估貸款風險,化解小微企業貸款難、銀行風險高的問題。隨著數據合規監管趨嚴,銀行業又面臨無法接入外部數據的難題。2.2.技術驗證方案技術驗證方案本方案運用多方安全計算、聯邦學習和區塊鏈等技術,安全合規融合銀行內外部數據,實現數據可用不可見,建立實時動態58360 度小微企業用戶畫像與關系圖譜,全方位了解企業狀況。通過貸前準入規則、反欺詐、黑名單、信用評分卡以及額度利率等模型,實現智能授信、風控。具體技術方案如下:
89、圖 14 技術方案1.某銀行和某機構部署金智塔隱私計算節點,某銀行作為需求方,雙方均作為數據提供方。2.某銀行向某機構發起企業數據申請,某機構審批通過后將多維度企業數據導入隱私計算節點。3.雙方數據根據企業營業執照號碼進行隱私求交對齊,然后使用聯合 SQL 進行特征分析、特征篩選。4.在特征工程的基礎上,根據某銀行提供的標簽進行聯合建模(線性模型、樹模型),建立智能授信、風控模型。5.智能授信風控模型對增量企業進行評分,得到潛在優質客戶名單。6.某銀行根據行內業務規則,將模型評分作為決策因子,對企業進行進一步篩選,得到最終的授信名單。593.3.預期效果預期效果本項目做了大量的技術創新,多篇論
90、文發布在 WWW、KBS、IJCAI 等國際期刊上,并申請了 3 項發明專利,2 項已獲授權。主要的創新點如下:1、應用隱私保護機器學習新技術,在數據不出域的前提下,進行高效的機器學習建模。金智塔科技提出了一種將隨機排列和秘密分享結合的隱私保護機器學習框架。這種方法比現有的加密方法更有效,可以顯著減少計算開銷。同時,金智塔科技的方法相比聯邦學習算法更加安全。實驗結果表明,金智塔科技的方法不僅計算速度快了 5 倍,而且減少了 80%的網絡開銷。2、創新設計基于兩階段的隱私保護 CDR 框架,在保護數據隱私前提下,有效緩解數據稀疏性??缬蛲扑](CDR)被廣泛研究以緩解推薦系統中普遍存在的冷啟動和數
91、據稀疏問題。大多數現有的 CDR 模型都假設信息可以直接跨域傳輸,而忽略了隱私問題。為了解決這個問題,在該案例中,金智塔科技提出了一種基于兩階段的隱私保護 CDR 框架。該方法既可以保護數據源的隱私,又可以緩解數據稀疏性。實驗結果表明,在兩個基準數據集上,金智塔科技的方法具有普遍的有效性。3、設計新型全對稱、去中心化的節點網絡架構,增強平臺在不同業務場景的靈活性和普適性。針對本項目中節點橫向、縱向交叉分布的特點,金智塔科技提出了一種全對稱、去中心化的節點網絡架構。在該架構中,所有節點通過專線或者互聯網組成60一個 mesh 網絡,互聯的一組節點可以組成一個 group。組中的節點可以通過某個指
92、定的節點調度,協同進行隱私保護機器學習。實踐表明,金智塔科技的架構相對于傳統的集中式架構,對于不同的場景具有很強靈活性、普適性。在應用成效方面,本項目上線后,較大的提升了用戶的授信額度,戶均授信額提升了 40%以上,顯著的擴大了小微客戶群體服務規模;有效的識別欺詐、多頭借貸和洗錢,環比提高 50%以上;并降低了小微企業的貸款成本,與互金平臺融資對比,降低了約 50%以上融資成本;且極大的提升了辦貸效率,線上一鍵申請,線下一次簽約,1 個工作日辦結。(五)華為公司與伙伴數據流通實踐場景(五)華為公司與伙伴數據流通實踐場景1.1.場景及需求場景及需求在非金融領域,可信數據流通同樣有大量的實踐應用。
93、華為公司在集團內部以及華為與生態伙伴之間,有大量的數據交換場景,在華為以往的研發實踐中,發現數據提供方只能將需求方所需數據不作區分的打包發送,數據權益完全依賴于需求方此前所作出的承諾,雖然這種承諾通常也會體現在雙方的合作協議上,但是對數據使用的合規過程進行監管和審計的成本非常高,而且事后的追責已經失去了風險阻斷的時效性。處于產業生態圈中的企業,迫切希望能夠建立一種依賴于技術實現的對數據權益保護的數據交換平臺。61圖 15 跨不同主體的數據流通示意圖2.2.技術技術驗證驗證方案方案圖 16 企業可信數據空間解決方案基于可信數據空間參考架構,華為研發了企業可信數據空間解決方案,部署了數據空間連接器
94、,即連接數據提供方與使用方,實現目錄推送與資源檢索、合約達成與執行等服務功能,以及日62志存證與溯源、數據使用控制等安全功能。采用該方案,華為實現了集團內部以及華為與伙伴之間的數據可信流通與共享。3.3.實施效果實施效果目前,基于華為企業可信數據空間,已經實現了數據共享交換過程實例,為數十家產業鏈上下游參與方企業提供數據共享流通平臺,企業可以通過該平臺進行依賴程序自實現的跨企業數據可信流通。(六)富數科技基于多源數據的金融風控數據空間場景(六)富數科技基于多源數據的金融風控數據空間場景1.1.場景及需求場景及需求隨著數字化時代的到來,金融行業對數據的跨域融合與流通的需求變得尤為迫切。特別是在風
95、險控制這一信貸業務的核心環節,風控模型的精準度直接關系到金融機構的收益與穩健性。然而,由于央行數據使用合規方面約束不斷加強,風控模型可用數據源的供給渠道不斷收縮;同時,在信貸場景中,信息欺詐和數據失真情況不斷加重,傳統銀行風控模型因缺乏多維動態數據支撐,已經無法進行有效識別及預警。富數科技聯合某金融機構,依托隱私計算技術,打造金融數據空間,為金融行業引入運營商、電力、互聯網企業等多方數據,圍繞個人信貸、普惠金融、反欺詐三個典型場景,實現數據“供得出、流得動、用得好、保安全”。通過這一項目,旨在提升金融機構的風控能力,促進金融市場的健康發展和地方經濟的增長。632.2.技術驗證方案技術驗證方案項
96、目基于隱私計算技術打造金融風控可信數據空間,整合金融機構、運營商、電力公司、互聯網公司等的多源數據,確保數據處理的安全性和合規性。項目實施包括數據采集與加工、數據產品打造、數據產品發布與交易、迭代優化等階段。技術措施涵蓋多方安全計算、聯邦學習、匿蹤查詢等,確保了數據處理的安全性和合規性。圖 17 技術方案項目在數據采集階段,確保數據來源合規、傳輸渠道安全。在數據資源加工階段,采用隱私計算、數據加解密、模型水印、代理重加密、安全沙箱等技術,對采集到的數據進行清洗、轉換和增強。在數據產品打造階段,利用隱私計算能力打造高密數據64產品,與多方聯合進行安全對齊,使用聯邦學習聯合建模。在數據產品發布階段
97、,經過嚴格的安全評估后,發布到數據空間的數據產品市場。在數據產品交易階段,金融機構在購買數據產品后,可在本地部署并調用模型,實現風險控制和決策支持。3.3.預期效果預期效果技術價值:通過隱私計算技術,實現數據的高效融合與智能分析,在確保數據隱私和安全的前提下,提升了風控模型的準確性和效率。項目在個人信貸、普惠金融、反欺詐等場景中,通過智能風控模型,信貸審批效率提高 30%,違約風險降低 30%以上,為金融機構帶來直接經濟效益。社會價值:項目在多家金融機構落地,累計經濟收益超過1400 萬元,實現業務成本節約與經濟收益增長,形成新的業務增長點。通過金融普惠服務,增強了對中小企業的金融支持,促進了
98、地方經濟活力,預計提升社會就業率和經濟增長速度。項目的成功實踐為行業內外的數據安全與合規提供了示范,強化了其在該領域的標桿地位,為政策制定者提供了現實案例,促進了數據要素市場化配置的政策環境。(七)(七)螞蟻科技螞蟻科技三農普惠金融服務場景三農普惠金融服務場景1.1.場景及需求場景及需求該項目在三農普惠金融發展中小農戶貸款難的背景下,螞蟻密算、網商銀行、農業農村部大數據發展中心三方首次將時空大數據和密態計算相結合,在滿足“數據可用不可見”的合規前提65下,基于衛星遙感時空數據和農業農村部動態庫數據聯合建模,形成農業信貸實時評估指標,有效解決了農戶貸款評估難題,為大規模農業授信提供了行業解決方案
99、,同時也為合規開發應用公共數據價值,提供了切實可行的參考思路和落地路徑。2.2.技術驗證方案技術驗證方案通過密態計算技術搭建密態可信數據空間,在滿足大數據發展中心數據不出域的情況下,將網商遙感作物識別結果、授權用戶信息與鄉村動態數據(如人地確權、土地遙感數據)進行雙方數據的聯合建模,最終產出可對農戶經營情況與金融扶持強相關的標準結果數據。圖 18 密態可信數據空間方案示意圖密態 IasS 層提供密態計算所需的基礎硬件??尚呕A設施提供硬件可信根,用戶可以依據它對密態計算中心的軟硬件配置進行遠程驗證;密態通用算力、密態智能算力分別提供密態化的66CPU 的計算能力、GPU/NPU 計算能力。其安
100、全保障程度可依據隱私保護計算通用安全分級標準和實際場景需求來確定。密態 PasS 層主要提供密態服務能力。一部分是通用的密態服務能力,包括分布式可信身份、密態數據匯集、跨域管控、密態算力調度、密態通用計算、全鏈路可信審計等。這些提供了一系列能夠防止系統運維方和數據研發人員主動攻擊的基礎安全能力。在此基礎上,密態計算中心融合了主流的計算框架。按照計算框架類別的不同,又可以分為大數據密算(PastGIS、Hadoop、Spark)和大模型密算(vLLM、transformer、torch)等數據和模型加工處理能力。融合后的框架能夠提供與明文框架相同的接口并處理多方密態數據。密態 SaaS 層提供服
101、務高價值高敏感數據的密態數據空間,用于實現與場景相關的具體數據業務功能。在本案例中,密態計算中心通過空間匹配,獲得特定農戶的農作物圖像,并對農作物種類進行識別,以及對農作物的收成進行預測,基于農作物收成及農戶的其他信息,計算農戶的授信額度。3.3.預期效果預期效果目前,超 606 萬農戶通過這一服務獲得銀行的貸款額度,累計授信 964 億。他們來自全國超 2600 多個縣級行政區,其中約80%的農戶種植面積不到 10 畝。網商銀行調研顯示,66%的農戶因此首次獲得手機貸款,方案上線以后,農戶借款不用跑網點,實現“手機貸款”“秒申秒貸”“秒借秒還”,農民能夠像市民67一樣獲得便捷、靈活的金融服務
102、,隨時可以貸到款。這一實踐通過密態計算技術創新公共數據的應用范式,為破解三農金融信貸難題提供了新的樣本。68六、總結及建議(一)主要結論(一)主要結論可信數據空間建設正處于起步探索期,在各行各業都在基于業務場景進行規劃和探索,通過實踐不斷地迭代更新發展。當前部分廠商參考歐盟數據空間參考架構、信通院可信工業數據空間系統架構等進行了產品實現,并在部分金融機構、政府及企業等機構開展了落地探索,在企業數據空間落地方面積累了一定經驗。但面向行業可信數據空間、城市可信數據空間建設,仍存在法規、技術、標準、商業模型等方面的挑戰。在法規方面,在法規方面,缺乏明確金融數據流通的范圍和適用場景等,金融機構對數據的
103、敏感性沒有統一標準,導致其“不愿流通”、“不敢流通”,使得金融數據被封閉在“孤島”中,限制了金融數據在市場中的流通。在技術方面在技術方面,缺乏統一的可信數據空間參考架構、功能要求、運營規范等。例如可信數據空間連接器的功能定義、連接協議、身份認證協議、數據接入協議等,廠商間的實現未遵守統一技術標準,將提高客戶技術集成難度以及使用門檻,在一定程度上會阻礙數據空間相關技術的落地。在標準方面在標準方面,缺乏廠商間的跨域互聯標準、數據互操作標準等,難以支撐跨機構的行業級、城市級可信數據空間建設。按照國家數據局對可信數據空間的定義,可信數據空間是基于共識規則,聯接多方主體,實現數據資源共享共用的數據流通利
104、用基礎69設施。這就需要廠商間基于標準進行互聯互通,共同構建可信數據空間,支撐數據跨域跨組織安全流動。在商業模式方面在商業模式方面,當前可信數據空間廠商盈利模式主要還是以產品銷售為主,但數據空間建設運營方盈利模式尚不清晰,對于有意愿的運營方尚未有足夠的吸引力。尤其在金融行業,行業可信數據空間誰來建設,誰來運營,如何盈利,相關利益方的商業模式的仍需進一步探索。(二)相關建議(二)相關建議我國數據要素市場體系逐步確立,為最大化釋放數據要素價值、推動數字經濟大發展,數據資源的流通將成為必然趨勢?;跀祿臻g的數據可信流通體系建設,將成為促進數據流通,釋放數據價值的重要數據基礎設施,建議國家及行業主管
105、單位在相關技術標準、試點驗證等方面做如下牽引。1.1.加強數據規范流通,促進金融數據要素價值釋放加強數據規范流通,促進金融數據要素價值釋放在金融數據分類分級要求的基礎上,進一步明確金融機構數據流通的范圍和適用場景等。針對不同類別和級別的數據,明確金融場景下可跨機構流動的數據類型和范圍,以及配套的安全使用要求,建立差異化的授權使用規范,明確數據提供者、數據使用方、數據經營方、數據服務方等在數據流通過程中的權利與義務,規范數據流通行為,解決數據不敢流的問題,進一步釋放金融數據要素價值。2.2.加快制定可信數據空間技術標準及互聯互通標準加快制定可信數據空間技術標準及互聯互通標準70為更好的推進行業數
106、據空間,甚至全國統一數據大市場的形成,數據空間互聯互通至為重要。不同公司或者使用不同類型技術搭建的平臺,存在技術上的差異性,需要在國家和行業層面構建互聯互通標準。通過技術標準來規范廠商的技術實現,助力各行各業和各地區建立互聯互通的可信數據空間,實現數據安全流通和高效利用,促進數據要素交易和協同創新。3.3.鼓勵頭部機構聯合開展行業可信數據空間試點鼓勵頭部機構聯合開展行業可信數據空間試點可信數據空間還未實現大規模應用,對于金融行業應用還處在探索階段,鼓勵金融機構通過試點研究拓展可信數據空間應用場景,聯合開展探索行業可信數據空間建設模式,構建跨機構甚至跨行業的數據流通基礎設施,實現跨組織、跨行業的數據可信流通,促進行業數據要素價值釋放,支撐金融機構業務創新。