1、金融數據要素流通技術與應用研究 北京金融科技產業聯盟 2023 年 11 月 版權聲明 本報告版權屬于北京金融科技產業聯盟,并受法律保護。轉載、編摘或利用其他方式使用本報告文字或觀點的,應注明來源。違反上述聲明者,將被追究相關法律責任。編制委員會 編委會成員:何 軍 聶麗琴 高鴻升 編寫組成員:夏知淵 丁文定 郭相林 相 妹 陳 曦 杜妮娜 李如先 何東杰 張伊祎 徐 靜 汪小益 張延楠 昌文婷 彭 晉 張曉蒙 李 力 周蓓杰 唐仕豪 強 鋒 李 茂 吳葉國 楊煜東 任 妍 王 超 倪 壯 朱振超 李克鵬 王禮斌 劉站奇 陳 鑫 蔣嘉琦 賈金龍 黃翠婷 陳 濤 高強裔 吳紫園 竇永金 楊 波
2、胡師陽 邱曉慧 聶春祺 夏斯媛 吳嫣雯 章立強 趙懷衡 程安明 李 倩 崔如德 錢 勇 范力欣 葛 嫻 黃安埠 王 雪 李武璐 李 原 曹 雷 周奕希 雷 武 李 博 汪 洋 鄭華祥 陳嘉俊 張敬之 曹旭濤 時 代 張嘉熙 董婉婷 黃 淼 周岳騫 張亞申 王健宗 黃章成 李澤遠 蔣美獻 顧逸暉 張佳辰 于 博 夏家駿 高志民 李炳帥 編 審:黃本濤 郭 棟 劉寶龍 1 參編單位:北京金融科技產業聯盟秘書處 中國工商銀行股份有限公司 聯易融數字科技集團有限公司 北京數牘科技有限公司 杭州趣鏈科技有限公司 螞蟻科技集團股份有限公司 北京市競天公誠律師事務所 深圳微言科技有限責任公司 阿里云計算有限
3、公司 藍象智聯(杭州)科技有限公司 騰訊云計算(北京)有限責任公司 度小滿科技(北京)有限公司 同盾科技有限公司 北京國家金融科技認證中心有限公司 北京銀聯金卡科技有限公司 北京瑞萊智慧科技有限公司 深圳致星科技有限公司 上海富數科技有限公司 深圳前海微眾銀行股份有限公司 2 建信金融科技有限責任公司 平安銀行股份有限公司 深圳市洞見智慧科技有限公司 浙商銀行股份有限公司 華控清交信息科技(北京)有限公司 北京沖量在線科技有限公司 深圳壹賬通智能科技有限公司 神譜科技(上海)有限公司 上海光之樹科技有限公司 華為云計算技術有限公司 3 目 錄 前言.1一、概述.3(一)金融行業數據流通的意義.
4、3(二)主要技術概述.5二、現狀和痛點.8(一)現狀分析.8(二)流通合法合規要點.9(三)流通技術難點.15三、體系框架.18(一)框架總述.18(二)規范體系.19(三)服務模式體系.19(四)規則機制體系.20(五)支撐能力體系.23四、流程與技術.27(一)數據要素流通主要業務流程.27(二)數據要素流通技術.36五、典型案例.41六、總結與展望.50附錄:術語解釋.52 1 前言 數據作為基礎資源和生產要素進入經濟活動,已經獲得廣泛認可,并已被各類組織視為重要資產,而數據資產的價值倍增和數據要素市場化配置的關鍵在于安全高效的流通交易。我國數據要素流通交易的潛力巨大,每年全社會數據量增
5、長約 40%,但真正被利用數據的增長率只有 5.4%1,主要囿于數據要素流通不暢,交易體系不健全,數據產權制度、交易定價制度、會計制度、收益分配制度、中介服務制度以及安全治理制度尚不完善等。因此,圍繞“數據二十條”,為充分激活金融數據價值,在法律法規、金融監管等不斷完善的基礎上,亟須探索金融數據的流通體系、流通業務流程以及相關技術應用。數據流通,泛指數據要素從一個主體或機構流轉到另一個主體或機構的過程,流通對象可以是明文數據、脫敏數據、數據服務或數據價值。廣義上,數據流通全過程覆蓋數據全生命周期,涵蓋數據治理、數據安全分類分級、數據資產化、數據開放共享、數據交易以及數據運營等。狹義上,數據流通
6、指的是在符合法律 1.肖鋼.加快構建數據要素流通交易制度N.人民政協報,2022 年 5 月 18 日(第 3 版)2 法規要求前提下,運用流通技術按照一定的數據標準和市場流通模式實現數據從提供方傳遞到需求方的過程。本報告從金融行業視角,聚焦狹義上的“數據流通”做出一系列積極有效的思考。梳理了我國金融數據流通的現狀,分析了金融數據流通在合法合規方面的痛點以及流通技術方面的難點。進而,重點提出推動金融數據流通的體系框架,并就金融數據要素流通的業務全流程做出詳細介紹,旨在提出金融數據要素流通的整體解決方案,并通過金融行業先行先試形成數據流通領域的行業標桿,更好地激發數據要素市場新活力,釋放數據要素
7、新動能,創造我國數字經濟時代新的競爭優勢。報告關于“金融數據流通”的探討具有重要的現實意義。3 一、概述(一)金融行業數據流通的意義(一)金融行業數據流通的意義 1.1.數據要素助力金融智能發展數據要素助力金融智能發展 2020 年 4 月 9 日,中共中央、國務院發布中共中央國務院關于構建更加完善的要素市場化配置體制機制的意見,指出數據成為繼土地、勞動力、資本、技術后的第五大生產要素。2022年 12 月印發的中共中央國務院關于構建數據基礎制度更好發揮數據要素作用的意見(以下簡稱“數據二十條”),提出構建數據基礎制度體系和多層次數據交易市場體系等戰略性舉措。數據要素作為數據經濟時代的全新生產
8、要素,在推進經濟高質量發展中具有顯著的戰略意義。在國家、行業等多層面獲得了廣泛重視,數據要素在社會經濟及金融行業中的地位日益凸顯,為大力推進產業數字化轉型、加快推動數字產業化、更好地服務實體經濟發展提供重要支撐。金融是典型的數據密集型行業,數據要素正成為金融行業高質量發展的重要驅動力。2021 年 12 月,中國人民銀行印發金融科技發展規劃(2022-2025 年),該規劃依據中華人民共和國國民經濟和社會發展第十四個五年規劃和 2035 年遠景目標綱要制定,提出新時期金融科技發展指導意見,明確金融數字化轉型的總體思路、發展目標、重點任務和實施保障。同時明確 4 堅持“數字驅動”的發展原則,以加
9、強金融數據要素應用為基礎,加快金融機構數字化轉型,注重金融創新的科技驅動和數據賦能。為適應數據要素市場化發展戰略,金融監管部門不斷強化金融業數字化轉型指導和規范,金融機構持續推進金融科技應用創新,通過數據驅動金融業務創新,提升企業級數據能力,實現金融數據價值的業務賦能,推動金融業數據要素市場建設。具體地,金融機構在長期業務發展中積累了海量數據基礎,運用大數據、人工智能等技術,充分挖掘數據價值并應用在客戶營銷、智能風控、普惠金融、企業和個人征信、信用評級等各類業務場景。通過多維數據的分析挖掘,提升金融產品風險定價的有效性和精準度;將數據要素應用在各創新場景中,拓寬金融行業服務邊界,捕捉個人和企業
10、潛在需求,豐富金融服務內涵。2 2.金融數據流通加速數字化轉型金融數據流通加速數字化轉型 2022 年 3 月 25 日,中共中央、國務院發布中共中央、國務院關于加快建設全國統一大市場的意見,再次提到加快培育數據要素市場,建立健全數據安全、權利保護、跨境傳輸管理、交易流通、開放共享、安全認證等基礎制度和標準規范,深入開展數據資源調查,推動數據資源開發利用。對此,積極探索以更高效、更佳的組織方式、更安全的治理來破除數據壁壘、實現數據流通共享勢在必行,要持續加大數據開放力度,努力推動數據 5 跨地區、跨行業的互聯互通,有利于激發數據流通活力,培育更加完善、成熟的數據要素市場體系。數據自主有序流通交
11、易,是激發數據要素價值、擴大數據生產力乘數效應的重要途徑,可以使沉淀的數據資產成為“活水”,以合法合規形式在不同行業、不同機構間進行流轉、整合、共享,為推動實體經濟發展發揮更加充分的作用。為快速響應國家對數據要素市場建設的要求,承接數據要素流通交易的發展需求,金融機構在利用自身數據優勢的同時,也不斷加強內、外部數據的融合應用,在跨機構、跨行業之間進行數據流通共享能夠形成更強有效的互補,發揮更加顯著的作用。通過跨行業、跨機構的數據流通,金融機構可以全面掌握客戶信息和需求,進而制定更優的智能風控、營銷等策略,為企業最大限度降低風控成本、帶來更大的經濟效益,進一步加速金融數字化轉型發展。(二)主要技
12、術概述(二)主要技術概述 1.1.數據整合技術是流通的前提數據整合技術是流通的前提 數據整合技術是數據流通的基礎和前提,為數據共享提供標準化、結構化的數據。數據整合技術通過脫敏、去標識化、匿名化、大數據技術與分析技術等確保數據的可用性、隱私性。依托 6 數據脫敏、去標識化、匿名化技術進行敏感信息處理,僅保留標準化的數據格式和屬性;依托大數據技術與分析技術對需求匹配和運營環節進行分析,大幅提升了數據流通市場的要素流通效率。通過以上數據整合技術對來自金融行業不同應用場景的數據源進行數據整合,使之具備一致、標準的格式,從邏輯上實現數據的集中存儲與處理。2 2.開放共享技術促進價值流通開放共享技術促進
13、價值流通 開放共享技術作為整個數據流通過程中的關鍵技術,可以有效促進價值流通。開放共享技術為各種數據源構建一套在安全網絡中的數據表示、索引、定位、查詢、交換和數據追溯審計等功能的統一標準,解決數據流通過程中非敏感數據的跨機構、跨部門、跨系統間的安全交換問題。此外,對于數據隱私性較高且無法直接共享的數據,可以使用隱私計算技術進行價值共享,保護數據內容不出庫。數據開放共享主要通過數據水印技術、API技術、數字證書、TLS、數據加密、量子傳輸及量子密鑰分發等技術為參與共享的機構提供數據存儲以及接入、數據安全傳輸、數據一致性校驗、數據合規審計等功能,方便機構將已有數據快速接入到整個數據流通系統。依托數
14、據水印技術對數據產品分級和數據權屬登記等 7 環節進行隱藏信息嵌入,進一步加強數據流通應用的監管審查和權屬鑒別能力;依托 API 技術,可以在數據要素流通中為不同平臺提供低敏感數據的共享服務。3.3.安全合規技術支撐可信流通安全合規技術支撐可信流通 安全合規技術憑其技術特點,能夠很好地滿足金融數據流通的安全合規需求,支撐金融數據要素的可信流通。近年,在大環境發展過程中,金融機構對數據流通的安全合規要求越來越高,如何在安全合規的前提下充分挖掘數據資產價值成了金融機構關注的重點。密碼技術、隱私計算和區塊鏈技術憑其技術特點,為建設高效、安全的數據要素市場提供技術基礎,能夠很好地滿足金融數據流通的安全
15、合規需求,支撐金融數據要素的可信流通。依托密碼技術可以保障金融安全,同時,密碼技術又是隱私計算和區塊鏈技術的基礎技術支撐;依托隱私計算技術,可以有效解決數據流通過程中數據隱私問題,借助可信硬件技術可以幫助機構和部門在保護數據隱私的前提下發揮數據的價值;依托區塊鏈技術,可以在金融數據合規共享流通場景下,為數據真實性、數據確權等合規問題提供幫助,實現全流程可記錄、可驗證、可追溯、可審計。8 二、現狀和痛點(一)現狀分析(一)現狀分析 在我國,自 2014 年最早的 3 家數據交易機構(中關村數海大數據交易平臺、北京大數據交易服務平臺和香港大數據交易所)建立以來,在不斷發展中形成了多種流通模式。從流
16、通交易場所角度來看,目前市場上既有數據交易所形式的場內交易,也有企業與企業之間直接發生數據交互的場外交易。場內交易一定程度上利于監管,但需付出額外成本;場外交易雖靈活多樣,卻易出現違規行為。從市場主體關系角度來看,數據流通主要為兩種模式,一是通過流通交易中介形成的撮合型模式,二是通過數據服務商進行的數據綜合流通模式。其中,撮合型模式由各大數據交易機構作為中介提供撮合平臺,匹配買賣雙方的供給和需求促成數據流通交易;數據綜合流通模式側重于數據“采集-加工-銷售”的服務流通交易,由數據服務商作為中間代理,與多家數據提供方合作采集數據,進行數據加工處理,面向市場中所有數據需求方提供數據服務,完成數據供
17、需雙方的流通交易業務。從技術支撐角度來看,數據流通主要有如下三種模式:1.0模式是通過數據交易平臺就數據所有權進行交易,但由于數據確權相關法律法規不明晰,該模式有較高的數據安全風險,因此近些年該模式增長逐漸放緩。2.0 模式將加工處理完的單方結果數 9 據以 API 形式輸出,該模式下按照數據分類沉淀的 API 接口日調用量達上億次,滿足較廣的服務覆蓋范圍,且一定程度保護了用戶隱私信息以及降低二次利用可能性,但同時降低了數據價值融合的可行性。隱私計算有望發展為數據服務 3.0 模式,直接作用于數據使用方面,能夠通過協議或算法使得數據計算服務在不泄漏原始數據的前提下充分挖掘數據價值,如圖 1 所
18、示。圖 1 數據流通模式現狀 綜上,整體來看我國數據流通模式機制仍在不斷發展完善,各數據交易機構運營尚未達到預期效果。金融機構引入外部數據、金融數據服務對外輸出等還面臨諸多困難和挑戰。(二)流通合法合規要點(二)流通合法合規要點 金融數據的流通需依照個人信息保護、數據安全及金融監管相關法律法規和標準(以下統稱“實體規范”)來實施。為此,10 需分析實體規范所包含的要素、實體規范的內容以及對應的合規要點。1.1.數據合規實體規范的分析維度數據合規實體規范的分析維度 數據合規實體規范事實要素包括數據主體、數據內容、數據控制權歸屬、數據流通方向和數據流通范圍,如圖 2 所示。圖 2 數據合規實體規范
19、的五個分析維度 數據主體身份是數據合規分析的起點。金融機構運營過程中,涉及兩類數據主體:金融機構自身的運營數據和來自客戶的數據??蛻魯祿梢赃M一步分為法人或其他組織數據,以及自然人數據。不同數據主體需要符合不同的監管邏輯和保護要求。法人和其他組織需要滿足數據安全的合規要求;自然人除了滿足數據安全要求,還需要符合個人信息保護的特殊要求。數據內容是確定合規義務的基礎。數據內容包括描述數據主體的特征類數據、自然人身份識別類數據、金融機構資產存量狀 11 態數據、交易數據、狀態變化的過程類數據和金融機構管理數據。根據中華人民共和國數據安全法(以下簡稱數據安全法)的分類分級保護原則,應根據數據內容的不同
20、分級并采取不同等級的數據保護措施。數據控制權歸屬是確定數據合規責任主體的關鍵。數據控制權既具有技術屬性又具有契約屬性。在技術屬性方面,數據控制者可以使用訪問權限、保密等技術手段在其控制域內進行控制。在契約屬性方面,數據控制權可以通過契約方式進行傳遞,例如在委托受托關系中,受托方必須按照合同約定的處理方式和處理目的進行數據處理。數據流通方向是確定數據供需義務及資質要求的關鍵。數據流通過程中,參與方的角色決定了其合規義務及資質要求,即數據提供方需承擔數據來源合法性、數據主體授權充分性等合規責任;而數據接收方需承擔網絡安全、數據安全等合規義務,如數據存儲和傳輸過程中的技術處理措施。數據流通范圍是區分
21、“內部共享”和“對外提供”兩種不同合規要求的關鍵。從法律視角來看,可將數據流通范圍分為同一法人主體內部流轉和不同法人主體之間的流轉。對比而言,后者需要承擔更重的內部合規責任和外部賠償責任。2 2.數據合規相關法律法規及標準數據合規相關法律法規及標準 我國數據安全和保護的法律法規日益完善,網絡信息治理和數據保護基礎法律的“三駕馬車”中華人民共和國網絡安 12 全法(以下簡稱網絡安全法)數據安全法和中華人民共和國個人信息保護法(以下簡稱個人信息保護法)均已施行,為企業合法處理數據、保障數據安全等提供了較為明確的指引。金融業作為強監管行業,根據相關法律等,對應推行實施了系列行業標準、規范,形成如下數
22、據安全體系,為金融數據的開放共享、規范使用、安全流通起到基礎支撐作用。金融數據合規相關體系如圖 3 所示。圖 3 金融數據合規相關體系 3 3.個人信息保護合規要點個人信息保護合規要點 個人信息保護法為個人信息處理提供了重要指引。金融機構作為個人信息處理者需關注處理權限及合規義務兩方面內容。其中,處理權限絕大部分來源于個人信息主體的明示同意,而金融機構的角色決定了其合規義務的承擔。13 第一,知情同意原則是個人信息處理活動中的黃金原則,是尊重個人意志的核心體現。而對于法人、其他組織等非個人客戶則不存在個人信息保護的要求,但存在對數據的保密義務。第二,“告知”和“取得同意”具有不同的內涵。個人信
23、息保護法第 13 條確立了七項處理個人信息的合法性基礎,僅第一項需要取得個人信息主體的同意,其余項則不需要獲??;但是,無論適用何種合法性基礎來處理個人信息,均需履行充分告知的義務。因此在討論數據授權時,應拆分為兩部分:告知的充分性,授權的充分性。第三,“匿名化數據”是相對概念,現實中不存在絕對匿名化的數據。在適用該定義時應將參與加密過程的知情人員排除在外(因為這部分人員知曉數據的映射關系,可以復刻重做數據),如果數據對于其他人而言是匿名化的,則不屬于個人信息,可以正常使用。第四,委托處理、共同處理、數據提供的個人信息合規要求有明顯區別;不同的法律關系下,各參與方角色負有不同的合規義務,具體見表
24、 1。各方在合作前需考慮法律關系定性問題,合理預設合同條款,保護自身利益,把控合規風險。表 1 各參與方角色負有不同的合規義務 法律關系 角色 合規義務 委托處理關系 委托方 需事先進行個人信息保護影響評估 需對受托方的個人信息處理活動承擔責任 14 受托方 需按照個人信息處理協議約定的目的、方式、范圍處理個人信息 委托關系結束后通常需要對數據進行刪除或匿名化處理 對外提供關系 提供方 需事先進行個人信息保護影響評估 針對對外提供行為,需獲得個人信息主體的單獨同意 接收方 需對個人信息提供方提供行為的合法性負合理、必要的審查義務 若超出個人信息主體原始的同意授權范圍,則需要向個人信息主體重新獲
25、取同意 合作處理關系 各合作方 各合作方應按照個人信息處理協議的約定開展處理活動,不得超出約定范圍 個人信息的共同處理者對個人信息處理活動向個人信息主體承擔連帶責任 4 4.數據安全合規要點數據安全合規要點 金融機構在經營管理過程中涉及重要數據、個人金融信息、數據分類分級、數據出境等多個涉及數據安全合規的場景和方面。第一,金融行業在數據流通中需遵守 數據安全法 第 21 條規定的數據分類分級保護制度,依據金融數據安全 數據安全分級指南 金融數據安全 數據安全評估規范(征求意見稿)個人金融信息保護技術規范 等相關法規和標準開展數據分類分級工作。第二,在數據出境場景下,應履行數據安全法數據出境安全
26、評估辦法等法律法規所規定的數據出境安全評估義務。第三,履行數據安全法對“重要數據處理者”的要求:明確數據安全負責人和管理機構,落實數據安全保護責任;定期開展數據處理活動風險評估;以及在中國境內運營中收集和產生的重要數據的出境安全管理。15 5 5.金融行業數據合規的特殊要求金融行業數據合規的特殊要求 金融行業的數字化發展使得金融機構持有大量重要金融數據,數據安全與風險防范成為國家和監管部門的關注重點。近年來,國內外數據監管法律法規日益嚴格,我國數據立法進程加速,金融數據受到高度重視。金融行業針對征信業務等方面制定了重要的監管要求。第一,征信業務應具備合法資質。需要明確的是,何為“征信信息”“征
27、信業務”,征信業務管理辦法第 3 條規定,判斷信用信息的標準是“依法采集”“為金融等活動提供服務”“識別判斷企業和個人信用狀況”。因此,同一信息在不同使用主體和目的下的定性不同,會導致資質要求不同。如數據提供方在采集或生成數據時并無金融服務和識別信用意圖,則此時作為該機構不需具備征信業務資質。第二,金融機構及非銀行支付機構使用電子認證服務。金融機構在客戶身份驗證時,應遵循“最小必要原則”,避免過度收集信息,并承擔數據安全責任。此外,2021 年 6 月 1 日,中國人民銀行組織起草了中華人民共和國反洗錢法(修訂草案公開征求意見稿),明確金融機構使用第三方識別客戶身份時,應對第三方的反洗錢能力承
28、擔責任。(三)流通技術難點(三)流通技術難點 金融數據要素需要依托可靠的數據流通交易平臺積極融入大市場。平臺支撐實現流通、共享、交易閉環,涉及多領域技術 16 融合。目前在數據流通管理、數據資產管理、數據質量管理、數據流通技術平臺、數據安全技術平臺、數據集成技術平臺等相關技術平臺的交互融合聯動,在金融數據流通全生命周期中提供技術支撐能力方面尚面臨諸多困難和挑戰。同時,隱私計算推動金融數據安全流通的實際應用中,仍面臨如何平衡安全與效率、安全標準有待健全、方案的可解釋性與靈活性亟待提升、技術公平與普惠性、可監管待改善等諸多挑戰。1.1.跨領域技術融合問題跨領域技術融合問題 數據流通平臺是數據流通交
29、易的重要載體,可以促進數據資源整合、規范交易行為、降低交易成本、增強數據流動性,實現數據流通的全流程閉環。完成數據流通的全流程涉及提供供需撮合的平臺門戶建設、存證監管的區塊鏈技術、數據產品服務的大數據、數據中臺、流通管理平臺、傳統 API 數據服務、隱私計算等多領域技術。融合多項技術構建大型綜合數據流通平臺存在一定技術挑戰,同時,大型金融機構經過多年技術沉淀,許多系統往往都有著復雜的架構,且各系統間緊密連接,完成行業級數據流通技術平臺的建設或集成會牽一發而動全身。很多時候只能從一個簡單的測試場景做起,再逐漸穩步過渡到新的系統。2.2.技術安全性問題技術安全性問題 市場各參與主體之間的信任和技術
30、安全是流通共享的基礎,安全性也關系著市場信任。作為實現數據安全與隱私保護的關鍵 17 技術之一,隱私計算主要解決數據不出本地的情況下,數據安全使用和數據價值的流通,在“可用不可見”基礎上,為數據要素合規安全流通提供重要保障。銀行等金融機構在實際應用隱私計算落地典型場景中,考慮到數據高度敏感,業務涉及機構眾多且不同機構之間信任度不一,對聯邦學習等隱私計算技術的需求主要體現在安全性、可用性、易用性、靈活性以及產品或方案標準化的可靠保障。隱私計算的相關標準是否健全,隱私保護效果是否可驗證,隱私計算流程是否可解釋等等,這些都是金融機構在大規模商業化前可能會關心的問題。對此,還需增強隱私計算全流程安全性
31、。一是可證安全,明確算法本身帶來的隱患或信息泄露以及已有的攻擊手段及可能帶來的信息泄露。二是流程可監管,包括事前的授權、事中的監控、事后的審計,能夠快速發現安全風險。3.3.可用可用且且高效問題高效問題 當前,聯邦學習、多方安全計算等隱私計算技術,以及區塊鏈技術已經進入商業落地使用階段,商業化進程的不斷加速,數據安全保護問題逐漸揭開迷霧,隨之而來要形成規?;?、標準化推廣和應用?;跀祿魍ǖ闹饕夹g現狀,與現實業務應用需求的矛盾,和市場規?;l展的矛盾,核心挑戰來到新的維度如何在保證安全的基礎上,提升效率和有效性,破解安全和性能的平衡點。18 金融行業有海量的數據,應用隱私計算實現海量數據流通
32、,亟需突破現有的性能瓶頸,尋求安全和效率的平衡。一是滿足高穩定性要求,可監控、可回滾,具備一定的網絡/節點容錯性,提供高可用性;二是滿足高性能要求,在安全、準確的前提下,提升計算效率,且能夠支持大規模數據的計算。三、體系框架(一)框架總述(一)框架總述 在法律法規、監管合規要求下,數據高效流通交易、數據要素市場規范發展,有賴于行之有效的流通模式等規則機制和安全可靠的技術能力支撐。針對現階段市場發展面臨的挑戰,報告提出包含規范體系、規則機制、技術體系三層的金融數據流通體系框架,自上而下指導和促進、自下而上支撐和推進,以保障數據來源可確認、使用范圍可界定、流通過程可追溯、安全風險可防范。在規范體系
33、的頂層指導下,通過規則機制和支撐能力體系雙輪驅動,形成場內外多層次數據流通服務模式,共同推動金融數據流通市場高質量發展。金融數據流通體系框架如圖 4 所示。19 圖 4 金融數據流通體系框架(二)(二)規范體系規范體系 國家戰略規劃、法律法規和行業標準規范整體構成金融數據流通體系框架中的規范體系,提供頂層指導和合規保障,促進建立良好的數據流通市場環境。圍繞“數據二十條”不斷豐富完善各方面制度體系和配套的政策,數據要素市場正在加速培育中,踐行著大數據、數字經濟發展的國家戰略。(三)服務模式(三)服務模式體系體系 基于金融數據流通現狀和當下國內各地數據交易所的發展,報告的體系框架中提出流通服務模式
34、體系。一方面,在跨行業跨機構間,根據數據安全分類分級的不同,可以對應匹配數據集、數據 API 或隱私計算流通服務模式;在同領域或同行業機構間,可以通過數據共享與交換實現數據流通。20 另一方面,現如今各地數據交易所積極創新,不局限于供需撮合,根據金融數據流通交易的場所可分為場內、場外交易。綜合金融業數據流通訴求、數據交易所模式以及數據要素市場的發展,實現數據安全合規、大規模、高效率流通交易,場內、場外以及數據集、API 服務、隱私數據服務等模式交互融合,建立多層次、多樣化的數據流通服務模式體系。(四)規則機制體系(四)規則機制體系 數據流通規則機制體系分為管控機制、管理機制、市場機制三個層次,
35、分別規范和促進金融數據流通的可行、能行和易行。管控機制是金融數據有序流通的前提,保障數據流通源頭的合法合規;管理機制是金融數據流通的核心基礎,促進數據安全和數據質量的把控,以及數據用途與流通模式的合理匹配;市場機制是金融數據流通的關鍵,合作生態和定價收益等體系的建立有助于催化數據流通市場的高效發展。1 1.管控管控機制機制 管控機制層面由數據登記和公證體系、數據信用體系等組成。(1)登記和公證體系 建立數據登記和合規公證體系,保障數據合法合規。登記構成要件包括登記機構、數據來源說明、數據授權書、安全等級和保密要求等,由數據公證機構對材料進行核查和確認,出具公證證明,確保數據主體與數據來源合法合
36、規,保障交易數據真實可靠以及數據承載的數據主體權益,為數據要素交易流通提供參考 21 依據,有助于維護數據交易市場秩序,促使其穩定、健康、快速發展。(2)數據信用體系 建立數據信用體系,加強數據流通監管。打造數據交易市場社會信用體系,逐步完善數據交易中失信行為認定、失信懲戒、異議處理和信用修復等機制。加強與社會信用體系的同步建設、協同聯動、相互促進,強化數據從創建到流通再到應用的全生命周期的過程信用監管,維護市場主體權益。制定交易數據“負面清單”,明確國家秘密、商業機密、個人隱私領域不能或嚴格限制交易的數據項。建立交易誠信“黑名單”機制,將違規操作的市場主體納入黑名單,限制數據要素交易活動并責
37、令限期整改。2 2.管理管理機制機制 管理機制層面由安全管理體系、質量管理體系、流通規則體系等組成。(1)安全管理體系 建立數據安全管理體系,促進數據可信流通。強調數據交易的可追溯性,記錄、追溯數據交易的事前磋商與驗證、交易流程和數據觸達情況等。建立數據要素流通使用全過程的合規公證、安全審計、算法審查、監測預警機制,促進不同場景下數據要素安全可信流通。根據數據內容、應用場景等制定數據分類分級的保護標準,以實現針對性、分等級、差異化的數據隱私保護和安全防護。22 (2)質量管理體系 建立數據質量管理體系,提高數據流通效率。大力推進金融數據標準化建設,統一金融數據的規則和技術要求,促進金融數據規范
38、定義、規范標識、規范使用,增強數據的可用性。加強金融機構數據的質量管理,進一步完善金融數據質量監管規則,將數據質量情況作為金融機構、公司治理風險管控的重要考量因素,加強評估考核和監督檢查。(3)流通規則體系 建立統一規范的流通規則體系,構建在使用中流通、場內場外相結合的交易制度。數據流通應體現為多層次的市場交易體系,并根據具體的類型和場景,適用不同的交易規則,包括集團內、金融行業內、跨行業、跨境的數據開放、共享、交換、交易等場內和場外的流通方式。建立數據用途和用量控制制度,實現數據使用“可控可計量”。3 3.市場機制市場機制 市場機制層面由合作生態體系、定價收益體系、需求管理體系等組成。(1)
39、合作生態體系 構建以交易所、數據服務商和第三方機構共同構成的數據流通合作生態體系。交易所可以夯實數據要素治理基礎,負責標準化數據產品的交易撮合、價格生成、清結算等工作;數商可以提高數據要素應用水平,負責對多源異構數據的匯聚對接、清洗加 23 工、質量管控、可信流通,將非標準化數據轉化為標準化產品;第三方機構可以釋放數據要素流通活力,提供數據集成、數據經紀、數據評估、數據審計、數據公證等市場服務,加快構建數據要素社會信用體系。(2)定價收益體系 構建數據定價體系。推動數據要素由市場評價貢獻、按貢獻決定報酬的相關機制。充分發揮市場在資源配置中的決定性作用,擴大數據要素市場化配置范圍和按價值貢獻參與
40、分配渠道,完善數據要素收益的再分配調節機制,保護數據要素各參與方的勞動收益,促進勞動者的貢獻和勞動報酬相匹配,強化基于數據價值創造的激勵導向。通過數據產權制度保障數字權益、保障各相關主體基于數據市場評價貢獻決定報酬分配。(3)需求管理體系 建立需求管理體系,以選擇實現數據應用為導向,梳理應用所需數據,開展專項數據治理。再通過迭代的方式,逐步實現體系化數據治理。新模式既滿足監管對數據的要求,同時也涵蓋監管要求的數據價值實現。加快培育供求匹配高效、標準制度統一、市場運行規范、產品質量可控的數據要素市場。(五)支撐能力體系(五)支撐能力體系 從廣義數據流通來看,實現數據流通全流程不僅需要狹義層面的流
41、通技術,還需要數據治理、數據運營、服務創新等多方面的能力支撐,共同構成金融數據流通的支撐能力體系。24 本節主要就治理、運營和創新支撐能力展開介紹。流通技術將結合數據流通全生命周期在 5.2 章節詳細論述。1.1.治理能力治理能力 (1)統一數據標準:統一數據標準:大規模、成體系的數據要素流通和交易往往需要借助專業化的平臺,為便于海量數據的處理和服務,需要對多源數據要素、技術接口、處理規程等進行標準化。(2)數據分類分級:數據分類分級:不同敏感級別、重要性級別的數據,需要采取的不同的保護措施,在數據匯集、傳輸、存儲、加工等各環節均有不同要求,因此對數據資源目錄進行梳理,并根據國家和各領域的管理
42、要求進行分類分級,是保障數據安全的前提條件。(3)數據質量監控:數據質量監控:數據質量是保障數據服務成效的重要環節,為形成數據要素順暢流動的機制,需要在數據流通全流程的重要節點設置數據質量監控點,并結合最終用戶反饋,形成質量檢測閉環的定期評估,一方面將質量問題的處置前置,降低處置成本;另一方面,對于突發性的數據質量問題及時甄別,及時處置,確保整體數據可信、可用。2.2.運營能力運營能力 (1)挖掘需求:數據要素價值發揮依賴業務場景,一方面促進供需的高效交流,形成對營銷、風控等多種場景的數據服務;25 另一方面,借助服務中介機構,其優勢是對行業有深入的理解和服務經驗,支持其挖掘合規、創新等各類潛
43、在的場景。(2)形成數據產品:數據保護要求不斷提升,直接的數據集交換難以成為主要的流通模式,數據產品和服務則有可能成為數據要素流通的核心。因此,結合各類場景的業務需求,清晰定義數據產品和服務的主要功能和交互界面,是實現數據要素價值交換的可行方式,同時,也有利于評估流通價格。(3)活躍數據流通與交易:數據要素流通的關鍵在激發各方的動力,包括數據供應者和使用者的動力,一方面依托政策推動作用,逐步豐富數據供給,同時,依托生態建立多方共贏的權益激勵機制,通過多層次的數據中介豐富數據產品服務形式,增進數據服務的成效;此外,加強數據合規和安全保障措施,免除各參與方的顧慮。3.3.創新能力創新能力 (1)服
44、務創新:服務創新:通過繁榮生態的方式引入多方參與,實現數據流通服務的創新。比如市場生態合作方聯合共建,圍繞特定領域的數據分析場景征集數據分析方法、豐富數據服務產品,為數據流通的供需雙方創造價值,并可以凸顯統一流通平臺的生態賦能價值。26 (2)技術融合創新:技術融合創新:隨著新技術持續發展,數據處理和數據保護技術不斷進步,多種技術融合可能對處理效率和處理方式都有重要的改進,如 AI 用于數據標簽和數據任務調度等場景,可以顯著地降本增效,有利于降低數據交易成本,更廣泛地發揮數據價值,因此,跟蹤技術前沿發展,設置沙箱等方式探索新技術應用場景,可以支持相關企業在促進數據要素流動方面獲得競爭優勢。27
45、 四、流程與技術 數據要素流通包含開放、共享、交換、交易等多種形式,不同的流通形式在業務流程和所需技術支撐方面都略有差異。在市 場中,數據交易是流通的一種重要形式,促進了數據價值的復用和充分的利用。數據交易的業務流程相對復雜,且具有典型意義,因此本報告以交易為例,闡述和分析數據要素流通的業務全流程和涉及的技術能力。(一)數據要素流通主要業務流程(一)數據要素流通主要業務流程 數據交易業務流程主要包含數據產品上架、需求發布、分類分級登記和確權、數據資產評估和定價、供需匹配、數據產品分級流通、交易存證管理、監管通道、運營分析和數據產品下架等流程,具體如圖 5 所示。圖 5 數據流通交易業務流程 2
46、8 1.1.數據產品上架數據產品上架 數據提供方提出數據上架申請,服務提供方對上架申請進行審批,對數據進行合規評估和數據質量評估等操作后完成上架。上架完成后即可形成待流通的數據要素目錄,呈現到數據要素流通市場。數據產品合規評估,是數據流通交易中必不可少的部分,是流通交易的數據產品更合規、更高效的前提。數據產品合規評估應當從數據供應方、數據來源、數據可交易及數據流通 4 個方面進行。數據質量評估,是保證數據分析應用的基礎,是獲取數據價值的重要保障。根據目前業界對于數據質量的衡量標準,可基于數據完整性、唯一性、有效性、一致性、準確性和及時性 6 個維度來評估數據質量。數據產品說明及上架,數據上架的
47、同時配套提供產品說明書便于數據產品的廣泛流通,應包含基本信息、數據字典、數據價格、交付方式和應用場景等。2.2.數據需求發布數據需求發布 數據需求發布是由數據使用方向服務提供方提出數據流通的需求,請求獲得待流通的數據要素。數據需求發布前,應對數 29 據需求方進行資質審查。數據需求方應證明其數據資源的應用需求符合國家法律要求。3.3.數據分類分級數據分類分級 金融數據安全分類分級可參照金融數據安全 數據安全分級指南(JRT 0197-2020),待流通交易的金融數據產品需進行分類標識管理和分級保護;依據數據安全級別對應匹配恰當的安全管理策略、保障措施和流通模式等;并按照數據級別明確使用方對待流
48、通數據的使用權限。數據分類分級需要數據要素流通過程中相關的責任方來進行,包括但不限于數據提供者、數據評估方和數據使用方,各方均可根據相關條例對數據進行分類分級。數據分級,從安全合規性要求、數據保護要求的角度出發,按照數據對國家安全、公共利益或個人、組織合法權益的影響和重要程度,將數據分為一般數據、重要數據、核心數據。數據分類,不同行業和不同場景中都有不同的方法,在金融行業通??筛鶕祿纳a來源和數據使用形式對數據進行分類。按照生產來源,即數據產生的實際業務和場景,主要分為公共數據、企業數據、金融個人信息等。按照數據的使用呈現形式,可分為數據產品和數據服務兩個基礎大類,其中數據產品可通過 30
49、 不同技術實現流通,又可分為數據集、數據 API、數據報告、數據模型。4.4.數據確權數據確權 數據確權是實現數據安全有序流通的重要前提,本質上就是確定數據的權利屬性,主要包含兩個層面:第一是確定數據的權利主體,即誰對數據享有權利,第二是確定權利的內容,即享有什么樣的權利。數據從產生到消亡的生命周期中,數據確權環節就是針對特定的數據資產明確定義數據所有者、數據生產者、數據使用者和數據管理者的過程。數據流通市場中,金融機構大多作為數據需求方、數據使用者,合約相關方應當向金融機構提供數據各所屬權利方的說明或授權文件,以保證金融機構使用流通數據的合法合規性。5.5.數據資產數據資產化化 數據資產化是
50、數據通過流通交易給使用者或所有者帶來經濟利益的過程,是實現數據價值的核心,具體實現包括兩個階段:數據資產價值評估和數據定價。數據資產價值評估,是對數據資產使用價值進行度量,與數據定價有著密不可分的內在聯系,是數據市場化定價的重要依據,進而推動數據流通。31 數據定價,在“價格反映價值”的核心原則下,遵循真實性、收益最大化、公平、無套利、隱私保護和計算效率等六大基本原則。數據如何定價直接影響大數據交易平臺以及賣方的盈利,對大數據交易平臺如何選擇適當的盈利模式具有參考意義。目前,較普遍的數據定價機制有:一是互聯網服務商等推出的以自身為主的數據服務平臺或產品采取每分鐘計價模式和持續折扣模式,二是數據
51、交易平臺結合數據質量、完整性、稀缺性等對數據集標價,如貴陽大數據交易所。6.6.數據流通需求匹配數據流通需求匹配 數據資源匹配,通過數據流通交易共享服務平臺,為市場主體提供多種流通交易服務,助力解決數據流通市場效率問題。主要包括數據源本體庫和數據資源需求與服務匹配兩大模塊,具體是:a.數據資源本體庫。針對數據交易平臺上的服務功能各異、種類繁多,本體異構,缺乏統一的定義和描述方法的情況,構建數據源服務本體庫,通過數據資源本體庫提供聯盟領域內的共享概念,使需求和服務間的概念能夠在語義層進行匹配。b.數據資源需求與服務匹配模塊。根據數據資源本體庫提供的概念語義信息,將數據資源需求描述和服務描述中對應
52、屬性信 32 息進行語義匹配,確定信息之間語義匹配程度。該模塊主要分三部分,數據資源需求與服務描述、數據資源需求與服務匹配引擎和數據資源需求與服務匹配結果排序。7.7.數據產品分類流通數據產品分類流通 數據產品應是來源合法、標的明確、范圍確定、標識清晰、價值可估的流通數據。在數據分級保護、分類管理的業務流程后,用于對應的分類流通。(1)明文數據產品 根據數據分級對社會秩序、公共利益、行業發展、信息主體均無影響的數據,可通過API、數據集等方式進行明文數據傳輸。(2)脫敏數據產品 脫敏數據是對數據中較敏感的信息進行變形、轉換和混淆,同時保證數據可被合理地流通利用。數據脫敏業務流程主要包括敏感數據
53、梳理、敏感數據識別、脫敏算法選擇、脫敏任務執行和脫敏結果輸出。(3)敏感數據產品服務 高敏感等級的數據可通過高安全保障的隱私計算技術實現流通。并結合計算合約、存證等機制,控制數據的具體使用目的、方式和次數,避免數據在流通過程中遭到泄露或濫用。33 密文數據流通的流程大致如下:首先,數據提供方、算法提供方及結果使用方在數據流通前對將要使用的數據及其用途(即場景)達成一致,形成計算合約,隨后開始執行數據流通任務;其次,數據計算方提供平臺算力,執行基于密文的數據融合計算;最后,數據需求方接收數據融合計算結果,用于某特定業務場景。另外,數據流通過程可結合基于區塊鏈技術的存證機制,保障數據流通全流程可審
54、計、可追溯。8.8.存證管理存證管理 存證管理,包括業務記錄存證與計算過程存證,在數據要素流通業務過程中,確保流通全生命周期的安全可控,確保各參與方忠實履行各方職責和任務,不進行系統破壞、數據竊取等惡意攻擊行為,有助于解決流通合規問題。業務記錄存證實現了對各方關于數據要素流通業務中的業務信息(包含數據介紹、流通對象、業務范圍、授權信息等)、業務流程與狀態、操作記錄等信息進行存證的功能,便于對數據要素流通業務流程進行有效監控,業務記錄存證組件記錄用戶登錄、數據使用、數據授權、任務發起、任務配置、模型使用和計費等信息,可使用區塊鏈等技術存儲存證信息。34 計算過程存證實現了對于數據要素流通環節中所
55、涉及數據和相關數據處理與計算過程進行存證的功能,便于對數據要素流通環節中所涉及數據計算過程(包含隱私計算、聯邦學習等)進行存證,確保計算準確性和安全性,計算過程存證組件記錄聯合建模計算任務中的隨機數、秘密分片、密文、梯度數據和模型參數等計算過程數據,可使用基于哈希函數的 Merkle 樹等確保存證的隱私性,使用區塊鏈等技術保障存證的不可篡改。9.9.監管通道監管通道 建立監管審計機制,為數據流通業務流程上進一步提供安全保障?;诖孀C管理,通過為監管機構開設監管賬號,部署監管節點,并給予相關監管權限,以實現存證信息傳輸同步、數據核驗、監管審計任務發起、審計結果查看等功能。業務記錄審計能夠實現審計
56、方對于數據要素流通中各參與方的業務信息、業務流程與狀態、操作記錄等信息進行監管審計。計算過程審計可對于數據要素流通過程中的計算(隱私計算、聯邦學習等)過程進行統計分析和審計,有效控制數據的使用目標、方式和次數,識別計算任務的完成過程中是否存在異?;驉阂獠僮?,對異常使用進行告警,并通過適當機制通知數據提供方。35 10.10.運營分析運營分析 數據要素流通平臺的運營分析能力,在數據要素管理基礎上體現為支持數據供應方、數據使用方和平臺方等多方的要素流通情況分析。具體場景有:(1)數據流通統計報表制作:支持數據供應方提煉數據使用指標,針對客戶、客戶行為、數據產品和數據產品交易情況進行多維分析和統計;
57、支持數據使用方制作和查詢數據產品使用報表;(2)支持平臺生成數據交易報表,供結算和審計使用:根據供需雙方的使用情況,可視化實現數據要素流通報表,多維分析數據使用情況,包括但不限于數據產品使用量、數據產品成本、數據產品的交易主體分析等,并自動生成包括結算報表在內的各類結算依據,供數據要素結算和審計使用。(3)支持平臺生成對于事后數據提供方方違約使用數據產品的行為進行監控和干預,數據需求方可通過數據仲裁中心維權,確保數據需求方依法依約使用;數據需求方多次違約不予以改正可以限制其數據要素流通角色正常開展。11.11.數據產品下架數據產品下架 數據產品具有一定的時效性,數據提供方和服務提供方在完成數據
58、產品流通交付后,需對數據產品進行下架。數據需求 36 方和數據交易平臺還應按照規范和數據提供方的要求對數據進行銷毀,實現數據流通全流程閉環。數據提供方和服務提供方需要事先建立數據下架的策略和管理機制。同時,需建立數據產品下架的審批機制,以符合數據產品下架的策略和管理制度的要求。另外,需要記錄數據產品下架審批的操作過程,并記錄數據產品下架的具體操作過程,以滿足安全審計的要求。數據提供方和服務提供方下架數據產品時,需保證該數據產品不在流通使用環節,并與其他數據產品沒有任何依賴關系,以避免影響其他數據產品的流通。數據產品被下架后,需要保證對數據及數據的存儲介質通過相應的操作手段,使數據產品在數據流通
59、平臺上徹底丟失且無法通過任何手段恢復。(二)數據要素流通技術(二)數據要素流通技術 1.1.隱私計算隱私計算 隱私計算將數據可見的具體信息部分和不可見的計算價值部分進行分離,實現“數據可用(可計算)不可見(不可獲?。?,進而消除各個數據協同方之間對于數據安全和隱私泄漏的顧慮,從而以技術手段有效地破解“數據孤島”困境,其本質是一種由多個參與方在安全信任的條件下進行聯合計算的技術,各個參與 37 方在不泄露各自原始數據和商業隱私的前提下,通過加密協作機制對數據進行聯合計算和分析,實現數據的融合價值。多方安全計算技術的安全性和準確性有嚴格的密碼學領域證明,因此在數據要素流通中被主要應用于涉及高敏感數
60、據流通的應用場景,多方安全計算技術可以解決多方參與的聯合統計、聯合查詢、聯合建模、聯合預測等應用。聯邦學習是實現“數據可用不可見”的一種關鍵技術。在數據要素流通中,聯邦學習更多地用于解決聯合建模的業務問題,比如信貸風控中的常用的邏輯回歸建模評分、精準營銷中的常用的 XGBOOST 分類等建模??尚艌绦协h境常用于多方數據匯聚的中心化計算模式,能夠滿足業務數據隱私保護下的高性能計算需求。也可在聯邦學習、多方安全計算等技術基礎上融合可信執行環境,提升隱私計算任務的安全性。2.API2.API 技術技術 API的設計多為RESTFUL(Reprentational State Transfer),稱為
61、 RESTFUL API。其架構元素包括資源(網絡上的一個實體)、同一資源定位符(一個資源的地址)、狀態轉換(客戶端與服務端互動的過程,通常涉及服務器端數據和狀態的變化過程)。38 在數據要素流通中,API 接口用于為不同平臺提供低敏感數據的共享服務,數據提供方收集到數據資源后,對數據進行融合、清洗、增值等,最后形成數據接口提供給相關參與方。3.3.脫敏、去標識化、匿名化脫敏、去標識化、匿名化 數據脫敏是指對原始數據中的敏感字段采取替換、過濾、加密、遮蔽或者刪除等處理,從而降低數據敏感度和減少個人隱私風險。去標識化是指對標識符進行處理,使其處理后的信息無法識別到特定個人信息主體,而匿名化要求經
62、過處理無法識別特定個人且不能復原。去標識化所規定的防止重標識主要針對的是個人信息控制者以外的其他信息接收者,匿名化所規定的防止重識別通常還包括了個人信息控制者本身。4.4.區塊鏈區塊鏈 區塊鏈具備數據可溯源、不可篡改、智能合約自動執行和去中心化等技術特點,利用密碼學技術和分布式共識協議保證網絡傳輸與訪問安全,實現數據多方維護、交叉驗證、全網一致、不易篡改。區塊鏈技術實現數據流通的全流程鏈上可追溯,滿足監管審計需求,促進和保障數據的有序流通,可實現以下支撐能力:實現上鏈前數據真實性交叉驗證,上鏈后數據實現不可篡改性和可 39 追溯性;通過數字身份實現數據確權,實現數據管理、轉移和交易;通過智能合
63、約保障了數據用途和用量的可控可管。5.5.數據水印技術數據水印技術 數據水印技術,是運用計算機算法在載體對象嵌入隱藏信息,使得數據具備追溯數據版權所有者、分發對象等信息的能力的技術。數據水印包括結構化數據水印和非結構化數據水印,前者適用于關系型數據庫及結構化數據的水??;后者適用于文本、圖片、音視頻等非結構化數據的水印。用于數據要素流通的數據產品分級流通和數據權屬登記環節,能夠起到事中威懾作用,當發生數據產品非法擴散事件時,可對泄密樣本進行溯源,得出泄密責任主體。也可用于數據產品版權的權屬登記,既能保護原始數據,又能對數據產品進行鑒別。6.6.密碼技術密碼技術 密碼技術是數據安全、網絡安全、個人
64、信息保護的底層技術支撐和通用能力,也是隱私計算技術(多方安全計算、聯邦學習、差分隱私等)的主要底層算法,是保障金融安全的關鍵核心技術,支持金融科技創新應用的基石。數據要素流通中涉及密碼技術主要包含:數字簽名、對稱非對稱加密、雜湊函數、密鑰協商、同態加密、不經意傳輸、秘密分享、零知識證明等。40 其中,數字簽名能確定消息不可抵賴性和保障消息的完整性,可以用于數據流通授權。群簽名和環簽名支持一個群體中的任意一個成員可以以匿名的方式代表整個群體對消息進行簽名,有助于組織成員間高效協同。7.7.大數據技術大數據技術與分析技術與分析技術 數據分析技術應用于數據要素流通的需求匹配和運營分析環節,有助于提升
65、數據流通市場效率。在需求匹配中,通過智能推薦,根據數據供需方的歷史行為進行建模進而提供豐富精準的數據產品推薦服務。在運營分析中,通過交易平臺客戶行為數據的積累和挖掘,對用戶或者產品特征屬性進行刻畫,并對這些特征進行分析、統計,挖掘潛在價值信息。41 五、典型案例 1.1.車貸風控應用車貸風控應用 當客戶向銀行提出車貸申請時,銀行需要整合各種資訊再使用申請評分卡(A 卡)評估用戶逾期還貸的違約風險。但僅使用人行征信數據和行內積累的數據,對好與壞客戶的區分能力有限。為了提升評分卡的區分能力,銀行聯合其他數據方建立新的評分卡。同時,為了保障客戶信息安全,選用聯邦學習技術進行建模。在本案例中,銀行通過
66、隱私計算技術與數據合作方之間進行數據流通,分享處理后的還款表現數據等給合作方用以建立評分卡,進而銀行通過匿蹤查詢服務獲得用戶借貸逾期風險評分,同時排查多頭借貸和超額借貸的情況,對于高風險用戶,可以得到來自平臺的高風險報警。某銀行機構基于安全隱私計算平臺中的聯邦學習技術,聯合其他數據方進行聯邦建模,在保護客戶隱私數據不泄漏的情況下,利用外部數據建立模型,在雙方或多方合作中線上保障特征變量交換時的數據安全,具體框架如下圖 6 所示。42 圖 6 車貸風控案例框架 該銀行應用安全隱私計算產品的聯邦學習功能,融合多方的黑灰產行為等特征,模型的 KS 提升 30%以上,每年阻止數億資金的風險貸款申請。2
67、.2.車險智能核保車險智能核保 保險機構自有數據無論從維度還是總量上來看都比較有限,要豐富用戶畫像及保險精算模型構建,需要引入互聯網消費、通訊、車聯網數據等大量外部數據,其中涉及個人信息隱私部分必然要予以合規授權和保護。因此,在監管合規前提下,保險機構通過數據流通等充分利用多方數據要素,尋找優質車險客戶是提升保險盈利能力的合規方式。本案例中,基于聯邦學習、多方安全計算技術等,提出車險智能核保方案,安全、有效地使用多方數據,實現保險公司、國 43 家信用大數據中心、互聯網平臺等多方數據不出私域的安全流通、聯合建模,將保險公司的理賠數據,與大數據中心的個人、車輛等多維度數據融合,豐富車輛及駕駛者的
68、精準畫像,訓練智能核保模型,預測客戶出險概率,篩選優質低風險潛在客戶,從而向營銷、核保等環節,提供車險智能核保模型支撐,為保險公司個性化報價提供重要參考,提高保險產品盈利能力,如圖 7 所示。本案例已在 8 省 13 個城市落地應用,共核保 5 億元,智能核保模型服務的日均調用量超過 1000 次。通過智能核保服務,將保險公司的車險賠付率由 75%降到 51%,有效為保險公司提高了車險產品的利潤率。圖 7 車險智能核保案例框架 44 3.3.政務金融協同政務金融協同檢測預警檢測預警 基于區塊鏈、隱私計算技術,聯合政務、金融等機構數據形成融資征信聯盟,構造更全面的企業信用畫像,助力一站式高效融資
69、服務業務辦理,解決信用信息不準確、獲取成本高的行業難題;構建外貿企業信用評價模型,利用政務外貿訂單數據和來自海關、銀行、中信保等業務協同部門的多維涉企信息,建立外貿企業信用評價模型,將企業劃分為多個等級,為商業銀行提供貸前準入控制、供應授信決策參考、推送優質企業名單;打破“信息孤島”的壁壘,推動政務數據與金融數據互通,助力企業信用體系高效、健康發展。平臺從政策資訊推送、金融產品管理、在線融資申請、融資進度跟蹤、融資結果反饋、融資明細查詢等維度提供外貿企業融資的全生命周期服務,打造專注于外貿企業的金融服務平臺,如圖所示。為政務金融協同預警系統外貿企業提供信用報告在線授權功能,企業用戶在申請融資時
70、可授權相關政務機構或指定的商業銀行查詢其信用報告,企業無需線下提交紙質授權書或在其他系統中執行二次操作。政務金融協同檢測預警案例框架如圖 8 所示。45 圖 8 政務金融協同檢測預警案例框架 4.ID4.ID 去標識化流通去標識化流通 金融業務場景中很重要的一點是對個人客戶進行風險識別。但單一一家金融機構的數據往往具有局限性,為取得更好的風險識別效果,就需要聯合其他機構的數據。多方數據關聯融合過程不可避免地要傳輸個人身份信息。直接傳輸身份信息風險很高,因此需先進行脫敏處理?,F階段,行業內脫敏方式一般為散列化,即通過 Hash 算法將個人身份信息處理為不可識別的字符串。但這樣的散列化脫敏方式具有
71、一定被還原的安全隱患。為解決這一安全隱患,某公司與公安部門進行深度合作,基于密碼學算法,引入 xID 去標識化技術,構建了一套數據去標識 46 化技術體系,能夠實現身份信息類數據的去標識化處理,可為應用機構的身份信息類數據生成不同且不可逆的 xID 標記信息,并在受控的狀態下實現 xID 映射。當 A 機構(數據需方)發起數據查詢請求的時候,首先通過 xID 生成服務,將客戶 ID 明文生成為 xIDlabel(A),然后通過業務調用請求,將含有 xIDlabel(A)的信息發送給 B 機構(數據供方)。由于 xIDlabel(A)是 A 機構獨有的 xID 信息,對于 B 機構而言,他是無法
72、直接識別的。因此B 機構需要將 xIDlabel(A)通過 xID 映射服務轉換為自己能夠識別的 xIDlabel(B),然后以 xIDlabel(B)檢索用戶數據,最后將查的結果返回給 A 機構,從而完成本次數據流通的交互。在數據流通中的調用流程如圖 9 所示。圖 9 ID 去標識化案例框架 47 某國有銀行聯合風控項目中,通過采用 xID 去標識化技術,在滿足業務風控需求的同時,對客戶身份信息起到了很好的保護效果。5.5.金融綜合數據共享金融綜合數據共享 目前,各商業銀行向當地人行報送金融明細數據和其他業務數據的頻率較低,數據時效性難以保證,一方面導致人行不能進行高效監管,另一方面導致人行
73、向各商業銀行的風險信息傳遞滯后,無法及時發現風險。商業銀行進行盡調和風控時,希望拿到豐富的數據對客戶更精準的畫像,但出于數據隱私、安全、權屬等方面的考慮,銀行在傳統模式下不愿、不敢與同業共享數據,導致商業銀行進行風險預警研判時缺少重要的數據來源。由于缺乏一個能有效保護數據隱私的政銀企數據互聯通道,導致分散在不同地域、不同機構的金融數據價值未被充分釋放,難以發揮數據價值服務于中小微企業融資、信用體系建設、普惠金融等領域。依托區塊鏈技術底層基礎設施,結合隱私計算等前沿技術,建設“基于區塊鏈的省級金融數據交換平臺”,打通省內金融同業數據、省內銀政數據、跨省數據、省級與國家級數據共享通道,在保護各方數
74、據隱私的前提下,實現數據的“可用不可見共享”,48 充分釋放數據價值,賦能金融業務場景。人行地方分支行通過省級平臺歸集來自地方政府和行業相關部門、地方性金融機構和其他機構的數據,對接人民銀行數據交換管理平臺進行數據上報。也支持接收來自人民銀行數據交換管理平臺的數據,數據的哈希、上報和接收的記錄均被記錄在區塊鏈上存證。金融綜合數據共享案例框架如圖 10 所示。圖 10 金融綜合數據共享案例框架 6.6.面向線上信貸審批的數據匿蹤查詢面向線上信貸審批的數據匿蹤查詢 線上信貸業務具有單筆授信額度小、審批速度快、無需抵押擔保、貸款期限短等特點,但業務增長的同時也帶來了多頭信貸風險。通常,多頭借貸客戶大
75、多存在資金困難、還款能力不足、逾期風險較高,因此,防止多頭借貸是金融機構進行風險管控的必要措施。當前依賴人行征信查詢和機構間信息共享的方法存在同業機構不愿、征信查詢記錄易受污染等痛點。針對現存場景痛 49 點,本案例使用基于隱匿查詢的實現方案,提供了防范多頭借貸的新措施。合作主要由協調方和成員方組成。銀行方作為協調方,承擔管控和中心協調網絡轉發職能。其他各銀行作為合作成員,通過私有化部署的隱私計算節點實時查詢其他成員數據,并提供查詢服務。當客戶到某聯盟成員 A 申請貸款時,該成員會通過隱私計算方式查詢該客戶在所有聯盟成員的借貸申請查詢記錄,成員 A可以基于該結果,結合內部的風控策略決定是否提供
76、貸款。本案例使用了秘密共享、不經意傳輸、隱私信息檢索等隱私計算技術,通過中心節點轉發成員之間的調用請求,做到查詢成員與數據提供成員身份的互盲,一是被查詢成員的借貸相關信息不出域,二是查詢發起機構的用戶信息保護,中心節點無法解密獲取隱私信息。同時,所有參與成員必須經過中心協調方對成員的認證、審批,有效控制了數據質量受污染的情況,通過隱私計算的加持,緩解了客戶借貸行為信息不愿共享的難題,保護數據隱私的同時實現了數據價值融合共創。50 六、總結與展望 金融行業天然具有鮮明的數字基因,數字驅動金融行業飛速發展,深刻影響著市場參與主體、數據交易市場發展形態、重塑金融服務格局等。鑒于金融行業在國民經濟中的
77、樞紐地位,充分發揮金融的資源配置功能和專業服務優勢,做好數據要素市場建設的支持者、規則的貢獻者、交易的參與者,為加速實現數據要素市場化配置、打造我國數字經濟新優勢積極貢獻金融力量。本報告立足金融行業的數據流通,提出了金融數據流通體系框架和全生命周期流程,為構建行業級數據流通交易平臺、建立金融數據要素流通新模式提供金融方案,從而推動數據資源配置程序合規化、效率最大化和效能最優化,促進數據要素跨地區、跨機構、跨層級合規有序流通,為探索數據要素化路徑提供金融實踐經驗,為推動數據要素市場生態加速發展發揮示范先行作用。金融行業與數據要素市場發展相輔相成。數據要素市場不斷規范發展,有助于金融機構高效率進行
78、大規模的數據融合應用,實現風險管理實時化、決策支持智能化、資源配置精準化發展。金融行業參與、服務數據要素市場建設,同時,數據要素市場也是金融市場的重要組成部分,正如服務其他要素市場一樣,金融機構將為數據要素流通市場提供包括直接相關的金融中介服務 51 和數據交易計費和支付結算,以及衍生的數據信用市場,如數據估值、數據抵押登記、數據銀行、數據證券化、數據保險、數據信托、數據租賃等全方位、開創性的金融支持服務。未來,還需要深入探索金融數據流通交易的有效路徑,促進金融市場與數據要素市場深度聯動,助推我國數據要素市場生態繁榮,同時依法合規推動數據要素在金融領域的有序流通和高效應用,共同為我國經濟高質量
79、發展提供驅動力,為數字經濟創新發展提供新動能。52 附錄:術語解釋 數字經濟(Digital Economy)數字經濟是指以使用數字化的知識和信息作為關鍵生產要素、以現代信息網絡作為重要載體、以信息通信技術的有效使用作為效率提升和經濟結構優化的重要推動力的一系列經濟活動。來源:二十國集團數字經濟發展與合作倡議(2016)數據(Data)數據,是指任何以電子或者其他方式對信息的記錄。來源:中華人民共和國數據安全法第三條 數據要素市場場(Data Elements Market)數據要素市場就是將尚未完全由市場配置的數據要素轉向由市場配置的動態過程,其目的是形成以市場為根本調配機制,實現數據流動的
80、價值或者數據在流動中產生價值。來源:國家工業信息安全發展研究中心中國數據要素市場發展報告(20202021)數據資產資產化(Data Capitalization)對數據的采集、處理到利用并產生價值的過程就是數據資產化。來源:葉雅珍,劉國華,朱揚勇.數據資產化框架初探.大數據J,2020,6(3):2020019-1 數據流通(Data Flow)數據流通是某些信息系統中存儲的數據作為流通對象,按照一定規則從供應方傳遞到需求方的過程。來源:中國信息通信研究院數據流通關鍵技術白皮書 1.0(2018)53 數據共享(Data Sharing)數據共享就是讓在不同地方使用不同計算機、不同軟件的用戶能夠讀取他人數據并進行各種操作運算和分析。來源:百度百科 數據交易(Data Trading)大數據交易實質是以大數據為標的,雙方訂立買賣法律合同的商事交易。來源:陳煬.我國大數據交易的風險問題及規則的構建J.商情,2020,(2):198.數據安全(Data Security)數據安全,是指通過采取必要措施,確保數據處于有效保護和合法利用的狀態,以及具備保障持續安全狀態的能力。來源:中華人民共和國數據安全法第三條