《中國信通院:數據要素白皮書(2022年)(52頁).pdf》由會員分享,可在線閱讀,更多相關《中國信通院:數據要素白皮書(2022年)(52頁).pdf(52頁珍藏版)》請在三個皮匠報告上搜索。
1、No.202226 中國信息通信研究院 2023年1月 數據要素數據要素白皮書白皮書 (20222022 年年)版權聲明 版權聲明 本白皮書版權屬于中國信息通信研究院,并受法律保護。轉載、摘編或利用其它方式使用本白皮書文字或者觀點的,應注明“來源:中國信息通信研究院”。違反上述聲明者,本院將追究其相關法律責任。本白皮書版權屬于中國信息通信研究院,并受法律保護。轉載、摘編或利用其它方式使用本白皮書文字或者觀點的,應注明“來源:中國信息通信研究院”。違反上述聲明者,本院將追究其相關法律責任。前前 言言 習近平總書記指出,數據作為新型生產要素,對傳統生產方式變革具有重大影響,要構建以數據為關鍵要素的
2、數字經濟。2019 年 10月,黨的十九屆四中全會首次將數據納入生產要素范疇;2022 年 12月,黨中央、國務院印發關于構建數據基礎制度更好發揮數據要素作用的意見,為最大化釋放數據要素價值、推動數據要素市場化配置提出了最新指引。在三年的實踐探索中,我國數據要素市場建設取得顯著成效,市場主體和市場環境不斷完善,要素質量得到大幅提升,但是制約數據要素市場化配置的權屬界定、估值定價、市場規則、流通技術等關鍵性難題仍有待破解。本報告把握數據要素市場化發展的主線,以數據要素價值創造為理論起點,以解決我國數據要素市場培育的瓶頸問題為基本導向,通過理論、案例、比較等分析手段,初步給出了一套破解我國數據要素
3、市場難題的技術、市場和制度思路與方案。全文主要觀點如下:一是歸納出數據要素價值的實現途徑,即業務貫通、數智決策、流通賦能三次價值的釋放,為數據要素市場建設提供理論基礎。二是明確了數據要素市場的內涵和特征,即數據要素市場以數據產品及服務為流通對象,以數據供方、需方為主體,通過流通實現參與方各自訴求的場所,是一系列制度和技術支撐的復雜系統。三是辨析了數據要素市場存在的三種流通形式,即開放、共享、交易三種既有區別也有聯系的流通形式,探討了其適用場景與發展現狀。四是概括出數據要素市場經營運行存在的三種新模式,即從自行管理運維到委托運營的機制創新模式;從供需直接對接到多元數商參與的主體創新模式;從分散對
4、接到統一數據空間的設施創新模式。五是識別出數據要素市場培育的四大障礙,即權利歸屬難以界定、估值定價缺乏依據、流通規則尚不完善、流通技術仍未成熟,并給出了解決思路建議。最后,本白皮書對“十四五”期間我國數據要素的發展方向進行了展望,在不遠的將來為實現數據要素價值的全面釋放,必須加快數據要素基本問題研究,加快技術創新步伐,切實推動數據交易流通。目目 錄錄 一、數據要素理論問題概述.1(一)數據的概念與獨特屬性.1(二)數據成為生產要素有深厚的技術和產業背景.5(三)數據要素主要通過三條途徑實現價值.8 二、我國數據要素市場培育現狀.12(一)數據要素市場政策布局不斷細化深入.13(二)數據要素市場
5、主要存在三種流通形式.15(三)數據要素市場供需對接向多行業擴展.21(四)數據要素市場經營運行模式積極創新.22 三、數據要素市場培育障礙與探索思路.26(一)權利歸屬難以界定,有待建立產權制度.26(二)估值定價缺乏依據,有待發揮市場作用.30(三)流通規則尚不完善,有待鼓勵積極探索.33(四)流通技術仍未成熟,有待強化技術支撐.37 四、數據要素發展展望.41 參考文獻.44 圖圖 目目 錄錄 圖 1 數據-信息-知識-智慧(DIKW)模型.3 圖 2 數據要素主要表現形態.7 圖 3 數據要素的三次價值釋放.8 圖 4 黨中央國務院發布多項政策文件圍繞數據要素布局.15 圖 5 數據要
6、素流通的三種形式.15 圖 6 國內大數據交易所(中心、平臺等)建設歷程.20 圖 7 通過登記使數據產權分置運行和權益保護有據可依.30 圖 8 三級數據交易市場的初步設想.37 數據要素白皮書(2022 年)1 一、數據要素理論問題概述 數據要素已快速融入生產、分配、流通、消費和社會服務管理等各個環節,深刻改變著生產方式、生活方式和社會治理方式。如何理解數據的內涵與特性,把握數據成為生產要素的背景和價值實現的途徑,都是值得深入探討的理論問題。(一)數據的概念與獨特屬性(一)數據的概念與獨特屬性 在廣泛意義上,數據(data)就是對事實、活動等現象的記錄。辭海(第七版)將數據定義為“描述事物
7、的數字、字符、圖形、聲音等的表示形式”。按照中華人民共和國數據安全法中給出的定義,數據是指任何以電子或者其他方式對信息的記錄。由此可見,數據本身可以有豐富的表現形式。數據一直伴隨著人類的發展而變遷。在古代,數據呈現出規則化匯聚的特征。例如,我國古代的黃冊(全國戶口名冊)、天文觀測記錄均以特定規則進行登記造冊,它們對人類社會和物理世界的性質、狀態與相互關系進行記錄和計算,都是寶貴的古代數據遺產。計算機發明后,數據與計算機編碼產生重要聯系。凡可被編碼為一系列 0 和1組成的二進制記錄,都是計算機可處理的數據。早期計算機的采集、存儲、計算技術尚不成熟,只能有效處理行列結構明確的數據表,此時數據更多指
8、代這類結構化數據。近十幾年來,數據存儲、傳輸和計算的性能不斷突破,數據管理、數據處理技術快速迭代,網頁、聲音、圖像等半結構化、非結構化數據也逐漸得到有效處理和利用。大數據時代,數據是基于二進制編碼的、按預先設置的規則匯聚數據要素白皮書(2022 年)2 的現象記錄。在此階段,數據不僅是對客觀現象的被動記錄,越來越多的復雜現象由人們主動發掘并記錄成為數據。例如,主動埋點收集的行為數據、基于關系網絡挖掘的圖數據、精細布放傳感器捕獲的物聯網數據等。這種從被動到主動的轉變昭示著一種新的觀念,即物理空間中的一切事物都可以被預先設置的認知角度、記錄規則和技術框架映射到數據空間,數據的創造融入了數據觀察者或
9、收集者的認知視角。例如,一篇文學作品,在自然語言處理的視角下只是遵循語料庫規則的一條數據。數據與信息之間雖然有復雜聯系,但二者并不應混淆。從人類認知的角度看,數據是匯聚起來用于認知的原材料,信息是人類大腦可以理解和認知的事物狀態和聯系。在“數據-信息-知識-智慧”(Data-Information-Knowledge-Wisdom,DIKW,如圖 1)模型看來,數據本身是無意義的原始事實記錄,只有經過主體使用、分析和提煉,才會產生對人類有用的、具有特定功能的信息。數據能夠承載信息,信息則是已經被加工為特定形式的數據。當今技術和產業更強調數據作為原材料的獨特價值,依靠數據驅動可以產生大量人類理性
10、難以直接感知到的信息,這些信息是數據價值釋放的一種結果。數據要素白皮書(2022 年)3 來源:公開資料整理 圖 1 數據-信息-知識-智慧(DIKW)模型 數據與土地、勞動、資本、技術等傳統生產要素相比有明顯的獨特性。產學研各界對數據的特性已有廣泛討論,總結各方觀點可以發現,數據首先作為獨特的技術產物,具有虛擬性、低成本復制性和主體多元性。這些技術特性影響著數據在經濟活動中的性質,使數據具備了非競爭性、潛在的非排他性和異質性。數據的以上特性使得與傳統生產要素相配套的規則體系、生態系統等難以直接沿用。作為技術產物,數據具有虛擬性。數據是一種存在于數字空間中的虛擬資源。土地、勞動力等傳統生產要素
11、都是看得見、摸得著的物理存在,與數據形成鮮明對比。數據具有低成本復制性。數據作為數字空間中的存在,表現為數據庫中的一條條記錄,而數據庫技術和互聯網技術又能使數據在數字空間中發生實實在在的轉移,以相對較低的成本無限復制自身。數據具有主體多元性。數字空間中的每條數據數據要素白皮書(2022 年)4 可能記錄了不同用戶的信息,數據集的采集和匯聚規則又是由數據收集者設定,用戶、收集者等主體間存在復雜的關系。同時,每個企業、每個項目都可能對所用的數據資源進行一定程度的加工,每一次增刪改的操作都是對數據集的改變,因而這些加工者也是數據構建的參與主體。作為經濟對象,數據具有非競爭性。得益于數據能夠被低成本復
12、制,同一組數據可以同時被多個主體使用,一個額外的使用者不會減少其他現存數據使用者的使用,也不會產生數據量和質的損耗。例如,在各類數據分析、機器學習競賽中,同一份數據可以被大量參賽者使用。非競爭性為數據帶來更普遍的使用效益與更大的潛在經濟價值。數據具有潛在的非排他性。數據持有者為保護自己的數字勞動成果,會付出較高代價使用專門的人為或技術手段控制自己的數據,因而在實踐中,數據具有部分的排他性。然而,一旦數據持有者主動放棄控制或控制數據的手段被攻破,數據就將完全具有非排他性。排他性是界定產品權利的重要基礎,土地、勞動、資本都有明顯的競爭性和排他性,可以在市場上充分實現權利流轉。技術在當今專利保護制度
13、下具有排他性,也可實現權利轉讓和許可。數據具有異質性。相同數據對不同使用者和不同應用場景的價值不同,一個領域高價值的數據對另一領域的企業來說可能一文不值。與數據形成鮮明對比的是資本,資本是均質的,每份資金都有相同的購買力,對所有主體同質。綜上所述,相比其他生產要素,數據的部分特性使它難以參照傳統方式進行管理和利用,但其可復制、可共享、無限增長和供給的稟數據要素白皮書(2022 年)5 賦,打破了傳統要素有限供給對增長的制約,為持續增長和永續發展提供了基礎與可能。(二)數據成為生產要素有深厚的技術和產業背景(二)數據成為生產要素有深厚的技術和產業背景 生產要素是對生產過程中為獲得經濟利益所投入資
14、源的高度凝練。每當出現經濟增長速度快于已知要素投入增長速度時,就可以概括出新的要素來說明其余要素未能說明的剩余產出。因此,生產要素是隨著生產力的發展而不斷擴充的。將數據增列為生產要素的原因在于它對推動生產力發展已顯現出突出價值。數據顯著推動生產需要相應的技術和產業基礎,隨著數據相關技術和產業的發展,數據逐漸具備規模大、價值高等特征,演變為推動生產效率提升的重要要素。20 世紀 70 年代,關系型數據庫的發展使數據處理效率大幅提升,數據推動生產的價值初步顯現。在數據庫誕生之前,程序員處理數據時需要直接面對操作系統的底層文件進行針對性開發,無論是數據結構還是文件格式,執行起來都有較高復雜度。197
15、0 年,埃德加科德(Edgar Codd)提出關系型數據庫模型,指明了數據庫發展的一大重要方向。隨著關系型數據庫的成熟,以關系代數為基礎的 SQL 語言的普遍使用,以及 Oracle、DB2 等事務數據庫產品的涌現,面向事務處理的 OLTP(On-Line Transaction Processing,聯機事務處理)系統得到應用,數據的增刪改查有了標準工具和組件,數據使用者可以不再直面操作系統底層環境和數據處理底層邏輯,從而專注于上層應用系統開發,業務運轉效率明顯提高。20 世紀末,挖掘數據價值的需求不斷增長,數據倉庫與數據分析數據要素白皮書(2022 年)6 技術迅速發展,數據在生產中的意義
16、進一步顯現。隨著 1991 年萬維網的提出,互聯網浪潮席卷全球,數據量迅速膨脹,利用數據集進行信息分析和知識挖掘的需求不斷增長。比爾恩門(Bill Inmon)確立了數據倉庫的概念,提出數據倉庫是面向主題的、集成的、相對穩定的、反映歷史變化的、用于支持在線分析和管理決策的數據集合??频聞t認為傳統的 OLTP 在性能、適用性、性價比方面已不再適用,于1993 年提出滿足多維分析的 OLAP(On-Line Analytic Processing,聯機分析處理)系統。OLAP 支持復雜的分析操作,提供直觀易懂的查詢結果,追求滿足大規模聚合分析查詢的性能表現。與此同時,機器學習算法不斷創新,人工智能
17、技術正走出第二次低谷期,數據驅動的分析決策逐漸獲得關注。進入 21 世紀,數據的大規模集中和高維度分析全面推動生產效率提升。為滿足數據大規模存儲、高性能計算、在線實時查詢等需求,越來越多的組織開始搭建大數據平臺,數據處理和分析方面的技術向分布式、基于 Hadoop 的體系靠攏,對數據的管理也逐漸規范化。隨著近年來平臺經濟迅速崛起和移動互聯網的普及,數據呈現指數級爆發的增長趨勢,業務數據處理及時性和快速性的需求也不斷提升,各組織從 Hadoop 轉向 Storm、Spark 和 Flink 體系,在吸收開源技術的基礎上,不斷探索流式計算、秒級采集系統的建設,構建企業級的實時數據分析體系。隨著數據
18、湖、數據中臺等概念和技術加速落地,結合機器學習、人工智能等新興技術,眾多組織對數據進行統一存儲計算和高質量治理,為各類應用提供數據服務,對海量數據實時處理和數據要素白皮書(2022 年)7 智能分析的能力不斷增強,極大推動了生產效率的提升。數據技術的發展伴隨著數據應用需求的演變,影響著數據投入生產的方式和規模,數據在相應技術和產業背景的演變中逐漸成為促進生產的關鍵要素。因此,“數據要素”一詞是面向數字經濟,在討論生產力和生產關系的語境中對“數據”的指代,是對數據促進生產價值的強調,即數據要素指的是根據特定生產需求匯聚、整理、加工而成的計算機數據及其衍生形態,投入于生產的原始數據集、標準化數據集
19、、各類數據產品及以數據為基礎產生的系統、信息和知識均可納入數據要素討論的范疇(如圖 2)。對于數字化轉型剛剛開始的企業,原始數據集是維持業務系統運轉、提高業務運行效率的基礎資源。對于數字化較為成熟的企業,其經過清洗、預處理后的數據集具有更高質量,能夠提供更準確、更全面、更有預測力的信息用于分析決策,可以為企業帶來更大的效益。企業還可將自身持有的數據加工成多樣的數據衍生品,在符合法律制度的前提下向外流通,使其他企業利用數據蘊含的價值參與生產活動。來源:中國信息通信研究院 圖 2 數據要素主要表現形態 數據要素白皮書(2022 年)8(三)數據要素主要通過三條途徑實現價值(三)數據要素主要通過三條
20、途徑實現價值 激活數據要素的根本目的是以多樣、創新的方式投入生產,為經濟社會生產創造更大的價值。數據要素究竟如何發揮其作為生產要素的價值,需要進一步分析厘清。隨著信息技術的發展和產業應用的演化,數據要素投入生產的途徑可概括為三次價值釋放過程(如圖 3)。來源:中國信息通信研究院 圖 3 數據要素的三次價值釋放 1.一次價值:數據支撐業務貫通 數據投入生產的一次價值體現在支撐企業、政府的業務系統運轉,實現業務間的貫通。數據經由各個業務系統的設計而產生,用以支撐業務系統的正常運轉。通過計算機對數據的讀寫,貫通線下與線上的界限,實現業務初步的標準化、自動化管理和運營。此過程中,數據集中產生、單一存儲
21、、形式簡單,相應的治理工作也以增、刪、改、查、對齊、合并等常規的數據庫管理為主,多集中于局部業務領域的流程改善和相關業務數據的貫通。雖然此階段數據并未得到深度整合數據要素白皮書(2022 年)9 與分析,數據開發利用并未得到很大關注,但數據對業務運轉與貫通的支持是實現數字化轉型、提高內部管理效率的第一步。例如,20 世紀末谷歌公司成立后革新了數據存儲與計算系統,得以處理當時整個互聯網的數據,構建起精準高效的搜索引擎?;邶嫶髷祿亢团判蛩惴ǖ乃阉鳂I務產生巨大利潤,奠定了谷歌公司行業翹楚的地位。二十年前,我國以“兩網、一站、四庫、十二金”1工程為代表的電子政務建設全面開展,經過多年推進,各級政府
22、業務信息系統建設和應用成效顯著,通過業務數字化的方式實現了數據在系統中的有效運轉和貫通,公共服務水平得到全面提升,“最多跑一次”、“一網通辦”、“一網統管”、“一網協同”、“接訴即辦”等創新實踐不斷涌現,為當今的數字政府建設奠定了基礎。為推動數據的一次價值釋放,企業、政府主要工作重心是業務數字化及各類業務信息系統建設。這一階段,各主體所持有的數據種類相對單一、計算的要求簡單,技術門檻較低,關鍵是深入挖掘業務需求,明確業務數字化方向。如制造業企業通過建設訂單數據管理系統,實現物流、信息流、資金流的對齊、核驗,可有效推動整個業務流程的有序流轉。隨著業務信息系統的建設,企業、政府的數據實現獨立存儲、
23、統一管理,大量寶貴的業務數據不斷積累,為進一步挖掘數據的生產要素價值奠定了重要基礎。1“兩網”指政務內網和政務外網;“一站”指政府門戶網站;“四庫”指人口、法人單位、空間地理和自然資源、宏觀經濟四個基礎數據庫;“十二金”是面向政府辦公業務建立的十二個重點信息應用系統,包括金財、金農、金盾、金保、金稅、金關、金水、金質、金審、金卡、金貿、金企等十二項工程。(參考資料:中國電子政務網 http:/www.e- 年)10 2.二次價值:數據推動數智決策 數據要素投入生產的二次價值釋放體現在通過數據的加工、分析、建模,可以揭示出更深層次的關系和規律,使生產、經營、服務、治理等環節的決策更智慧、更智能、
24、更精準。在數據分析、人工智能等技術的輔助下,數據自動化、智能化的采集、傳輸、處理、操作構成了新的生產體系,可以實現經營分析與決策的全局優化,數據要素成為決定企業競爭力的重要因素。究其原因,數據要素二次價值釋放的關鍵在于數據可以提供獨特的觀察視角,在此基礎上可以構建出理解、預測乃至控制事物運行的新體系,從而擺脫經驗的局限,更加即時有效地防范化解風險,創新行動方略。例如,2012 年海爾公司利用成熟的技術工具棧,建立了針對業務管理和經營決策的完整數據鏈,從而實現通過業務智能化來優化管理崗位用工結構;各大銀行充分整合中小企業的經營數據,挖掘更準確的企業客戶畫像與信用評分,由此決定中小企業貸款風險評估
25、結果,為中小企業低成本融資提供可能??梢钥吹?,數據要素不僅可以投入于自有業務支撐分析決策,還能夠優化傳統生產要素的經營與配置,使傳統要素價值倍增,提升全要素生產效率。數據驅動的智慧化、智能化決策可以實現更少的要素資源投入創造更多的物質財富和服務,有助于實現生產率躍升、產業鏈優化和競爭力重塑。數據二次價值釋放過程對企業數據挖掘和洞察能力提出更高要求。無論大勢判斷還是業務執行,數據都有利于消除人的認知誤區和主觀偏見。一方面,在對大量數據進行管理和分析的基礎上,決策者數據要素白皮書(2022 年)11 需要結合對業務目標的深刻理解,運用數據呈現出的關鍵指標與信息深入評估發展態勢,做出更具智慧的決策。
26、另一方面,二次價值可以直接回饋一次價值,企業需要充分利用數據分析結果,尋找關鍵的函數、標簽、畫像,實現自動化的預測、分析和決策,使業務運轉更智能。3.三次價值:數據流通對外賦能 數據要素投入生產的三次價值釋放讓數據流通到更需要的地方,讓不同來源的優質數據在新的業務需求和場景中匯聚融合,實現雙贏、多贏的價值利用。隨著政府和企業數字化轉型的不斷深入和智能化水平的不斷攀升,各組織對于數據的渴求已經超越了自身產生的數據。政府希望各級各部門數據實現對接共享,提升政務管理和公共服務水平;企業希望通過其他企業或政府部門的數據來豐富自身對于數據的挖掘,因此產生了數據流通的需求。對數據提供方來說,數據流通后并不
27、減損自身持有數據的價值,相反還有可能將這部分價值變現,帶來新的業務增長點,實現雙贏乃至多贏的局面。例如,通過來自市場監督管理部門的企業注冊數據、來自法院的企業判決數據、來自銀行的信用數據等精準描繪企業畫像,或通過來自電網的用電數據、來自電商平臺的消費數據、來自物流公司的物流數據等提供宏觀經濟的觀察指標,社會經濟活動中的各類事項均可被多方來源的數據賦能,其中涉及的數據流通可能產生極大的市場規模,使數據要素價值在多元場景中持續釋放,從而將數據要素的業務價值、經濟價值和社會價值顯性化,為數據要素市場的發展提供強勁動力。在數據的三次價值釋放過程中,數據要素市場及其技術路徑成為數據要素白皮書(2022
28、年)12 行業關注的焦點。在保障數據安全的前提下,各組織打通數據壁壘、優化數據配置的需求日益凸顯,通過數據要素市場引入外部數據的需求尤為迫切。保障提供方數據安全、防止數據價值稀釋的數據流通技術蓬勃發展,以隱私計算為代表的數據流通技術提供了“數據可用不可見”“數據可控可計量”的流通新范式,為需求方企業安全地獲取和分析外部獲取的數據提供了技術可能。數據安全有序流通的技術成為數據要素三次價值釋放的關鍵,也為數據要素市場建設提供了重要的技術路徑。從數據應用的業務需求看,業界對數據的關注焦點經歷了從“對內”到“對外”的變化?!笆濉睍r期提出“數據是鉆石礦”,更多強調組織內部應用數據發揮價值;“十四五”
29、時期提出“數據要素市場化配置”,增添了從組織對外提供和從外部獲取數據的視角,進一步凸顯出數據在流通中實現的價值增值。部分企業受限于資金、人才、技術水平不足,尚不具備業務數據電子化或分析決策智能化的能力,即使引入外部數據也無法有效利用,無法形成回饋業務發展的價值回路。因此,數據支撐業務貫通和促進數智決策的價值仍需要持續釋放,數據流通對外賦能的價值也應在前兩次價值的基礎上逐步發揮。二、我國數據要素市場培育現狀“數據是生產要素”這一判斷突出了數據促進生產的重要價值。隨著數據采集、治理、應用、安全等方面的技術和產業發展,數據支撐業務貫通的一次價值和促進數智決策的二次價值已得到初步釋放,互聯網、金融、電
30、信等行業頭部企業數據驅動的數字化轉型加速發展,數據要素白皮書(2022 年)13 為廣大中小企業釋放數據要素價值提供了參考經驗。但是,當前大量數據集中于少數主體,數據要素分布不均、結構失衡,需要加速市場化流通使數據價值惠及廣大市場主體。同時,數據具有規模效應,越大規模、越多維度的數據融合匯聚創造的價值倍增,企業自有數據與外部數據的充分融合才能實現數據應用價值的最大化。因此,在前兩次價值釋放的基礎上,數據流通對外賦能的價值逐漸獲得政策布局和產業實踐的重點關注,下面的討論也將聚焦數據要素市場。數據要素市場是以數據產品及服務為流通對象,以數據供方、需方為主體,通過流通實現參與方各自訴求的場所,是一系
31、列制度和技術支撐的復雜系統,是促進數據自主有序流動、提高配置效率、發揮數據價值的關鍵。(一)數據要素市場政策布局不斷細化深入(一)數據要素市場政策布局不斷細化深入 我國自 2019 年十九屆四中全會首次將數據增列為生產要素以來,中央發布多項政策文件,圍繞數據要素發展進行謀篇布局(如圖 4),并將關注點聚焦于數據要素市場建設。2020 年印發的 關于構建更加完善的要素市場化配置體制機制的意見 首次提出培育數據要素市場。2021 年要素市場化配置綜合改革試點總體方案進一步以“探索建立數據要素流通規則”為主題進行數據要素市場化配置改革的布局,聚焦數據采集、開放、交易、使用、保護等全生命周期的制度建設
32、,具體從完善公共數據開放共享機制、建立健全數據流通交易規則、拓展規范化數據開發利用場景和加強數據安全保護四個方面展開。面向未來,我國“十四五”數字經濟發展規劃對于數據要素數據要素白皮書(2022 年)14 發展的布局集中體現在壯大數據要素市場規模、開展數據要素市場培育試點工程等方面。進一步擴大數據要素市場規模的工作重點在強化高質量數據要素供給,創新數據要素開發利用機制,培育壯大數據采集、標注、清洗等服務產業,鼓勵市場力量挖掘數據價值,推動統一標準體系建設,努力實現互通互操作,形成完整貫通的數據鏈,促進數據、技術、場景深度融合。培育數據要素市場的工作方向集中在探索數據確權與定價規則,開展數據確權
33、及定價服務試驗,完善市場運營和治理體系,培育規范的數據市場主體和數據交易平臺,營造安全有序的市場環境。由于數據匯聚能帶來價值倍增,具有規模效應,容易出現“贏者通吃”的自然壟斷現象。政策布局既要反地方保護、反壟斷,又要扶持具有產業鏈影響力的數據要素生態。2022 年 4 月,中央布局全國統一大市場建設,數據要素市場作為其中一部分,也需打破地域間、市場間壁壘,加強數據要素的協同。2022 年 12 月,中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見提出構建數據基礎制度體系,促進數據合規高效流通使用,建立保障權益、合規使用的數據產權制度,建立合規高效、場內外結合的數據要素流通和交易制
34、度,建立體現效率、促進公平的數據要素收益分配制度,建立安全可控、彈性包容的數據要素治理制度。國家的頂層設計逐步對數據要素各環節提出更細致的目標和要求,為推動數據在更大范圍內有序流動和合理集聚、進一步促進數據價值轉化應用指明了方向。數據要素白皮書(2022 年)15 來源:中國信息通信研究院 圖 4 黨中央國務院發布多項政策文件圍繞數據要素布局(二)數據要素市場主要存在三種流通形式(二)數據要素市場主要存在三種流通形式 培育數據要素市場的目標是數據在各市場主體間高效有序自由流通。按照數據與資金在主體間流向的不同,可分為開放、共享、交易三種流通形式(如圖 5)。來源:中國信息通信研究院 圖 5 數
35、據要素流通的三種形式 數據要素白皮書(2022 年)16 1.數據開放:以公共數據為主的開放持續推進 數據開放是指提供方無償提供數據,需求方免費獲取數據,沒有貨幣媒介參與的數據單向流通形式。由于數據提供方無法通過開放直接獲得收益,因此開放的對象往往是公共數據。公共數據是指國家機關和法律、行政法規授權的具有管理公共事務職能的組織履行公共管理職責或者提供公共服務過程中收集、產生的各類數據,以及其他組織在提供公共服務中收集、產生的涉及公共利益的各類數據。一般而言,公共數據被認為歸國家或全民所有,管理、開放等職責由政府或其他公共機構代為行使。由于其公共性,除去個人敏感信息、企業商業秘密、國家秘密之外,
36、公共數據向社會開放可以使其擁有的高價值回饋社會。建立公共數據開放平臺是各地政府推進數據開放的主要手段。近年來各地方政府在公共數據開放平臺建設方面積極推進,取得了良好成效。目前,除港澳臺外,我國已有 21 個省級行政區上線公共數據開放平臺。全國 333 個地級行政區中建成公共數據開放平臺的地區占比已達 58%2。盡管各地數據開放平臺建設效果存在差異,部分平臺數據容量小、更新頻率低,但一些省市平臺已形成較大規模,開放的數據集、數據接口已覆蓋公共安全、社會民生、經貿工商、交通出行等多個領域,為公共數據開放平臺建設做出示范。部分地市公共數據開放配套的制度與機制逐步完善。目前,我國已有十余個省市的地方法
37、規涉及公共數據開放相關內容,各地正在加 2 華中師范大學信息管理學院、湖北省數據治理與智能決策研究中心,中國政府開放數據利用研究報告(2022)數據要素白皮書(2022 年)17 緊落實中央指導文件與地方數據條例的相關要求。例如,廣東省在省級制度層面落實“一數一源”,即公共機構根據職責分工編制公共數據采集清單,按照一項數據有且只有一個法定數源部門的要求,依據統一標準提供公共數據,有效解決基礎數據重復采集、匯聚路徑不清晰、質量問題難追溯等難題。上海市 2022 年 8 月發布2022 年上海市公共數據開放重點工作安排,持續對開放細則、工作機制、技術要求提出更細致目標,通過建設樣本數據集、組織開放
38、清單常態化梳理、建立需求工單轉交機制等措施,確保開放服務便捷、質量持續提升、需求及時響應。我國的公共數據開放現狀距離國際先進水平還存在一定差距。發達國家的公共數據開放起步較早,美國、德國等國家均已建立起全國性的政府數據開放平臺。例如早在2009年上線的美國data.gov網站,發布了農業、商業、氣候、教育、能源等多領域的高質量公共數據,至今仍在不斷更新。為保證公共數據開放質量,data.gov 還開發了開放數據儀表盤,設計了數據質量自動評分與人工評分機制。政府、企業、公眾均可查看開放政策數據進展、數據質量評分等內容,公共數據需求方可獲得良好的服務體驗。2.數據共享:政府參與的數據共享趨勢加強
39、數據共享是指互為供需雙方,相互提供數據,沒有貨幣媒介參與的數據雙向流通形式。根據共享主體的不同,可分為政府間共享、政企之間共享、企業之間共享等形式。我國政府間數據共享工作持續推進,國家數據共享交換平臺進一數據要素白皮書(2022 年)18 步完善。截至 2021 年 5 月,國家數據共享交換平臺已上線目錄超過65 萬條,發布共享接口 1200 余個,累計提供數據查詢或核驗服務超過 37 億次3。其中,公安部的自然人基礎信息、教育部的高校學歷學位信息、市場監管總局的企業基本信息、民政部的婚姻登記信息等,長期位于共享調用榜前列4,對各類政務服務提供了有力支撐。政企間數據共享逐漸形成趨勢。以美團與各
40、地監管機構合作的“政企通”為例,自 2019 年以來,美團與遼寧、天津等地建立合作,通過數據共享優化餐飲安全監管。2021 年 6 月,美團同上海聯合打造“城市美好生活數字體征系統”,政府提供交管數據,幫助美團優化交通調配;美團提供不涉及用戶隱私的規律性數據,協助政府探索覆蓋吃、住、行、游、購、娛等場景的城市數字治理方案。企業間數據共享以供需合作需求為牽引,同一生態內企業、產業鏈上下游企業之間通過點對點協商約定相互提供數據的方式。然而,企業內部協商的模式導致數據共享情況整體處于黑箱狀態,具體共享方式、開發利用方式相對不透明,公開資料較少。3.數據交易:場外需求旺盛,場內重啟熱潮 數據交易是指提
41、供方有償提供數據,需求方支付獲取費用,主要以貨幣作為交換媒介的數據單向流通形式。數據交易可對接市場多樣化需求,靈活滿足供需各方利益訴求,激發市場參與主體積極性,促進數據資源高效流動與數據價值釋放,對于加快培育數據要素市場具 3 中國網絡空間研究院,中國互聯網發展報告(2021)4 中國電子信息行業聯合會,清華大學公共管理學院,中國政務數據治理發展報告(2021 年)數據要素白皮書(2022 年)19 有重要意義,正在成為數據流通的主要形式。傳統的數據交易模式以點對點的方式進行。數據需求方和數據供給方可通過兩兩協商或平臺對接的方式實現數據的采購與流轉,具體的點對點交易形式多樣。例如從數據需求方角
42、度看,銀行信貸業務為應對風控需求,向征信機構、運營商、公共部門等機構采購用戶身份信息核驗、信用評價信息等外部數據資源。又如從數據供給方角度看,一些企業對金融信息、企業信用、法院判決、報告論文、AI 標注等數據進行匯聚、處理,供需求方購買對接?,F階段,點對點的數據交易規模已相當可觀,比如大型商業銀行每年數據采購金額就超過百億元。許多供方企業在其行業領域內已建立特色化數據產品與服務體系,形成了較穩定的供需關系。點對點交易模式規范程度和交易效率較低,難以大規模推廣。點對點交易缺乏有效監管,規范程度不夠高。同時,市場中的供需雙方信息分散,對接渠道不暢通,交易效率較低。數據充分流動是發揮數據要素三次價值
43、的基礎,尤其是在建設全國統一大市場的背景下,點對點交易不利于實現大規模數據要素市場化配置。目前,全國各地以設立數據交易機構為主要抓手,鼓勵集中式、規范化的“場內數據交易”。我國自 2014 年開始探索建立類似證券交易所形式的數據交易機構,截至 2022 年 11 月,各地先后成立 48 家,仍有 8 家正在籌備建設中(如圖 6)??傮w來看,早期建設的數據交易機構大都沒有找到成功的商業模式,多數機構已停止運營或轉變經營方向,發展情況未數據要素白皮書(2022 年)20 達預期。近兩年來,隨著黨中央國務院多項重要政策出臺,各地新建一批數據交易機構,試圖消除供需雙方的信息差,推動形成合理的市場化價格
44、機制和可復制的交易制度和規則。來源:中國信息通信研究院,2022 圖 6 國內大數據交易所(中心、平臺等)建設歷程 新一批數據交易機構從強化技術支撐、完善配套規則入手,探索在數據要素市場中的立足點、突破點,幫助市場建立信任、保障權益。一是搭建“數據可用不可見”的數據可信流通技術平臺。例如,北京國際大數據交易所依托隱私計算、區塊鏈、測試沙盒等領域技術,構建新型數據交易系統;深圳數據交易有限公司牽頭發起國內首個國際化自主可控隱私計算開源社區,依托技術開源吸引政府、企業合作,打造數據要素生態圈。二是發布數據交易規則和交易憑證。例如,貴陽大數據交易所于 2022 年 5 月發布系列數據交易規則,為交易
45、主體權責劃分提供依據,并依據規則為數據產品、數據商、第三方數據服務中介機構等提供登記憑證,以確認數據和主體具備進入市場交易的條件,探索解決市場主體互信難的問題。數據要素白皮書(2022 年)21(三)數據要素市場供需對接向多行業擴展(三)數據要素市場供需對接向多行業擴展 目前參與數據要素市場的主體較為集中。從數據提供方看,各級政府、電信運營商、大型國有企業、大型互聯網公司聚集了海量經濟社會、行業、用戶數據,通過數據接口、數據產品、數據服務等形式可滿足大量企業的數據需求。數據需求方則主要集中在金融機構、零售企業等機構,希望通過獲取外部數據來優化業務。相較于中小企業尚未充分挖掘數據需求的情況,頭部
46、企業逐漸在多個行業產生較為典型的數據流通實踐,開展跨領域數據深度融合應用,為各類業務提供新資源、新方案,有效實現數據的供需對接。金融行業中,風險控制要求極為嚴格,各大金融機構以雄厚的資金實力做支撐,早已成為數據要素市場的主要參與者。以銀行信貸業務為例,為降低審貸成本、優化客戶畫像和風控模型,銀行產生大量同業和跨行業的用戶數據需求。2021 年 11 月 25 日,上海數據交易所掛牌成立,由國網上海電力公司自主研發的“企業電智繪”成為首單成交的數據產品,中國工商銀行上海分行作為購買方,可通過“企業電智繪”產品提供的企業用電數據脫敏、深度分析結果,掌握企業用電行為、用電繳費、用電水平、用電趨勢等特
47、征內容,為銀行在信貸反欺詐、輔助授信、貸后預警等方面提供決策參考?;ヂ摼W行業中,許多頭部企業已對外提供眾多數據接口或數據產品,以滿足中小互聯網企業或其他行業研發應用、精準營銷、提供智能服務等用途。例如京東的萬象平臺、阿里云的 API 市場匯集了電子商務、金融科技、企業管理、公共服務等多領域數據接口,其自有數數據要素白皮書(2022 年)22 據和人工智能服務具有較大吸引力。工業領域行業中,由于較多傳統行業數字化轉型剛剛起步,還需經歷產線內數據聯動、工廠內數據協同、企業內數據共享、企業間數據流通等多階段探索。目前,國家工業互聯網大數據交易平臺已處于內部測試階段,該平臺著力解決工業企業數據流通的難
48、點,促進工業數據要素市場發展。此外,政務、氣象、交通、醫療等行業和場景的數據需求也逐步顯現,相應公共數據的開放或企業數據的供給獲得更廣泛的關注。未來隨著提供方數據治理能力提升和需求方數據需求深度挖掘,以業務場景為牽引的數據要素市場將更加活躍。(四)數據要素市場經營運行模式積極創新(四)數據要素市場經營運行模式積極創新 1.新機制:從自行管理運維到委托運營 公共數據授權運營成為提高公共數據配置效率的探索新熱點。針對公共數據持有機構沒能力開放、沒動力開放的問題,我國各地開始探索按照法定程序,授權特定主體在一定期限和范圍內以市場化方式運營公共數據。公共數據授權運營與公共數據開放之間具有一定的協同關系
49、。公共數據開放的范圍和質量影響著公共數據授權運營的資源基礎,而授權運營獲得的經濟效益可以激勵運營方改善公共數據質量和效用,有利于進一步帶動市場活力,深化對公共數據的挖掘利用,加速公共數據價值釋放。例如,北京市經濟和信息化局授權北京金融控股集團下屬的北京金融大數據有限公司建設金融公共數據專區,對全市公共數據進行托數據要素白皮書(2022 年)23 管運營,搭建政府和社會之間的數據橋梁。目前,專區已匯聚金融機構開展信貸業務所“亟需、特需”的工商、司法、稅務、社保、公積金、不動產等多維數據 25 億余條,實現按日、按周、按月穩步更新。通過構建完善的數據安全管理體系,北京金控集團依托生態優勢,打造京云
50、企業征信平臺,通過引入專區匯聚的公共數據,累計為銀行、保險、擔保等 44 家金融機構和 2 萬多名平臺用戶提供服務 800 多萬次。數據信托為企業數據委托運營、實現數據資產變現提供新思路。數據信托是指數據供方將其數據作為信托財產設立信托,由信托機構按照委托人意愿,自行或委托第三方運營機構對信托財產進行專業管理,由此產生的增值收益按照信托目的進行利益分配的數據流通模式。應用信托財產的權利與制度設計,數據資產的使用、收益等權利可以得到有效安排,有利于減輕數據供需雙方企業的合規和管理壓力,為暫時沒有技術能力或需要現金收入的供方企業提供數據價值變現的機會。中航信托曾于 2016 年發行國內首個數據資產
51、信托產品:數據堂作為委托人,以其持有的數據資產設立信托,通過信托受益權轉讓獲得了現金對價。受托人中航信托委托數據服務商對特定數據資產進行運用增值并產生收益,向社會投資者進行信托利益分配。但是,在我國現有制度和市場下推廣數據信托還有很多問題值得探討。由于數據的財產屬性和權利內涵尚未明確,導致數據信托無法參照我國現有法律直接采用信托的法律關系。數據信托機制需要在普數據要素白皮書(2022 年)24 通信托的架構之外,針對數據的特性進行制度的創新。2.新主體:從供需直接對接到多元數商參與 傳統點對點流通模式下的數據供需匹配效率不足且缺乏信任,各地數據交易所的成立旨在幫助市場解決這一問題,但僅靠數據交
52、易所自身很難承擔數據交易中的全部服務角色。因此為數據供需雙方提供撮合、托管、經紀、結算、評估、擔保等服務的多元數商在各地數據要素市場培育中的作用開始受到更多關注。上海提出打造“數商”新生態。2021 年 11 月上海數據交易所在其揭牌成立儀式上率先提出“數商”概念,即“以數據作為業務活動的主要對象的經濟主體”,并簽約 100 余家數商。在這些數商中,既包含數據產品的直接提供者,也包含為數據交易提供合規咨詢、質量評估、資產評估、技術支持等服務的第三方服務商。北京提出建立“數字經濟中介”產業體系。為健全數據交易生態體系,2022 年 1 月,北京國際大數據交易所宣布率先在全國建立數字經濟中介產業體
53、系,以數據交易所為基礎,培育數據托管、數據經紀等一系列創新型中介產業。其中,數據托管體系包含數據資源擁有方、授權運營方、安全保障方、合規處理方、場景應用方等角色,共同實現數據的合規存儲、授權管理和市場應用;數據經紀體系則側重于場景化的數據利用,通過對接數據資源、開展經紀服務、撮合進場交易、參與價值分配等方式活躍數據要素市場。廣東開展“數據經紀人”試點。2021 年 7 月,廣東省數據要素市場化配置改革行動方案提出“鼓勵設立社會性數據經紀機構,規數據要素白皮書(2022 年)25 范開展數據要素市場流通中介服務?!?022 年 5 月,廣州市海珠區公布了首批“數據經紀人”名單,并進一步將其定位為
54、數據供需匹配的撮合者、數據流通交易的中介者、數據權益沖突的化解者,承擔受托行權、風險控制、價值挖掘等作用。雖然數商、數字經濟中介、數據經紀人的概念和具體范圍有所差異,但這些數據要素市場新主體的定位逐步清晰,除直接供需方以外的第三方數據服務商在連接匹配數據資源中的重要性日益凸顯。3.新設施:從分散對接到統一數據空間 為解決數據供需方分散、對接不暢等問題,歐盟力圖建設“單一數據市場”,率先提出打造國際數據空間(International Data Space,IDS)。國際數據空間是通過標準化的通信接口、統一的連接與交互網絡等架構設計,實現國際間數據可信流通的整體技術設施。歐盟作為 IDS 的主要
55、發起者和倡導者,在架構搭建、機制設計、行業生態等方面已形成領先優勢。我國借鑒數據空間理念,垂直領域內的工業數據空間開始探索?!笆奈濉贝髷祿a業發展規劃提出“率先在工業等領域建設安全可信的數據共享空間”。工業數據空間的目標是著力提高技術互操作性,降低工業數據使用成本,實現工業數據在不同利益相關方之間安全、透明的共享和交易。從表現形式和實現目標上講,工業數據空間與數據交易所有相似之處,都是實現供需雙方安全對接的中間平臺。但工業數據空間更側重表現為實現數據、算力等資源共享流通的基礎設施,支持供需方數據在工業數據空間內部共享開發。數據要素白皮書(2022 年)26 當前我國工業數據空間具體解決方案仍
56、為點狀探索。目前我國工業數據空間建設主要由個別頭部企業發起,建設方案不盡相同。例如,華為基于國際數據空間參考架構,研發為產業生態圈企業服務的一對一數據共享流通平臺,可進行程序自實現的跨企業數據可信流通;阿里云建設了基于隱私計算的 DataTrust 平臺,可安全接入各品牌自有數據,在原始數據不出本地的情況下實現數據計算結果的共享流通。2022 年 1 月 19 日,中國信通院聯合業界共同發起成立“可信工業數據空間生態鏈”,分 5 個工作組合力打造可信生態,力圖“連點成網”,共同推進共識建設,促進工業數據要素可信共享、交易的溝通合作。三、數據要素市場培育障礙與探索思路 總體而言,我國數據要素探索
57、處于起步階段,數據要素市場培育的基礎尚不堅實,權利關系、價格機制、流通規則、技術支撐等數據要素市場的構成要件存在諸多障礙,需要不斷推進相應的理論研究和制度設計,通過試點應用積累實踐經驗,持續探索各方面難題的解決方案。(一)權利歸屬難以界定,有待建立產權制度(一)權利歸屬難以界定,有待建立產權制度 1.問題分析 數據權屬界定的場景與問題復雜,難以達成理論共識。數據權屬問題是數據要素市場培育的理論前提,主要關心各主體針對數據所產生的權利義務關系,即圍繞數據產生的權利或者權益到底歸誰享有。傳統生產要素的流通和生產關系的建立都是以生產要素所有權為核心,在所有權基礎上圍繞使用權、收益權等其他權利進行。數
58、據權屬數據要素白皮書(2022 年)27 問題復雜的原因在于,傳統生產要素往往具有稀缺性、排他性,擁有清晰的、可分割的客體和明確的、獨立的占有主體,傳統產權制度設計可以通過評估、登記、監管等機制有效解決權利劃分、爭議仲裁等問題,而數據作為一種虛擬物品,低成本復制性、潛在的非排他性等特點與現有產權制度核心功能不相兼容,再加上數據主體多元、權利內容多樣、場景豐富多變,數據與數據之間,數據涉及的多元主體之間關聯交織難以分割,與傳統要素主體的確定性、要素關聯關系的穩定性和固定性之間也存在矛盾,使得數據權屬界定尤為復雜。制度設計目標與產業實際需求不完全一致,難以凝聚產業共識。目前各界對數據權屬問題的探索
59、還沒有形成普遍認可的解決方案。對數據權屬制度的設計與建設來說,其目標是明確數據的產權結構和歸屬規則,劃定各參與方的權利和責任,通過制度設計保障數據可控。但對產業中實際的數據流通與使用而言,現階段解決數據權屬問題的核心需求,不是決定數據所有權到底賦予誰,而是如何理順個人、企業、政府等不同主體間的不同權益,優化利益分配。例如,隨著互聯網平臺經濟日益發達,個人用戶與平臺企業之間的權利關系問題日益突出。個人用戶在使用平臺服務過程中產生的數據是平臺企業提升業務效率、創新商業模式、獲取壟斷地位的核心資源,但用戶行為產生的數據究竟歸屬于誰并不明確。從制度保護原則看,個人用戶是企業數據的邏輯起點,理應是數據權
60、利擁有者。從產業實際情形看,數據創造價值的前提是平臺的規?;瘏R聚,獨立的個人數據在個人手中不產生價值,將數據產權配置給平臺企業才有利于更多經濟價值的創造。數據要素白皮書(2022 年)28 我國法律尚未對數據權屬做出清晰規定,難以形成規則共識?,F有法律多是從保護和監管的角度出發,通過網絡安全法數據安全法個人信息保護法等規范數據的利用,但還沒有一部法律對各種場景下數據應歸誰所有做出明確界定,現行法律也較少涉及數據本身所承載的其他權益關系。司法過程中,目前主要是以反不正當競爭法 等作為數據權益保護的權宜之計,承認數據具有競爭性利益,但具體的界權規則尚未達成共識,具有較大不確定性,各經營者仍容易頻繁
61、陷入因權屬不清引發的糾紛之中。2.探索思路 面對數據權屬相關障礙,應結合頂層設計與實踐經驗,逐步形成中國特色的數據產權制度體系。中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見指出,要探索建立數據產權制度,推進公共數據、企業數據、個人數據分類分級確權授權使用,探索數據產權結構性分置制度,建立數據資源持有權、數據加工使用權、數據產品經營權等分置的產權運行機制,健全數據要素權益保護制度??紤]到數據種類、內容和流轉形態的復雜性,應結合具體實踐經驗,對“數據分類分級確權”和“產權分置運行機制”的制度設計進行優化。一是進一步細化分類分級標準,探索數據分類分級確權授權使用機制?,F有的制度框架
62、和實踐中,“分類分級”更多仍是概念性的提法,實操性不強。目前,只有金融數據安全分級指南等少數特定領域的指南給出若干子類、幾百項細分類型和安全等級的數據劃分指數據要素白皮書(2022 年)29 引,更多行業的分類分級實踐還較為粗糙,難以兼顧數據產生過程中所涉主體的權利。同時,大部分個人數據授權過程只有同意和拒絕兩種選項,缺乏按照拒絕授權、最小必要授權、部分條件授權、完全授權等級別進行授權管理的嘗試。面對眾多行業和多元場景,數據的分類分級規則尚不具備可落地性。未來需要依據數據來源、數據主體、敏感程度、應用場景、使用環節等研究數據分類分級的細化標準,探索多類型、多層次的數據確權授權使用機制。二是結合
63、具體場景,探索產權分置運行的有效機制。數據的持有權和使用權通常掌握在相同主體手中,產權的分置也需要考慮具體場景。非流通場景中,持有權和使用權通常難以分置,基本不存在只有其中一項權利的情形,但經營權需要進一步授權才可行使。流通場景中,持有權、使用權、經營權可分置運行,可分別通過授權進行權利轉移,當前最常見的情形是轉移數據使用權。然而就具體執行而言,分環節、分步驟、分主體的產權分置還缺乏有效機制,如何在具體業務和技術場景中保障產權分置后的順利運行還缺乏深入研究。因此,需要區分不同場景,進一步探索產權分置運行中確權、授權、行權、維權等的具體規則。三是通過權利登記與示范合同推進數據確權探索。數據權利確
64、認的主要表現形式是權利主體擁有一份獲得共識、不可篡改的權利聲明,可依法采取制度或技術手段開展數據確權登記試點,依托數據交易所等可信第三方機構進行數據資源持有者、數據加工使用者、數據產品經營者等主體的權利登記備案,使數據產權分置運行和權益保護有據數據要素白皮書(2022 年)30 可依(如圖 7)。同時針對市場主體大多一事一議地通過商務合同約束權利與責任的現狀,開展試點的過程中,相關機構可依法提供合同示范文本以供參考。2021 至 2022 年,中國信通院云大所數據交易合同示范文本系列給出了傳統數據集、API 接口交付和新興隱私計算融合結果交付的權責劃分模板,為行業內組織間的數據交易提供了指引。
65、來源:中國信息通信研究院 圖 7 通過登記使數據產權分置運行和權益保護有據可依(二)估值定價缺乏依據,有待發揮市場作用(二)估值定價缺乏依據,有待發揮市場作用 1.問題分析 數據的估值和定價雖有一定內在聯系,但不能完全混為一談。數據估值是基于數據生產者或使用者的角度,根據數據本身的特點進行價值評估,為價格發現提供參照基準,是相對靜態的行為;而數據定價討論的是市場行為中數據最終按什么價格交割,是動態的行為,它以市場需求和市場競爭為導向,是基于購買者對該數據的價值評估和預期成本的考量,利用市場的價格發現功能進行競價匹配的過程。傳統的資產評估方法不完全適用于數據要素。傳統的資產評估方法包括成本法、收
66、益法和市場法三類。成本法以成本估值,收益法以數據要素白皮書(2022 年)31 預期收益折現估值,市場法則是以市場上類似交易的成交價格作為估值參考。對數據的估值來說,應用成本法的問題在于數據生產涉及多元主體,成本不易區分,且貶值因素難以估算;應用收益法時,數據的時效性、使用期限評估又成為難點;應用市場法時,又受制于數據要素市場尚不活躍,缺乏足夠案例支持。由于數據預期產生的經濟價值與數據具體應用場景、數據要素市場結構高度相關,不同主體間潛在收益、供求關系均有較大的異質性,目前對數據的價值和價格進行統一、標準化規定幾乎是不現實的,現有數據估值方法均有其限制,未必能客觀準確反映數據的真實價值。數據產
67、品價格很難根據統一的標準衡量。當前各類數據交易場景或交易平臺主要采取賣方定價、協議定價等方式。賣方定價即賣方通過評估自己的數據質量、成本、需方效用給出統一報價,這一過程由賣方主導,缺乏供需雙方在市場機制下的博弈互動。協議定價雖然給予供需雙方充分的溝通機會,但雙方的反復報價議價過程中耗費了大量時間成本,無法形成標準化、大規模、高效率的價格發現機制。如果回歸市場的本質要求,數據的價格仍應該遵循價值決定價格、市場供求影響價格的基本邏輯來確定。但由于數據價值的評估尚未形成統一規則,導致參與主體難以確定衡量價格的統一標準。會計報表核算數據價值價格面臨挑戰。嚴格意義上講,只要數據能進行合理的估值定價,就應
68、當能作為數據資產計入會計報表,數據的估值定價應當與會計計量核算具有一致性。然而按照現行會計準則,數據資產入表存在現實困難。一方面數據價值已部分體現在提升利潤、數據要素白皮書(2022 年)32 增加客戶、降低成本等方面,有重復計量的可能;另一方面企業間數據資產差異較大,存在難以量化的內容,列報口徑難以統一。因此,現有的會計核算方法仍無法為數據估值定價提供有效依據。2.探索思路 面對數據估值定價的難題,需要結合數據要素自身特點,不斷探索科學的數據價值評估方法,結合具體場景有針對性地核算數據要素價值,堅持發揮市場的決定性作用,探索基于估值基礎模型的價格發現和形成機制,更好發揮政府作用,對數據價格進
69、行監督和調控。一是深入研究數據價值評估的理論依據。數據價值在具體的數據應用場景中顯現,可將衡量特定場景下數據經濟價值的問題作為攻關著力點,建立貨幣法和非貨幣法相結合的數據估值框架。在具體場景中,數據集、數據產品作為流通對象,往往有較為清晰的應用目標,可以較為明確地區分出影響數據價值的因素。在此基礎上,分類、分場景搭建數據價值評估指標體系和評估模型,運用貨幣法計算數據的直接經濟價值、間接經濟價值,運用非貨幣法從數據自身質量、風險等特性出發,計算數據效用,對貨幣法計算結果進行修正,提高估值的準確性。二是開展數據估值定價試點。在數據價值評估指標體系和評估模型的基礎上,需要培育專業化的數據資產價值評估
70、機構,在金融、通信、互聯網等領域率先開展數據資產價值評估和數據資產入表試點。同時支持試點企業開展數據流通實踐,基于數據估值結果形成市場認可的數據價格。在試點過程中,不斷完善數據資產價值評估指標體系,數據要素白皮書(2022 年)33 收錄數據估值定價的典型場景,形成數據估值定價的推廣示范案例。三是建立健全數據要素價格監管制度,探索科學規范的數據定價監測模型。健全的數據價格監管體系是公平競價的制度保障。針對可能出現的價格歧視、價格嚴重偏離價值等問題,要通過反不正當競爭、價格異動與風險預警等制度體系建設,對數據要素價格進行有效監管和合理調控。短期內,受制于數據交易市場活躍度和透明度的限制,不完全市
71、場下,數據價格的確定將仍然側重于供需方的意愿,難以形成有效的數據價格監督機制;未來,成熟市場中,可基于基礎價格、增值價值、異質性價值、風險溢價等各類市場因素建立科學統一的定價監測模型,為數據價格監管和調控提供科學規范的支撐。(三)流通規則尚不完善,有待鼓勵積極探索(三)流通規則尚不完善,有待鼓勵積極探索 1.問題分析 現有法律法規尚不完善,難以消除市場主體的合規顧慮。法律是合規的底線,網絡安全法數據安全法個人信息保護法等現有法律主要對數據的規范利用和安全隱私保護作出原則性規定,但并未就數據流通市場的準入、監管等給出清晰的法律界定。例如,數據安全法有規定“從事數據交易中介服務的機構提供服務,應當
72、要求數據提供方說明數據來源,審核交易雙方的身份,并留存審核、交易記錄”,但沒有涉及數據交易雙方在交易中的權利義務。在數據流通立法體系尚不完善、數據流通行為缺乏統一監管機制的情況下,面對強監管形勢,各類市場主體在探索數據流通的具體問題時缺乏合規風險評估依據,對責任判斷沒有穩定預期,對數據流通方案的實施存數據要素白皮書(2022 年)34 在諸多顧慮。配套規則體系仍不明確,數據要素流通缺乏有效的激勵和權益保護機制?,F階段,我國數據資源化、資產化等過程尚未完成,數據作為資產或商品直接進行流通的理論基礎不扎實,數據要素權屬界定、分類分級、估值定價、收益分配等方面缺乏系統框架,數據要素流通難以制定明確的
73、配套規則。在此情況下,激勵各方參與流通的體制機制尚不具備,保障參與各方權益的共識還未建立,參與方之間信任的建立缺乏規則的指引,使參與各方望而卻步。具體而言,在數據供給環節,數據供方常缺乏提供數據的意愿。除對合規風險的顧慮外,激勵機制的缺失也會導致數據供給不足。例如,公共數據開放過程中缺乏對數據進行整理、更新、持續運營的動力,將導致公共數據供給的數量不足、質量不高。事實上,有效的激勵機制有助于打造高質量數據供給,如貴州省氣象局將持有的氣象數據投入市場化運營,打造“氣象數據專區”作為省內氣象數據的統一出口,利用市場規則實現了交易額回流,保障了數據資源的權威性,形成推動高質量氣象數據流通的正反饋。在
74、供需對接環節,除權責利的界定與分配缺乏共識規約外,市場參與方之間還存在信任壁壘。供方擔心需方對數據的使用超出約定,需方擔心供方的數據來源不真實、不合規。無論是點對點模式下的供需雙方對接還是交易所模式下的市場準入都缺乏標準化的規則參考,現有的企業內部評估審核流程或數據交易機構的資格審核機制相對分散,往往局限于對企業經營情況的審核,而對供方企業的數據來源、數據要素白皮書(2022 年)35 供應形式及需方企業的數據用途等方面沒有具體的評估審核標準,參與方之間存在的信任壁壘難以打破。在需方應用環節,現有的數據流通過程和數據流通結果的審計監督機制薄弱。無論是點對點的直接流通還是通過數據交易機構進行的間
75、接流通,通過協議或合同建立的事前信任約束效用有限,一旦數據集交付或接口調用結束,數據提供方很難確認需求方是否按照協議約束對數據進行后續處理和應用。相關系統或平臺的日志記錄是現階段最主要的審計依據,但大多只用于統一的計費和清算,很難用日志記錄來核驗需求方的數據應用方式,數據流通后的結果只能依靠形式核驗,使得數據流通的事后審計監督不易實現,相關的信任與合規閉環仍然存在缺口。2.探索思路 面對市場主體的顧慮和規則體系的不完善,應以審慎包容的態度鼓勵各主體積極探索,加快研究制定監督管理和權益保障規則。一是建立容錯免責機制,劃定法律監管紅線。在數據基礎制度體系研究制定過程中,應先行劃定法律法規紅線,明確
76、合規監管底線,建立容錯免責機制,分類清理規范不適應數據要素流通發展需要的行政許可、資質資格等事項,為數據流通參與主體的探索提供穩定預期,進一步釋放各主體創新活力和內生動力。二是持續鼓勵并推進地方及行業的數據要素市場規則探索。當前各地正在圍繞數據要素市場建設開展先行先試。如,北京率先提出“財政補貼”方案,北京市朝陽區政府提出“對企業上年度數據交易總金數據要素白皮書(2022 年)36 額達到 500 萬元以上且企業上年度營業收入實現正增長的,按照年度實際數據交易總額的 10%給予補貼”。這是我國首個公開的由政府對于數據交易參與方進行直接補助的文件,探索通過經濟手段激發企業數據交易熱情。三是借鑒傳
77、統要素市場經驗,推動數據要素市場規則建設。數據要素的諸多特性使得難以照搬傳統要素市場的模式,但是通過分析各個要素市場的基本情況可以發現以下共性,它們都是激勵主體參與、維護市場秩序的重要因素:一是依托各類登記管理辦法,通過登記實現交易基礎和交易行為的認定;二是有 土地管理法 證券法 促進科技成果轉發法等明確的監管規則保障市場秩序;三是有交易磋商、資信評級、中介代理等配套的服務體系。上述經驗為探索數據要素登記、建立數據流通規則與監管體系、培育多元數據交易服務商提供了寶貴參考。四是逐步探索多層次的數據要素市場體系。除散點式探索外,推進數據要素市場建設還應結合傳統要素市場的發展思路和我國數據流通的發展
78、現狀,堅持場內外相結合的發展思路,結合數據流通的不同形態探索多層次的數據要素市場體系建設,分別建立各層市場的監督管理機制,更好發揮市場主體在各層市場中的作用。第一層是數據登記市場,實現數據資源歸集、權屬確認,要能做到一地登記,全國共享;第二層是數據產品市場,實現數據加工使用權的流通;第三層是數據衍生品市場,實現各類基于數據加工處理形成的數據商品、應用或服務的交易(如圖 8)。數據要素白皮書(2022 年)37 來源:中國信息通信研究院 圖 8 三級數據交易市場的初步設想(四)流通技術仍未成熟,有待強化技術支撐(四)流通技術仍未成熟,有待強化技術支撐 1.問題分析 數據在多主體間的安全流轉過程需
79、要恰當成熟的技術工具支撐。數據安全和隱私保護是數據流通的前提,流通的數據可能侵犯個人隱私,也可能減損企業的商業秘密和知識產權。由于數據可以低成本復制,屢發的數據泄漏、越權濫用等事件加劇了人們的不信任感,各主體均有對數據出域后失控的顧慮。因此,如何在保護數據安全和隱私的同時保證數據的可用性成為數據流通中的迫切需求。數據流通涉及諸多技術環節的協同,現階段數據安全流通技術體系尚未完全成熟。面對數據流通的多元模式,現有技術還不能完全滿足實際場景下的落地應用需求。如何實現在原始數據可見的形態下保證流通的數據不被復制、篡改,目前尚無可行的技術解。以數據脫敏、數據失真為代表的技術可以以較低成本隱藏敏感信息,
80、使得經過處理數據要素白皮書(2022 年)38 的數據無法識別特定自然人或秘密,且不能復原,從而可以將數據轉化為可以安全流通的形態。但這類技術會改變原始數據形態,導致大量數據信息損失,價值大幅降低。近年來,隱私計算技術和產業逐漸火熱,被視為解決數據要素流通難題的關鍵技術。這種技術是指在保證數據提供方不泄漏原始數據的前提下,對數據進行分析計算的一系列信息技術。通過對個人信息等敏感數據的加密保護和專門的通信和算法協議設計,隱私計算可以實現“原始數據不出域”,保障數據在流通與融合過程中的“可用不可見”,只實現數據價值的轉移,有效解決數據流通后潛在的失控問題。盡管隱私計算技術發展如火如荼,但它在性能、
81、安全和數據的互聯互通等方面仍然存在挑戰,較高的技術成本也讓眾多企業望而卻步,這些難題在一定程度上限制了隱私計算的推廣和應用。性能瓶頸阻礙隱私計算規?;瘧?。根據測試結果,國內隱私計算產品在特定場景下已基本具備可用性,但在面臨更多數據方、更大數據量、更復雜場景時,隱私計算需要極大的通信開銷和計算開銷,大多數企業難以承擔,因而性能等指標仍須繼續優化加強。安全合規挑戰影響市場信任。任何信息技術產品都沒有絕對的安全,算法協議安全和開發應用安全是隱私計算產品安全性的兩大挑戰。隱私計算中的聯邦學習技術路線雖然性能開銷相對較少,但將梯度等中間因子傳輸給其他參與方的過程中,存在從梯度信息反推出原始數據的可能,
82、導致原始數據存在泄漏風險??尚艌绦协h境技術路線依賴數據要素白皮書(2022 年)39 可信硬件,而高性能硬件主要依靠境外廠商提供,依賴境外進行遠程認證,給數據的安全可信帶來較大挑戰。而法律法規不會為技術細節背書,使用隱私計算無法完全規避安全合規風險?;ヂ摶ネū趬净蚴埂皵祿聧u”變“數據群島”。由于隱私計算底層技術和上層開發設計多樣復雜,不同技術產品間無法互認、互用,因而可能將“數據孤島”催生轉化為“數據群島”?,F階段,各技術廠商都在探索異構隱私計算互聯互通的實現,但尚未出現完全成熟的案例。2.探索思路 歷史經驗表明,技術往往可以為產業發展瓶頸帶來新的解決方案,甚至引發經濟社會的整體變革。以隱私
83、計算為代表的數據安全流通技術是數據要素市場建設破局的關鍵之一。面對現有技術體系尚不完全、技術應用成本較高、大規模落地艱難等問題,需要從技術融合互補、核心技術攻關、強化市場認知、技術合規監管四個方面協同推進,為構建完善的數據要素市場關鍵基礎設施提供有效支撐。一是推動多元前沿技術的融合互補。任何單一技術都不能一蹴而就地解決制約數據要素市場建設的所有問題,每項技術都只能針對性地解決數據要素市場建設過程中的某個具體問題,因而各項技術需要相互融合才能構成數據要素市場建設的有力支撐。例如,隱私計算與區塊鏈的結合已成為數據要素安全流通的一大探索方向。區塊鏈和隱私計算都融合了密碼學理論以增強安全。結合隱私計算
84、,區塊鏈可獲得數據保密能力,增強數據在鏈上全節點流轉過程中的安全性;借助數據要素白皮書(2022 年)40 區塊鏈,隱私計算的過程數據和關鍵計算環節等信息通過上鏈實現存證回溯,將有力提升隱私計算任務的可驗證性。因此,要鼓勵產學研合作,推動區塊鏈、隱私計算以及云計算、人工智能等技術的深度融合與協同。二是持續攻關核心技術。當前隱私計算仍在加速成熟,硬件加速在隱私計算性能提升方面正在發揮越來越關鍵的作用,軟硬件協同優化性能將提升技術可用性。分布式隱私計算逐漸應用,為解決隱私計算的瓶頸提供了優秀實踐。這些技術進展都為核心技術攻關奠定了基礎。從長期發展來看,跨技術路徑、跨系統平臺之間的隱私計算技術工具的
85、互聯互通將成為廣泛需求,要繼續推進互聯互通的實踐探索,不斷降低應用門檻。對于數據要素市場最理想的技術支撐方案,即同時保障數據可見、可用又可控的創新技術方案,需要鼓勵各界勇于探索和嘗試,以新技術、新模式牽引數據流通的新需求。三是強化技術應用的市場認知。支持企業開展數據流通技術應用實踐,收錄典型場景,形成技術應用指南和推廣示范案例。鼓勵企業搭建隱私計算等關鍵技術的開源框架,將更多的參與方吸引到數據要素關鍵技術的開發中,以開源帶動生態,以開源促進安全??梢劳袛祿灰讬C構,充分發揮區塊鏈、隱私計算等技術的獨特優勢,搭建數據權利登記認定平臺、數據流通合規監測平臺等,加強對數據流通渠道的溯源和監控。四是加
86、快完善技術合規監管體系。雖然監管層面逐步認可并鼓勵應用隱私計算,企業對于應用隱私計算是否能夠應對監管要求仍有疑數據要素白皮書(2022 年)41 問。需要出臺針對數據流通關鍵技術應用的具體指導意見和標準規范,為企業的技術實踐提供明確依據。同時,技術發展會隨著合規要求的不斷變化而動態演變。隨著攻擊手段和破解技術的不斷發展,合規要求將不斷更新,技術的發展也應隨之動態演變。四、數據要素發展展望“十三五”時期,我國深入實施數字經濟發展戰略,數據要素的價值獲得廣泛認識。但是,許多組織對數據應用的感知仍然模糊,覆蓋生產活動全流程、全產業鏈的數據鏈仍不完善,無法有效利用數據支持業務運轉、貫通和智慧化、智能化
87、決策,數據的價值潛力還沒有充分釋放。發揮數據作用是為了解決生產中的問題,提高生產效率,數據要素應作為新動能而不是目的本身。組織內部對于數據的業務應用、技術手段和管理方式如果還不完善,數據在發揮生產要素價值方面將既無需求也無能力。未來應牢牢抓住業務發展的核心問題,深入分析數據應用的具體路徑,持續推動數據要素在業務貫通、數智決策方面的價值釋放?!笆奈濉睍r期,我國數據要素市場體系將初步建立,數據作為生產要素的三次價值將全面發揮,推動研發、生產、流通、服務、消費全價值鏈協同。數據管理專業化程度將進一步加強,優質數據要素供給得到激活。數據確權、定價、交易將有序開展,數據要素可信流通的認可度與規模不斷擴
88、大。與數據要素價值和貢獻相適應的收益分配機制有望建立,市場主體創新創造活力將進一步釋放,最終形成全體人民共享數據要素發展紅利的新格局。在這一過程中,面對數據要數據要素白皮書(2022 年)42 素供給、應用、流通的重重障礙,我們期待政產學研各界加快創新突破,因勢利導促進數據要素全面健康發展。一是充分開展數據要素基本問題研究。當前仍有許多數據要素基本問題為數據要素相關理論和實踐框架帶來挑戰,例如,業界投入生產的數據有哪些具體形態,有哪些共性、規律和創新的方向;數據要素價值的產生機理究竟是怎樣的,獨特價值和潛在收益如何區分和衡量;數據要素相關的權責利究竟如何界定,培育安全有序高效的市場有何策略等。
89、要鼓勵各界的學術爭鳴,盡快澄清相關概念與機理,為難以達成共識的問題提出解決方案。二是推進數據要素應用與流通的創新探索。完善數據采集、數據質量、數據管理等標準體系,引導各組織機構逐步提高數據管理意識和能力,提升數據要素應用與流通的供給質量;以高價值公共數據為突破口,吸引和帶動更多商業數據與公共數據進行融合應用,發揮各行業央企、國企和龍頭企業的帶頭作用,形成一批具有行業特色的數據應用精品樣板,積極探索提升數據應用的廣度和深度,打造數據要素融合創新應用典范;建立健全數據要素法律制度體系,鼓勵大型央國企和互聯網平臺企業參與數據要素市場建設,培育多元市場主體,明確數據要素市場準入、監督和權益保障規則,規
90、范引導數據流通行為,營造審慎包容的探索氛圍。三是鼓勵數據要素相關技術研發創新。著眼數據要素生產、采集、存儲、加工、分析、安全保護各環節,持續推進自主可控技術工具研發,鼓勵人工智能、區塊鏈、隱私計算等前沿技術創新,盡快突破性數據要素白皮書(2022 年)43 能、安全、成本等瓶頸;提升各環節通用技術水平,鼓勵技術開源,提高相關技術工具的自動化、智能化水平,降低技術使用門檻;制定技術應用合規指引,在實際業務中依法依規應用、迭代新興技術,著重發揮技術在解決難題過程中的巨大作用?!昂`路藍縷,以啟山林”。各界對數據要素的探索剛剛起步,新事物、新經濟的發展不可能一帆風順。前路雖艱難,曙光也初現。黨的二十大
91、報告指出,要加快發展數字經濟,促進數字經濟和實體經濟深度融合,打造具有國際競爭力的數字產業集群。我們相信,在我國海量數據和豐富應用場景優勢的驅動下,更多的數據技術和應用創新將全面落地,數據采集、數據治理、數據流通、數據開發利用、數據安全保護等各方面將協同推進,數據要素規?;a業集群和規范化產業生態將逐步形成,數據要素的價值將得到充分挖掘和釋放,從而進一步促進數字經濟和實體經濟深度融合,助力數字經濟高質量可持續發展。數據要素白皮書(2022 年)44 參考文獻 1 國務院辦公廳.要素市場化配置綜合改革試點總體方案EB/OL.2021.http:/ 國 務 院.“十 四 五”數 字 經 濟 發 展
92、 規 劃 EB/OL.2021.http:/ 中共中央,國務院.關于加快建設全國統一大市場的意見EB/OL.2022.http:/ 國務院.關于加強數字政府建設的指導意見EB/OL.,2022.http:/ 中國信息通信研究院.大數據白皮書R.2021.6 隱私計算聯盟,中國信通院云大所.隱私計算白皮書(2021年)R.2021.7 華中師范大學信息管理學院,湖北省數據治理與智能決策研究中心.中國政府開放數據利用研究報告(2022)R.2022.8 復旦大學數字與移動治理實驗室.中國地方政府數據開放報告(2021 年度)R.2022.9 中國網絡空間研究院.中國互聯網發展報告(2021)R.2
93、021.10 中國電子信息行業聯合會,清華大學公共管理學院.中國政務數據治理發展報告(2021 年)R.2020.11 Rosenberg,Daniel.Data before the FactC/Raw Data Is an OxymoronA.Cambridge:MIT Press,2013.12 胡翌霖.什么是技術M.長沙:湖南科學技術出版社,2020.13 郭明軍,王建東,安小米等.政務數據與社會數據平臺化對接的數據要素白皮書(2022 年)45 演進歷程及政策啟示J.電子政務,2020(03):32-39.14 童楠楠,竇悅,劉釗因.中國特色數據要素產權制度體系構建研究J.電子政務,
94、2022(02):12-20.15 王超賢,張偉東,顏蒙.數據越多越好嗎對數據要素報酬性質的跨學科分析J.中國工業經濟,2022(07):46-66.16 張莉,卞靖.數據要素定價問題探析J.中國物價,2022(04):116-118.17 魏凱,閆樹,呂艾臨.數據要素市場化進展綜述J.信息通信技術與政策,2022(08):59-64.18 尹西明,林鎮陽,陳勁等.數據要素價值化生態系統建構與市場化配置機制研究J.科技進步與對策,2022,中國知網網絡首發.19 丁曉東.數據交易如何破局數據要素市場中的阿羅信息悖論與法律應對J.東方法學,2022(02):144-158.20 許可.數據交易流通的三元治理:技術、標準與法律J.吉首大學學報(社會科學版),2022(01):96-105.21 賈軒,白玉真,馬智華.隱私計算應用場景綜述J.信息通信技術與政策,2022(05):45-52.中國信息通信研究院 地址:北京市海淀區花園北路 52 號 郵編:100191 電話:010-62302928 傳真:010-62304980 網址: