中國信通院:大數據白皮書2022(56頁).pdf

編號:111726 PDF  DOCX 56頁 2.46MB 下載積分:VIP專享
下載報告請您先登錄!

中國信通院:大數據白皮書2022(56頁).pdf

1、No.202225 中國信息通信研究院 2023年1月 大數據大數據白皮書白皮書 (20222022 年年)版權聲明版權聲明本白皮書版權屬于中國信息通信研究院,并受法律保護。轉載、摘編或利用其它方式使用本白皮書文字或者觀點的,應注明“來源:中國信息通信研究院”。違反上述聲明者,本院將追究其相關法律責任。本白皮書版權屬于中國信息通信研究院,并受法律保護。轉載、摘編或利用其它方式使用本白皮書文字或者觀點的,應注明“來源:中國信息通信研究院”。違反上述聲明者,本院將追究其相關法律責任。前前 言言 中央全面深化改革委員會第二十六次會議指出,數據作為新型生產要素,是數字化、網絡化、智能化的基礎,已快速融

2、入生產、分配、流通、消費和社會服務管理等各個環節,深刻改變著生產方式、生活方式和社會治理方式。大數據是數據的集合,是圍繞數據形成的一套技術體系,并衍生出了豐富的產業生態,成為釋放數據價值的重要引擎。近一年來,從宏觀看,各國通過政策、法案、設立機構等方式,持續推進自身大數據戰略,我國黨中央、國務院圍繞數據要素市場建設、數據要素價值釋放密集提出一系列重要論斷、作出一系列戰略部署,進一步增強了我國大數據發展動能。從微觀看,數據存儲與計算、數據管理、數據流通、數據應用、數據安全五大核心領域均伴隨相關政策、技術、產業、應用的不斷演進,發展目標進一步明確和豐富,發展成效不斷顯現。本白皮書是中國信通院自 2

3、014 年以來第七次發布的大數據白皮書。本白皮書聚焦過去一年來大數據領域不斷涌現的新技術、新模式、新業態,分析總結全球和我國大數據發展的總體態勢,并重點針對數據存儲與計算、數據管理、數據流通、數據應用、數據安全五大核心領域,逐一分析、探討其發展現狀、特征、問題和趨勢,最后對我國大數據未來發展進行展望與研判。希望本白皮書為社會各界深入了解大數據領域提供有價值的參考。目目 錄錄 一、大數據發展總體態勢.1(一)各國深化推進自身大數據戰略.1(二)我國大數據發展態勢好動力足.2(三)五大核心領域發展方向進一步明確.5 二、數據存儲與計算:通過深度優化實現提質增效.7(一)數據存儲與計算發展歷久彌新.

4、8(二)當前數據存儲與計算發展呈現三大特點.10(三)數據存儲與計算面臨的主要挑戰與發展趨勢.13 三、數據管理:在政策引領下規?;涞?15(一)政策驅動行業實踐日益成熟.16(二)當前數據管理發展呈現四大特點.18(三)數據管理面臨的主要挑戰與發展趨勢.21 四、數據流通:流通規范體系加速構建.23(一)數據流通發展重心向“規范化”轉移.23(二)當前數據流通發展呈現四大特點.24(三)數據流通面臨的主要挑戰與發展趨勢.28 五、數據應用:積極探索數據深層價值的釋放路徑.30(一)數據應用開始探索第三階段實踐路徑.31(二)當前數據應用發展呈現三大特點.33(三)數據應用面臨的主要挑戰與發

5、展趨勢.36 六、數據安全:強需求牽引產業生態飛速發展.38(一)數據安全發展基礎不斷夯實.38(二)當前數據安全發展呈現三大特點.40(三)數據安全面臨的主要挑戰與發展趨勢.44 七、總結與展望.46 參考文獻.48 圖圖 目目 錄錄 圖 1 大數據產業五大核心領域.6 圖 2 數據存儲與計算領域技術發展歷程.9 圖 3 2020-2022 年 DCMM 參評企業數量增速.17 圖 4 數據管理組織架構示意圖.19 圖 5 數據應用向基層滲透.35 圖 6 數據分類分級“七步走”方法論圖示.43 表表 目目 錄錄 表 1 近一年內國家層面推動大數據產業的代表性政策.4 表 2 五大核心領域發

6、展現狀和新形勢下的發展方向.7 表 3 2022 年數據流通規則建設相關政策清單.25 表 4 數據應用三個階段.31 表 5 典型數據應用方法論匯總.32 表 6 多個行業的企業數字化運營成熟度情況.34 表 7 近幾年數據分類分級相關規范.43 大數據白皮書(2022 年)1 一、大數據發展總體態勢 2022 年,全球大數據技術產業與應用創新不斷邁向新高度。宏觀看,國際方面,美歐、韓日、澳洲通過政策、法案、設立機構等形式,持續深化實施自身大數據戰略。國內方面,黨中央、國務院再次做出一系列重要部署,我國大數據領域良好的發展態勢進一步鞏固。微觀看,數據存儲與計算、數據管理、數據流通、數據應用、

7、數據安全五大核心領域發展成效不斷顯現。本章將對國內外大數據領域的最新進展進行總體敘述。(一)各國深化推進自身大數據戰略(一)各國深化推進自身大數據戰略 近一年來,美歐、韓日、澳洲通過政策、法案、設立機構等形式,持續深化推進自身大數據戰略。美歐發布法案,確保數據價值在隱私保護的前提下釋放。美國眾議院和參議院于2022年6月發布了美國數據隱私和保護法案討論稿,該法案在制度設計上既考慮了增強個人數據權利的國際趨勢,又包含數據價值釋放的內容。法案并未禁止一般個人數據處理活動,而是為個人提供了“選擇退出”方式,以促進對個人數據的合理利用。歐洲議會于2022年4月就歐盟數據治理法案進行最終投票表決,并獲得

8、議會批準。該法案是落實歐洲數據戰略的重要舉措,構建了三個適用于各個行業的數據共享機制,確保在符合歐洲公共利益和數據提供者合法權益的條件下,實現數據更廣泛的國際共享。法案構建了適用于所有部門的數據使用權基本規則,將促進個人和企業自愿大數據白皮書(2022 年)2 共享數據,并統一某些公共部門數據的使用條件。韓日設置專門機構,推進各行業數字化轉型。韓國在2022年4月成立了以國務總理作為委員長的“國家數據政策委員會”,作為國家數據和新產業政策的管理機構,并于9月召開了韓國國家數據政策委員會的第一次會議,發表了對8個數據領域、5個新產業領域、共計13個領域的改善計劃,目標是在韓國打造全球頂級水平的數

9、字力量。2021年9月,日本政府成立數字廳,成為負責日本行政數字化的最高部門,旨在構建更完善的數字政府,推動數字化轉型,目標為“用智能手機在60秒內完成所有行政程序”,最大程度利用數字技術優勢,將數字科技作為全新要素融入傳統社會,促進經濟社會形態積極轉型。澳洲發布國家數據安全戰略,開始構建國家數據安全框架。2022年4月,澳大利亞內政部頒布國家數據安全行動計劃,其為澳大利亞首個國家數據安全行動計劃,意味著澳大利亞的國家數據安全框架正式開始構建。行動計劃致力于建立一個全國性的方法來保護公民數據,保護公民的數據(收集、處理和存儲在數字系統和網絡上的信息)免受侵害,同時為政府、企業和個人構建數據安全

10、要求。(二)我國大數據發展態勢好動力足(二)我國大數據發展態勢好動力足 我國大數據經過多年高速發展,不斷取得重要突破,呈現良好發展態勢。一是產業規模高速增長,2021 年,我國大數據產業規模增加到 1.3 萬億元,復合增長率超過 30%1;二是創新能力不斷增強,2021 1 國家互聯網信息辦公室數字中國發展報告(2021 年),2022 年 7 月 大數據白皮書(2022 年)3 年我國發表大數據領域論文量占全球 31%2,大數據相關專利受理總數占全球超 50%,均位居第一3;三是生態體系持續優化,2021 年我國大數據市場主體總量超 18 萬家4,一批大數據龍頭企業快速崛起,初步形成了大企業

11、引領、中小企業協同、創新企業不斷涌現的發展格局;四是市場前景廣受認可,我國大數據領域投融資金額多年來總體呈現上升趨勢,2021 年大數據相關企業獲投總金額超過 800 億元5,再創歷史新高。近一年,我國在政策、人才、資金等方面持續加碼,為大數據后續發展注入強勁動力。政策方面,中央、地方發布一系列支持文件,對大數據產業、數字技術、數據要素市場、數據安全等方面進行了重點部署。中央層面,2021 年底,“十四五”大數據產業發展規劃的出臺明確了未來五年大數據產業發展工作的行動綱領。2022 年,黨中央、國務院先后通過要素市場化配置綜合改革試點總體方案、關于加快建設全國統一大市場的意見、關于構建數據基礎

12、制度更好發揮數據要素作用的意見等文件,多次強調了釋放數據要素價值對于我國發展的必要性、緊迫性,為我國大數據發展提供了良好的政策環境和明確的發展目標。地方層面,31 個?。▍^、市)均通過發布大數據專題規劃、數字經濟總體規劃等形式,明確了各地大數據技術、產業、應用的發展路線圖、時間表,凸顯出各地在大數據布局方面的積極性。2 中國信通院根據 Web of Science 數據庫收錄的 SCI 論文數據統計得到。3 中國信通院根據 Inspiro 知識產權數據庫的數據統計得到。4 中國信通院根據企查查相關數據統計得到。5 中國信通院根據公開監測、獲取到的企業信息,結合企業介紹、主營業務及服務介紹及相關

13、其他信息,進行篩選和分類得到。大數據白皮書(2022 年)4 表 1 近一年內國家層面推動大數據產業的代表性政策 時間時間 文件文件 內容內容 2021.11 工信部“十四五”大數據產業發展規劃 提出“到 2025 年底,大數據產業測算規模突破 3 萬億元”的增長目標,以及數據要素價值體系、現代化大數據產業體系建設等新目標 2022.1 國務院 要素市場化配置綜合改革試點總體方案 提出拓展規范化數據開發利用場景,發揮領軍企業和行業組織作用,推動人工智能、區塊鏈、車聯網、物聯網等領域數據采集標準化。加強數據安全保護,強化網絡安全等級保護要求,推動完善數據分級分類安全保護制度,運用技術手段構建數據

14、安全風險防控體系。2022.4 中共中央 國務院 關于加快建設全國統一大市場的意見 提出加快培育數據要素市場,建立健全數據安全、權利保護、跨境傳輸管理、交易流通、開放共享、安全認證等基礎制度和標準規范,深入開展數據資源調查,推動數據資源開發利用。2022.12 中央全面深化改革委員會第二十六次會議,審議通過關于構建數據基礎制度更好發揮數據要素作用的意見 習近平總書記強調“數據基礎制度建設事關國家發展和安全大局,要維護國家數據安全,保護個人信息和商業秘密,促進數據高效流通使用、賦能實體經濟,統籌推進數據產權、流通交易、收益分配、安全治理,加快構建數據基礎制度體系”來源:中國信息通信研究院 人才方

15、面,過半“雙一流”高校設立大數據相關專業,多省份積極開展人才培育專項行動,人才供給能力顯著增強。高校教育方面,147所“雙一流”高校中有87所已開設了大數據專業,占比達到59%6,根據上海軟科統計,大數據專業熱度已經超過軟件工程等傳統熱門專業。各省積極開展大數據人才培育專項行動,例如廣東實施“十萬”產業數字化符合性人才培訓行動,上海要求各級黨校(行政學院)要增加大數據與城市數字化轉型的培訓內容,浙江圍繞數字人才制定“高精尖缺”人才目錄,江蘇搭建“智改數轉”人才智庫平臺,福建明確要求縣級以上地方人民政府制訂大數據人才發展計劃。6 中國信通院根據教育部普通高等學校本科專業備案和審批結果進行統計獲得

16、 大數據白皮書(2022 年)5 資金方面,多省份通過設立專項資金或采取稅收優惠政策等方式,對大數據企業、應用進行定向扶持和培育。例如,寧夏對于區內符合標準的優質大數據企業給予最高 300 萬的資金支持,山東、黑龍江等省份要求省內縣級以上人民政府每年需統籌安排資金專項扶持大數據相關企業,浙江、廣東、重慶等推出一系列圍繞大數據企業的稅收減免政策,江蘇省每年在省級財政安排 12 億元專項資金支持工業企業“智改數轉”,貴州、遼寧、河北、云南等省份對建設成果顯著的大數據應用項目補貼 1000-3000 萬。(三)五大核心領域發展方向進一步明確(三)五大核心領域發展方向進一步明確 經過多年技術和產業的發

17、展,大數據領域內部逐漸細化,形成數據存儲與計算、數據管理、數據流通、數據應用、數據安全五大核心領域。如圖 1 所示,數據源通過數據存儲與計算實現壓縮存儲和初步加工,通過數據管理提升質量,通過數據流通配置給其它相關主體,通過數據應用直接釋放價值,并由數據安全技術進行全過程的安全保障。這五大核心領域由于發展起步時間不同、應用需求緊迫程度不同等原因,發展模式存在差異。在當前數據成為生產要素并快速融入生產、分配、流通、消費等各環節的新形勢下,大數據五大核心領域的發展方向均進一步明確。大數據白皮書(2022 年)6 來源:中國信息通信研究院 圖 1 大數據產業五大核心領域 數據存儲與計算領域:實現海量數

18、據的高效存儲與計算。本領域發展時間長,在數據規模增長、形態變化等新需求持續推動下,逐步演化出數據庫、大數據平臺、實時計算等成熟技術框架。當前,數據存儲與計算領域已經能夠支撐 PB 級海量數據的高效存儲和準實時計算,發展方向聚焦為在持續提升能力基礎上,通過精細化運營和技術升級實現“降本提質”。數據管理領域:實現數據質量提升、管理高效。本領域屬于投入周期長、見效慢的“下水道”型工作。當前,部分企業數據管理需求強、資源足,已將數據管理的技術和規則率先落地,但大部分企業數據管理仍處于起步階段。數據管理的發展方向聚焦為盡快借助政策紅利和智能技術帶來的改變,促進各行業大規模實現全域數據管理。數據流通領域:

19、實現數據在不同主體間合理配置,使局部數據互大數據白皮書(2022 年)7 相彌合,實現數據價值倍增。本領域需求旺盛、發展時間短,當前已初步探索出機構與機構間點對點的流通路徑,但數據權屬、定價、市場規則等關鍵性問題仍有待破解。為助力數據要素高效配置,數據流通的發展方向聚焦為通過建設基礎制度、創新流通技術,實現數據流通過程中安全與效率的平衡,從而構建全社會范圍數據規范化流通。數據應用領域:實現數據為企業業務經營過程賦能。本領域雖然發展時間長,但受限于數據管理等前序工作成熟度不夠,目前僅部分核心業務被數據淺度賦能。為釋放數據要素深度價值,數據應用的發展方向聚焦為通過變革業務模式、優化相關技術,使數據

20、應用與全域業務深度融合。數據安全領域:確保數據處于有效保護和合法利用的狀態,以及具備保障持續安全狀態的能力。特別是近兩年數據安全一些法律法規發布后,本領域得到快速發展,各行業在數據外規內化、風險治理等方面推進步伐明顯加快。當前,數據安全的發展方向進一步聚焦為兼顧安全與效率,從而實現安全左移的自動化與風險治理的智能化。表 2 五大核心領域發展現狀和新形勢下的發展方向 發展現狀發展現狀 新形式下的發展新形式下的發展方向方向 數據數據存儲與計算存儲與計算 實現了海量數據的高效存儲、計算 降低運維成本,提升處理效率 數據管理數據管理 頭部行業實現關鍵數據的管理 各行業均實現全域數據管理 數據流通數據流

21、通 點對點間流通路徑完成初步探索 全社會范圍規范化流通 數據應用數據應用 支撐核心業務分析和頂層決策 以無感形式嵌入全域業務 數據安全數據安全 推進外規內化與風險治理 安全左移的智能化治理 來源:中國信息通信研究院 二、數據存儲與計算:通過深度優化實現提質增效 數據存儲與計算提供海量數據的高壓縮比存儲和高效計算等基大數據白皮書(2022 年)8 礎能力,以數據庫、數據倉庫、數據湖等為其技術表現形態。其發展歷程長、產業成熟度相對較高,目前在數據要素等新需求牽引下,正呈現出穩中有進的發展態勢。本章將介紹數據存儲與計算領域的發展歷程、當前現狀、主要特征和趨勢展望。(一)數據存儲與計算發展歷久彌新(一

22、)數據存儲與計算發展歷久彌新 1960 年信息時代開啟后,用于存儲、計算少量結構化數據的關系型數據庫、數據倉庫誕生,Oracle、DB2、Teradata 等商業化產品逐漸成熟。2000 年互聯網興起后,結構化數據的規模迅速膨脹、非結構化數據開始涌現,傳統關系型數據庫、數據倉庫能力出現瓶頸,以Apache Hadoop 為代表的分布式存儲計算框架成為新的技術潮流,Cloudera、Hontonworks 等數家商業化公司紛紛成立,大數據時代正式來臨。2010 年移動互聯網逐漸普及后,實時推薦、即時決策需求對海量數據處理的實時性提出更高要求,同時視頻、音頻、圖片等非結構化數據占比大幅提升,Sto

23、rm、Flink 等流處理框架受到關注,數據湖技術也開始迅速產品化。圖 2 對數據存儲與計算領域的技術發展歷程進行了簡要總結。大數據白皮書(2022 年)9 來源:中國信息通信研究院 圖 2 數據存儲與計算領域技術發展歷程 技術方面,經過 60 余年發展,數據存儲與計算領域總體技術框架趨于成熟,進入深度優化階段。數據存儲與計算領域已經形成了以分布式數據庫、數據倉庫、批處理平臺、流處理平臺為代表的總體技術框架,并廣泛應用,已能夠支撐具有高并發、低延遲數據處理分析需求的極端場景。例如在“雙十一”場景中,大量營銷、交易風控等自動決策被嵌入業務流程,形成了復雜的數據處理分析鏈路。在技術能力已相對成熟的

24、基礎上,以云化、湖倉一體為代表的深度優化理念不斷涌現,并逐步應用,為數據存儲與計算領域進一步降本提質提供了新范式。產業方面,全球疫情加速了數字化轉型進程,數據存儲與計算領域的產業發展前景持續向好。國際方面,國際云數據倉庫巨頭Snowflake 2022 年第三季度營收與去年同期相比上漲 67%,達到 5.5億美元;國內方面,2021 上半年我國大數據平臺市場規模達 54.2 億大數據白皮書(2022 年)10 元,同比增長 43.5%7;2021 年我國數據庫市場規模預計達 305.78 億元,同比增長 26.93%8。同時我國大數據基礎軟件第一股星環科技于2022 年 10 月成功上市科創板

25、。數據存儲與計算領域市場增長趨勢和行業預期持續向好。建設運維方面,數據存儲與計算建設持續深入,安全穩定運行成為關注焦點。隨著數字化轉型的開啟,工商銀行、建設銀行、農業銀行等頭部金融機構,電信、移動、聯通等運營商,大型互聯網公司以及諸多行業頭部企業均在數年前完成數據存儲與計算總體框架建設。近年來,隨著數據規模增多、價值提升,數據存儲與計算技術平臺逐漸復雜,運維使用時的穩定性保障和安全防護成為難題。2022 年,Google、Twitter 等公司的數據存儲與計算技術平臺均發生故障,同時,全球范圍內也發生多起針對數據存儲與計算技術平臺的惡性攻擊,相應安全事件帶來的損失也不斷增高。(二)當前數據存儲

26、與計算發展呈現三大特點(二)當前數據存儲與計算發展呈現三大特點 1.云化改造全面加速 數據存儲與計算技術持續與云融合,資源利用率進一步提升。隨著云計算的發展,數據存儲與計算技術逐漸從私有部署轉化為云上部署,初期體現為部署模式的不同,但伴隨著云原生理念的興起,云原生數據存儲與計算產品開始成為產業變革浪潮。利用云原生理念,數據存儲與計算一方面實現存儲、計算、調度、安全、分析等模塊的進 7 來源:IDC 咨詢 8 來源:中國信息通信研究院數據庫發展研究報告(2021 年),2021 年 7 月 大數據白皮書(2022 年)11 一步解耦,各模塊與容器等底層資源單元相適配,實現彈性擴縮容,從而使得資源

27、利用率提升 30%40%;另一方面實現應用接口函數化,即利用 Serverless 的理念,將更多如統計、機器學習、流程處理等能力封裝成函數接口,實現更細粒度的按需使用和付費,在提升 23 倍發布效率的同時,有效降低成本。近年來,華為、騰訊云、阿里云、百度、星環等國內主流大數據企業均推出云原生數據湖、云原生數據平臺等產品。2022 年阿里云首款 Serverless 數據庫產品 RDS MySQL Serverless 正式商業化,PingCAP 在 HTAP Summit 上宣布 TiDB Cloud Serverless Tier BETA 版正式發布。2.融合一體化持續加深 批流一體、湖

28、倉一體、HTAP(Hybrid Transaction Analytical Processing,混合事務與分析處理)等融合架構不斷降低運維成本。隨著數字化轉型的深入,企業通常會針對不同的業務場景、不同的數據模型搭建不同的平臺系統,帶來了數據冗余、數據一致性差、資源配置難、系統復雜等問題,極大增加了運維的壓力與成本。為解決上述問題,數據存儲與計算領域各技術產品轉向融合架構成為趨勢,例如將批處理技術與流處理技術融合的批流一體技術框架、打通數據倉庫和數據湖技術的湖倉一體技術框架以及同時具備在線事務處理及分析的混合事務分析處理技術。建立融合架構后,統一的接口層、計算層、存儲層、資源調度層實現了對海

29、量數據的統一管理和集群服務的統一運維,大幅降低了運維綜合成本。國內外廠商紛紛提出自己的融合架構解決方案。例如,近年來海外廠商 Databricks 同戴爾推出 Data 大數據白皮書(2022 年)12 LakeHouse、亞馬遜推出智能湖倉架構,2022 年國內廠商巨杉數據庫推出 SequoiaDB、阿里云推出 MaxCompute 湖倉一體方案、星環科技推出星環湖倉一體 V2.0 等。數據中間件技術為計算層與異構存儲層搭建橋梁,提升整體運行效率,進一步加速數據平臺融合一體化。在存算分離后,存儲層為滿足不同類型數據存儲的需求,文件存儲、對象存儲、表存儲等多種異構存儲引擎同時存在。計算層和異構

30、存儲引擎之間的連通復雜度越來越高,數據中間件技術應運而生,其通過內置兼容接口和加速技術,助力計算層與異構存儲層高速互聯。例如開源的 Alluxio 向上對接Spark、Presto、Hive、TensorFlow 等計算應用,向下對接阿里云 OSS對象存儲、AWS S3 存儲、HDFS 等不同存儲,可提升 I/O 效率 200%以上;ShardingSphere 將多類異構數據庫 MySQL、PostgreSQL、Oracle、SQL Server、openGauss 等包裝為統一數據庫訪問接口,從而方便多種編程語言直接訪問多類異構數據庫。3.安全能力快速補強 數據存儲與計算面臨著新型安全挑戰

31、,內生安全正成為傳統防護的重要補充。一是隨著自身規模不斷龐大,數據存儲與計算技術平臺的邊界不斷延伸,網絡安全防護體系隨之指數級膨脹,容易出現盲點、漏點;二是伴隨數據開發利用的深化,數據存儲與計算技術平臺中的關鍵數據與其他系統將進行高頻的互聯互通,安全和效率難以均衡;三是數據存儲與計算技術平臺的技術組件 60%以上基于開源技術,容易遭遇“0day”攻擊;四是數據存儲與計算技術平臺中數據集中存儲,大數據白皮書(2022 年)13 但操作人員類型多、數量多、變更多,操作頻次高,存在數據泄露風險。2022 年 1 月,美國交通運輸業商業信用報告機構 TransCredit 因配置錯誤致使數據庫無密碼保

32、護,共計涉及 50 萬人財務數據的 60 多萬條信用記錄泄露;2022 年 6 月,土耳其飛馬航空公司因其 AWS 云存儲桶未受保護,發生總計約 6.5TB 的數據泄露,其中包含敏感的飛行數據;2022 年 10 月,跨國集團湯森路透因配置錯誤導致存有 3TB敏感數據的 Elasticsearch 數據庫發生泄漏。近年來頻發的數據泄漏事件,使得全密態執行環境、敏感數據自動識別、高效數據加解密、細粒度的權限控制、零信任等內生安全技術在數據存儲與計算技術產品中的應用不斷增加,與傳統網絡安全防護相輔相成。近一年,華為云、阿里云相繼推出全密態數據庫,星環科技 TDH、阿里云 Dataworks 紛紛加

33、入敏感數據識別能力,亞馬遜 RDS 增加內置防火墻。(三)數據存儲與計算面臨的主要挑戰與發展趨勢(三)數據存儲與計算面臨的主要挑戰與發展趨勢 經過半世紀的發展,數據存儲與計算領域總體技術框架基本成熟,產業穩步發展,為上層各類數據應用誕生提供了堅實基礎。但隨著數字化轉型從頭部行業向傳統行業延伸、數據的生產要素屬性不斷凸顯,數據存儲與計算領域也迎來新的挑戰。一是數據存儲與計算技術平臺建設運營成本仍需控制。數據存儲與計算技術平臺規模體量大、建設周期長、前期投入高,但投資回報率卻相對較低。隨著疫情以來經濟大環境發生變化,企業需要更加理性、務實的開展數據存儲與計算技術平臺建設,從實際收益的角度進行評估論

34、證和精細化運營,同時數據存儲與計算技術也應從降低運維使用成本等方面優化提升。二是促大數據白皮書(2022 年)14 進數據要素市場化的數據存儲與計算技術創新仍需加強。隨著數據成為生產要素,數據的潛在價值愈發受到重視,但當前數據要素市場建設面臨數據權屬、定價、安全保護等難點問題,這其中的一些問題是否能通過數據存儲與計算相關技術得到解決或加以規避,正在成為擺在數據存儲與計算領域發展過程中的關鍵命題。未來,數據存儲與計算領域呈現以下三點趨勢。一是技術和管理雙管齊下,探索數據存儲與計算技術平臺精細化運營之路。據 Wikibon 研究,全球范圍內企業數據存儲與計算技術平臺的平均投資回報率僅為 55%,4

35、6%的企業數據存儲與計算技術平臺未達到預期價值。投資回報率低成為制約數據存儲與計算技術平臺滲透率進一步提升的重要因素,產業正嘗試從技術和管理兩方面探索精細化運營之路。技術方面,核心計算、存儲等模塊嘗試與 AI 結合,通過智能資源調度、智能數據分層存儲等,實現精細化運營;管理方面,探索公司內部成本分攤方式,從而避免業務部門無成本觀念式使用數據存儲與計算技術平臺,例如技術部門向業務部門售賣資源模式、按業務部門使用量計費模式等。二是數據編織(Data Fabric)、全密態數據庫等新理念新技術不斷成熟,為數據的要素價值釋放提供更強力的技術底座。數據要素市場形成涉及數據權屬、定價、安全保護等一系列問題

36、,傳統數據存儲與計算技術重點關注計算、存儲效率,未解決數據要素市場面臨的問題。隨著數據規模和數據關系復雜度的增加、數據權屬問題的復雜化,傳統集中式數據管理模式無法滿足需求,出現了 Data Fabric 這一概大數據白皮書(2022 年)15 念。Data Fabric 基于主動型元數據、增強數據目錄、數據虛擬化等技術,形成了一套分布式、自動化、智能化的新型數據管理形式,當前IBM 已經推出了相關解決方案。全密態數據庫使數據在傳輸、計算以及存儲的各個環節始終都處于密文狀態,從而解決數據全生命周期的隱私保護問題,提供數據要素安全保護的能力,目前阿里云、華為均已推出相關產品。三是我國數據存儲與計算

37、領域技術和產品將逐步走向海外市場。我國數據存儲與計算領域產業經過多年發展,在部分技術領域的供給能力已經達到國際一流水平。當前,以東南亞為代表的新興數字經濟市場規模正在快速增長,數據存儲與計算技術平臺的建設需求十分旺盛。根據谷歌、淡馬錫和貝恩公司發布的2021 年東南亞數字經濟調查報告 顯示,東南亞數字經濟產業將在五年內實現翻倍增長,在2026年達到 3600 億美元。在這一背景下,二十大報告中提出“發展數字貿易”,商務部、中央網信辦、工信部聯合印發數字經濟對外投資合作工作指引,推動我國在數字經濟領域逐漸形成對外開放新格局。當前,我國數據存儲與計算領域的部分企業已開始走向海外市場,阿里巴巴、騰訊

38、等企業已經開始借助自身全球云計算網絡基礎,PingCAP、OceanBase 等企業借助開源優勢,助力其數據庫、大數據產品突破日本、印尼等海外市場。三、數據管理:在政策引領下規?;涞?數據管理通過規范數據采集、加工、使用過程,在企業釋放數據價值的過程中扮演了“承上啟下”的關鍵角色,是企業豐富數據應用、大數據白皮書(2022 年)16 參與數據要素流通的前序基礎。由于數據管理屬于投入多、見效較慢的基礎性工作,前期僅資源充足的數字原生企業對于數據管理工作的推進速度較快。近年來,在政策支持下,各領域企業的數據管理意識和能力不斷增強,越來越多的企業開始從頂層統籌規劃數據管理工作,我國數據管理能力建設

39、呈現大規模落地態勢。本章將介紹數據管理領域的發展歷程、當前現狀、主要特征和趨勢展望。(一)政策驅動行業實踐日益成熟(一)政策驅動行業實踐日益成熟 各領域政策為數據管理落地注入強勁動能。通信領域,工業和信息化部于 2021 年 11 月發布了 “十四五”信息通信行業發展規劃,提出加強數據資源管理,探索建立數據應用處理、數據產品標準化、數據確權、數據定價、數據交易信任、數據開放利用全流程的數據資源管理制度體系。制造業領域,工業和信息化部于 2021 年 11 月印發了“十四五”信息化和工業化深度融合發展規劃,提出強化大數據在制造業各環節應用,制定制造業數字化轉型行動計劃,以制造業數字化轉型為引領,

40、培育專業化、場景化大數據解決方案。金融領域,央行于 2022 年 1 月發布了金融科技發展規劃(2022-2025 年),要求全面加強數據能力建設。銀保監會于同期發布了關于銀行保險業數字化轉型的指導意見,提出健全數據治理體系,增強數據管理能力,加強數據質量控制,提高數據應用能力。其他領域,交通運輸部于 2021 年 10 月印發數字交通“十四五”發展規劃,農業農村部于 2022 年 8 月發布農業現代化示范區數字化建設指南,提出加大數據治理力度,完善數據質量管控,推動數字交通、數字鄉村等大數據白皮書(2022 年)17 領域發展。行業、地方大力推動 DCMM 貫標評估,通過“以評促建”的方式提

41、升數據管理能力。工業和信息化部信息技術發展司組織協調全國信息技術標準化技術委員會(TC28)于 2014 年開始了我國數據管理國家標準研制工作,于 2018 年發布了數據管理能力成熟度評估模型(Data management capability maturity assessment model,簡稱DCMM),從組織、制度、技術、人員等方面綜合評價企業數據管理水平。DCMM 評估自 2020 年啟動,河北、天津、無錫等 20 余省市相繼發布針對性支持政策,推動 DCMM 參評企業數量持續增長,截至目前已累計完成近千家企業的評估,參評企業分布于全國各地,企業類型覆蓋軟件和信息技術服務業、制造

42、業、銀行業、電力業、通信業等多個行業。2021 年參評企業增速為 88.7%,2022 年參評企業增速為 152.9%,兩年獲證企業數量平均增速達到了 120.8%。來源:中國信息通信研究院 圖 3 2020-2022 年 DCMM 參評企業數量增速 頭部企業數據管理工作已經進入深水期,但大部分企業仍處于數大數據白皮書(2022 年)18 據管理初期。中國電子信息行業聯合會 DCMM 評估統計結果顯示,現階段通信業、銀行業、電力業數據管理能力相對領先,逐漸邁入深水區,以上 3 個行業 DCMM 評分普遍在 3 級以上,通信業 4 級占比超過了 60%,銀行業 3 級占比接近 70%,電力業 3

43、 級和 4 級累計占比達到 85%。軟件和信息技術業、制造業數據管理能力相對薄弱,以上兩個行業集中于 2 級和 3 級,同時 2 級比例遠高于 3 級,其中軟件和信息技術業的 2 級占比是 3 級 2 倍以上,累計占比達到 97%,制造業的 2 級占比接近 3 級的 5 倍,累計占比達到 98%。(二)當前數據管理發展呈現四大特點(二)當前數據管理發展呈現四大特點 頭部企業數據管理起步較早,數據管理能力相對成熟,管理方法和模式對于發展初期的企業具有良好的參考價值。宏觀管理層面,成立了專門數據管理團隊,發布獨立數據戰略規劃,提升數據管理專業性;微觀執行層面,強化數據供給能力,全面提高數據質量水平

44、,依托統一數據管理平臺,提高數據管理效率。1.通過成立專職團隊增強數據管理執行效率 為推動數據管理有效開展,越來越多的企業成立統一數據管理歸口部門,形成了決策、管理、執行的數據管理三層架構組織,并設置了專門的數據管理崗位,建立了數據部門、技術部門和業務部門協同機制。例如,中國移動成立 IT 管委會統籌數據管理制度、標準、流程,信息技術中心牽頭全網各域數據治理和平臺建設,并加掛大數據中心負責大數據管理和運營,與各業務部門及省專單位數據“管、建、戰”協同。中國聯通在集團成立了數字化轉型部門,統籌負責數據管大數據白皮書(2022 年)19 理工作,在網絡域、管理域、客戶域的業務部門、市場部、分子公司

45、指定了數據管理對接人,由聯通軟研院承擔數據管理技術平臺開發和運維工作。工商銀行在金融科技委員會下設數據治理委員會作為決策層,數據管理部/信息管理部作為管理層,大數據中心/軟件開發中心提供技術支持,核心業務部門負責數據采集和數據應用,負責執行具體數據管理工作。來源:中國信息通信研究院 圖 4 數據管理組織架構示意圖 2.通過發布獨立規劃推動數據管理精準開展 在企業紛紛發布數字化轉型整體戰略基礎上,為精準提升數據管理工作的質量和效率,越來越多的企業發布了獨立的數據管理戰略規劃,從而確立數據管理工作的中長期目標和管理活動優先級,明確需要的資源投入總量和資源分配機制,指導數據管理團隊的工作有效執行。例

46、如中國電信集團 2021 年發布了中國電信數據治理體系化推進工作指引,旨在結合“云改數轉”數字化轉型整體思路推動數據管理工作體系化開展,指導集團下各單位從數據模型管理、數據質量管理、數據安全管理、數據共享等方面推進數據治理工作高效開展。大數據白皮書(2022 年)20 3.通過開展專項行動進一步提升數據供給質量 良好的數據供給能力是數據分析挖掘的基礎,在工業物聯網、工業互聯網、邊緣計算等技術快速發展的背景下,企業業務線上化加速、數據規模爆炸性增長,如何保障數據質量水平、增強數據可信可用成為了數據管理的關鍵一步。以南方電網為例,數據量從“十三五”初期的 220TB 提升至 2.4PB,數據采集范

47、圍拓展至競爭性業務、金融業務等板塊,關鍵運行數據采集頻率提升超過 60 倍。在數據源頭快速變化的背景下,南方電網在常態化數據質量治理的基礎上開展數據質量提升專項,短時間內、集中資源力量打通數據質量工作的難點、堵點,在主配網數據治理領域,形成配網數據問題識別規則 14 項,累計識別并整改 2100 余萬條數據質量問題,全網各單位變電站輪廓坐標、桿塔坐標準確率達到 99%。4.通過統一技術平臺消除數據管理協同難點 早期,各企業針對數據管理中的各項工作,逐步建設了數據標準管理平臺、數據質量管理平臺、數據架構管理平臺、元數據管理平臺、主數據管理平臺等單一功能型技術工具,這些技術工具通常獨立存在,使得數

48、據管理各項活動間銜接性較差,例如數據標準難以應用于數據模型、數據質量難以從源頭把控等,導致管理資源的冗余和浪費。隨著統一數據管理平臺的成熟,其將各單一功能型技術工具進行集成,構建了數據管理工作的“一站式”技術平臺,對于統籌數據管理工作、提高數據管理效率的作用日益突出。例如中國移動構建了元數據驅動的統一數據治理平臺,全面拉通異構跨地域跨平臺的元數據,統一支大數據白皮書(2022 年)21 撐數據管理、開發、運營、運維人員的數據治理工作,實現數據一點可看、可控、可管。國網大數據中心基于統一數據管理技術平臺,實現總部及 27 家?。ㄊ校┕?PB 級數據的統一管理,有效加快電網整體數字化轉型升級。(

49、三)數據管理面臨的主要挑戰與發展趨勢(三)數據管理面臨的主要挑戰與發展趨勢 目前企業在數據管理方面仍然面臨三點挑戰。一是數據的業務價值不顯著,數據管理內驅動力不足。推動業務創新和發展是數據價值的最終目標,由于企業缺乏對數據產生業務價值進行度量的體系,導致企業決策層、管理層和業務部門難以對數據價值有效感知,進一步降低了企業持續開展數據管理的動力。二是數據、IT 和業務仍存在割裂,組織架構亟需變革調整。盡管越來越多的企業成立專門的數據管理團隊,但是尚未明確數據管理團隊與 IT 團隊、業務團隊的協作機制,導致數據管理與企業信息化建設和業務發展脫節,阻礙了數據管理成果在企業系統和業務場景的落地。三是數

50、據管理人才缺失,數據管理推進后勁不足。由于數據管理是一個新興領域,有別于傳統的數據庫和計算機領域,需要的是具備管理能力、技術能力和業務能力的復合型人才,因此面臨較大缺口。未來,數據管理領域呈現以下三點趨勢。一是首席數據官(Chief Data Officer,CDO)制度將助力企業全面開展數據管理。CDO 是有效管理和運用企業數據資源、充分挖掘數據價值、驅動業務創新和轉型變革的企業負責人,負責為公司制定一個明確的數字化戰略,確保相關舉措都獲得資源分配,并通過衡量數大數據白皮書(2022 年)22 字項目投資回報率的方式,提高客戶參與度和忠誠度,推動企業形成數據管理良性閉環。事實上,在過去的幾年

51、里,國外已有包括通用電氣、富國銀行在內的眾多企業設置了 CDO 崗位,全面推動企業數字化轉型。國內廣東省于 2022 年在政府工作報告重點任務分工方案明確提出,要“出臺企業首席數據官建設指南”,鼓勵具備條件的企業在決策層設立 CDO,按照“企業主導、政府推動、價值優先、多方協同”的建設原則組織實施。二是數據研發運營一體化(DataOps)將有效提升數據管理協同效率。隨著數據應用場景日益豐富帶來數據分析需求快速變化,數據工程師、數據管理員、報表開發人員、運維工程師在內的各類數據管理角色逐漸增多,導致企業各類數據交付任務難度大大增加。DataOps旨在打破數據管理各環節之間的割裂,將數據質量達標率

52、、數據標準落標率、數據架構符合度、數據安全滿足度等指標作為數據設計、開發和測試的要求,優化數據生產者和數據消費者協作效率,并通過標準化大數據組件,構建一體化平臺打通數據設計、開發、測試和運維各環節,實現編寫代碼、生產部署、調度監控全過程線上化,引入可視化編排、CI/CD 等技術降低數據研發技術門檻,推動敏態數據研發,提高數據運維質量。三是提高智能化程度將成為降低數據管理成本的關鍵。通過利用AI、ML、RPA、語義分析、可視化等技術,自動識別或匹配數據規則(包括數據標準規則、數據質量規則、數據安全規則等),自動執行數據規則校驗,自動發現數據之間的關聯關系,并以可視化的方式展大數據白皮書(2022

53、 年)23 現。此外,利用 VR、AR、3D 可視化等技術,幫助數據使用者探索數據和挖掘數據,提升數據應用的趣味性,降低數據使用門檻。四、數據流通:流通規范體系加速構建 數據流通是指以數據或數據中蘊含的價值(信息內容)作為對象,按照一定規則從數據提供方傳遞到數據需求方的過程,即數據資源先后被不同主體獲取、掌握或利用的過程。在數據要素市場建設的背景下,數據流通領域受到了空前的關注,各方均在積極探索參與數據流通,進而實現充分釋放數據要素價值的目標。本章將介紹數據流通領域的發展歷程、當前現狀、主要特征和趨勢展望。(一)數據流通發展重心向“規范化”轉移(一)數據流通發展重心向“規范化”轉移 數據流通是

54、釋放數據要素價值的關鍵一環。一方面,數據具有外部性,即同一組數據可以在不同的維度上產生不同的價值和效用。借助數據流通數據可以在不同的數據接受者一方與自有數據匯聚,不斷開拓使用維度,數據價值也將在社會面層層放大。另一方面,數據存在分布不均衡的問題,企業采集的數據通常具有較強的行業屬性,特征不夠全面,同時中小型企業收集的數據樣本量較少,難以支撐業務。數據流通為利用數據的外部性,解決數據分布不均衡的問題,充分釋放數據要素價值提供了有效手段。數據流通隨商業信息分析需求增強而日益旺盛,合規性逐漸引起關注。1841 年,鄧白氏集團(D&B)率先將各種商業信息收集匯聚,構建信用評定的數據指標體系,“數據服務

55、商”的雛形初現。2000 年左右,隨著互聯網領域的迅速發展,企業對于數據的采集與流通需求大數據白皮書(2022 年)24 進一步增強,例如谷歌就借助了 AdSense 獲取大量用戶行為數據用于優化其廣告投放效率并以此獲利,這也帶動了后來廣告營銷場景的大量數據流通活動。2008 年,隨著 Infochimps、Factual、DataSift、Datahub、Acxiom 等一批知名專業數據服務商相繼涌現,現代意義上的數據流通正式形成。在這一時期,原始數據直接流通成為數據流通的主要形式,商業形態也較為原始粗放,有較高的合規風險。2014 年后,貴陽、上海等為代表的一批具備官方背景的數據交易所成立

56、,銀行等金融機構開始大量引入外部數據,數據流通需求廣泛提升,API 接口調用的數據流通形式逐漸增多。與此同時,數據流通的合規性逐漸成為業界的關注點。制度創新和技術創新雙輪驅動數據流通行業實現“規范化發展”。制度創新方面,2022 年 6 月 22 日中央深改委第二十六次會議強調“要促進數據高效流通使用、賦能實體經濟,統籌推進數據產權、流通交易、收益分配、安全治理,加快構建數據基礎制度體系”,為我國數據流通產業發展提供了重要思路。技術創新方面,以隱私計算為代表的數據流通技術提供了“數據可用不可見”、“數據可控可計量”的數據服務新范式,在保障數據安全前提下實現了數據流通效果,從而為需求方企業安全地

57、獲取和利用外部數據提供了技術可能。(二)當前數據流通發展呈現四大特點(二)當前數據流通發展呈現四大特點 1.數據流通規則逐漸清晰 由于數據流通存在技術依賴、非標準化的特點,面向多元數據主體和多樣數據流轉形態,參與流通的供需雙方需要科學、可靠且共識大數據白皮書(2022 年)25 的規則體系,才能建立信任?,F階段,從政策指引到應用實踐,各方均在積極探索建立健全數據流通規則。在政策指引方面,2022 年內發布的一系列政策文件(如表 3)中均提出了建立數據流通規則的相關內容。在實踐探索方面,各地方、各行業、各類市場主體也在實踐過程中積極探索數據流通配套規則。例如,貴陽大數據交易所于 2022年 5

58、月發布一系列數據交易規則,為交易主體權責劃分提供依據,并依據規則為數據產品、數據商、第三方數據服務中介機構等提供登記憑證,以確認數據和主體具備進入市場交易的條件,探索解決市場主體互信難的問題。表 3 2022 年數據流通規則建設相關政策清單 時間時間 文件文件 內容內容 2022.01 國務院 要素市場化配置綜合改革試點總體方案 探索“原始數據不出域、數據可用不可見”的交易范式,在保護個人隱私和確保數據安全的前提下,分級分類、分步有序推動部分領域數據流通應用。探索建立數據用途和用量控制制度,實現數據使用“可控可計量”。規范培育數據交易市場主體,發展數據資產評估、登記結算、交易撮合、爭議仲裁等市

59、場運營體系,穩妥探索開展數據資產化服務。2022.04 國務院 中共中央國務院關于加快建設全國統一大市場的意見 加快培育數據要素市場,建立健全數據安全、權利保護、跨境傳輸管理、交易流通、開放共享、安全認證等基礎制度和標準規范,深入開展數據資源調查,推動數據資源開發利用。2022.12 中央深改委 關于構建數據基礎制度更好發揮數據要素作用的意見 要建立合規高效的數據要素流通和交易制度,完善數據全流程合規和監管規則體系,建設規范的數據交易市場。來源:中國信息通信研究院 2.流通參與熱情高漲,供需對接向多行業擴展 隨著數字化轉型的不斷深入和智能化水平的不斷攀升,企業參與大數據白皮書(2022 年)2

60、6 數據流通的熱情空前高漲,數據流通的供需方從金融、互聯網持續向其他行業擴展。金融、互聯網行業的流通實踐不斷深化。金融行業中,風險控制要求極為嚴格,各大金融機構以雄厚的資金實力做支撐,早已成為數據要素市場的主要參與者?;ヂ摼W行業中,許多頭部企業已對外提供眾多數據接口或數據產品,以滿足中小互聯網企業或其他行業研發應用、精準營銷、智能服務等需求。調研顯示,當前金融機構及大型互聯網企業普遍建立了統一的部門或團隊管理外部數據,頭部企業每年的外部數據采購額已經達到了億級規模。根據推算,僅銀行及互聯網金融行業的外部數據采購額即可突破百億規模。其他各類傳統行業也在不斷探索參與數據流通。工業領域中,數字化轉型

61、剛剛起步,還需經歷產線內數據聯動、工廠內數據協同、企業內數據共享、企業間數據流通等多階段探索。目前,國家工業互聯網大數據交易平臺已處于內部測試階段,著力解決工業企業數據流通的難點,促進工業數據要素市場發展。此外,政務、氣象、交通、醫療等行業和場景的數據需求也逐步顯現,相應公共數據的開放或企業數據的供給獲得更廣泛的關注。3.安全流通技術重要性凸顯 在合規要求日趨收緊的背景下,能夠提供合規前提下充分挖掘數據價值、促進數據流通的各類技術解決方案受到了業內的廣泛關注。數據脫敏與數據合成技術主要作用于數據流通的輸入階段,能夠有效降低原始數據中包含的隱私信息泄露風險。當前,脫敏技術從基大數據白皮書(202

62、2 年)27 于 SQL 腳本的人工脫敏,自動化、流程化的平臺脫敏,逐漸走向了應用機器學習等技術的智能化數據脫敏階段。但是,目前該技術仍面臨降低數據價值、無法明確是否滿足法律要求以及無法有效防止數據復制和篡改等問題。數據合成技術仍處于初級探索階段。在應用實踐方面,醫療、金融、通信領域的相關企業如 Illumina、J.P.Morgan、Telefonica 等都引入了數據合成技術試圖解決數據隱私問題。隱私計算作用在數據流通的輸入、計算、輸出階段,實現了全流程的數據“可用不可見”、“可控可計量”?,F階段,隱私計算已成為最有希望解決數據安全流通問題的關鍵技術。全球知名咨詢機構Gartner 已連續

63、兩年將隱私計算(其稱隱私增強計算)列為了重要戰略科技趨勢。根據中國信通院調研顯示,自 2018 年以來,包括綜合科技、大數據、金融科技、人工智能、區塊鏈、云服務、信息安全等類型的企業紛紛入局隱私計算賽道,累計孵化出 100 余款產品,廣泛應用于金融、通信、互聯網、醫療、政務等領域。區塊鏈為數據流通中的驗證、追溯、審計提供了有效保障。將區塊鏈與其他各類數據安全流通技術相結合,能夠為數據溯源、交易存證、數據侵權舉證等數據市場化等問題提供可行的解決方案,實現數據流通全流程可驗證、可追溯、可審計,并為進一步建設高效、高安全和高流動性的數據要素市場打下基礎。4.數據流通產品形態逐漸向個性化定制方向轉變

64、隨著各行業企業逐漸對業務進行數智化升級和改造,數據應用的場景不斷豐富,數據流通市場逐漸從“以數據產品為主”向市場驅動大數據白皮書(2022 年)28 的“以數據需求為主”轉變。數據提供方趨向以數據需求作為入口與市場和用戶接觸,根據需方企業的個性化需求提供針對性更強的解決方案,反向帶動數據流通的活力。以最早掛牌新三板的數據源服務提供商數據堂為例,其商業模式可以概括為兩個方面,一是大數據交易平臺,二是面向 B 端客戶提供定制化數據源服務。再如科創信息、百融云創、神州泰岳等我國大數據服務領域的頭部上市企業,無一不是通過提供定制化服務快速占領細分領域市場,根據現實場景構建適合企業自身的大數據體系。(三

65、)數據流通面臨的主要挑戰與發展趨勢(三)數據流通面臨的主要挑戰與發展趨勢 當前,數據流通尚未充分激活,主要原因在于我國數據要素市場培育的基礎還不扎實,在數據流通相關的權利關系、價格機制、行為規則、技術支撐等方面仍存在諸多障礙,使得數據的供給和需求都存在一定障礙。一是數據權屬界定的場景與問題復雜,對于參與數據流通的主體權利關系,理論、制度和產業實踐層面均尚未形成共識。二是數據的估值定價尚缺乏科學、標準的評價方法,傳統的估值定價方法很難完全適用于數據流通的特點。三是數據流通的準入、競爭等行為約束沒有清晰的法律界定,配套的激勵和監管規則也不完善,相關市場主體顧慮很多、動力不足。四是隱私計算等數據流通

66、關鍵技術應用還不成熟,數據安全流通的技術方案仍需持續探索。因此,對于參與數據流通的企業而言,需重點關注兩大問題。一方面,如何穩定本企業的數據供應鏈。外部數據如何持續、穩定地被獲取,如何不斷提升數據的質量,如何管理好引入的外部數據,成為大數據白皮書(2022 年)29 企業在數據流通中關注的重點。中國信通院云大所構建的外部數據源評估標準和外部數據管理標準,就試圖為這一領域提供值得借鑒的經驗。另一方面,如何深刻地參與到國家數據要素市場建設之中。數據如何對外提供,需要滿足哪些責、權、利方面的程序,如何更高效、更低成本地參與到統一大市場中的數據流通環節,成為企業面臨的新命題。未來,數據流通領域呈現以下

67、三點趨勢。一是公共數據開放帶動數據流通供給?!耙愿邇r值公共數據為突破口,強化政府的引領作用,帶動商業數據供給”已成為解決數據供給不充足,激活市場主體內在動力的最為緊迫的任務之一。近年來各地方政府在政務數據開放平臺建設方面積極推進,取得了良好成效。未來,針對已有的公共數據開放,應明確公共數據開放規則,建立公共數據開放的社會需求受理渠道,基于公共數據開發利用清單,結合應用需求建立公共數據開放動態調整機制,推動公共數據有序開放。針對各地正在積極推進的非個人數據授權運營,應在規范的基礎上持續創新,一是加快規則建設,二是鼓勵市場主體參與,三是強化數據安全保障。此外,還需持續探索創新思路,推動公共數據產品

68、通過數據交易場所掛牌上市,探索公共數據資產登記,創新公共數據供給形式等。二是場景化的技術分級框架將促進數據安全流通實踐落地。各類安全流通技術的使用往往會帶來數據應用價值的損失。一般來說,隨著數據可控程度的提升,數據應用價值的損失也會進一步增大,兩者大數據白皮書(2022 年)30 之間難以兼顧。在數據流通過程中,各應用場景對應的參與方信任程度不同、數據類型不同,這造成了其需要達到的數據可控程度也是不同的。一味的追求高安全水平可能會造成數據流通價值無法達到預期,降低了各主體的參與積極性。在未來的數據流通實踐中,參與主體也應結合實際業務需求,基于場景選取適當分級條件下的技術方案,實現數據可控程度和

69、數據流通價值的最大化。三是可信流通體系將為數據有序流通提供條件??尚帕魍w系旨在為有序的數據流通提供信任,全面提高數據可信、可用、可流通、可追溯水平。近幾年,以數據為主要驅動的行業,特別是金融和互聯網行業的頭部企業,都在構建自己的可信流通生態圈。一方面,根據業務需求劃定數據供方,確保數據源的合法合規、持續供應、安全可靠;另一方面,提升數據引入后的應用管理水平,通過構建組織架構、明確各部門職責要求、建立和實施系統化制度、流程和工具等方式,全面統籌外部數據的需求和使用。未來階段,企業與行業間的可信流通生態需要融合打通,形成規范的可信流通體系,重塑數據流通規則、重組數據流通資源,重建數據流通渠道,在

70、提高數據流通效率的同時實現對數據流通全流程的動態可控。五、數據應用:積極探索數據深層價值的釋放路徑 數據應用通過建立數據與業務的高效銜接,實現數據最終賦能業務。數據應用決定了數據對業務的賦能效果,是數據價值釋放的“最后一公里”。若數據應用不充分,將反向影響企業對數據存儲與計算、數據管理等其他數據工作的整體投入信心。雖然數據應用早已存在于大數據白皮書(2022 年)31 人類社會的各項活動中,但由于技術能力不足、前序工作未就緒等因素限制,傳統數據應用主要針對的是少量、局部、非實時數據,依賴大量人工決策,導致數據主要釋放其淺層價值。當前,國內外各方正積極探索新的數據應用方法論,并在不同行業、不同場

71、景進行滾動式實踐,從而釋放數據深層價值,目前已取得初步進展。本章將詳細介紹數據應用領域的發展歷程、當前現狀、主要特征和趨勢展望。(一)數據應用開始探索第三階段實踐路徑(一)數據應用開始探索第三階段實踐路徑 數據應用發展已有 60 余年,總體分為三階段。數據應用是利用數據對各項事務進行探索、分析、洞察并最終推動決策的過程,其是數據價值釋放的最終一環。在各企事業單位中,數據應用是否充分,直接決定各企事業單位對于數據相關工作的整體投資性價比,進而反向影響對數據存儲與計算、數據治理、數據安全等環節的投入程度。雖然數據應用早已存在于人類社會的各項活動中,但隨著數據本身形態、數據處理技術、產業發展環境、數

72、據應用需求等的不斷演化升級,數據應用內涵和模式不斷豐富,總體可分為三個階段。各階段特征如下所示。表 4 數據應用三個階段 第一階段第一階段(1960s 開始)開始)第二階段第二階段(1990s 開始)開始)第三階段第三階段(2015s 開始)開始)數據源數據源 業務系統數據庫 數據倉庫 數據湖+外部數據 數據與業務關系數據與業務關系 隨機、離散 常態化、體系化、外掛式 全域、敏捷、嵌入式 分析方法分析方法 圖表統計 BI 分析 BI+AI 對決策的影響對決策的影響 輔助決策 增強決策 自動決策 來源:中國信息通信研究院 大數據白皮書(2022 年)32 由于信息化的發展成熟,數據應用第二階段是

73、當前主流形態。信息化催生了數據應用的第一階段,各企業利用 Excel 等工具,進行小數據量、隨機的、專題問題的分析。伴隨各企業信息化成熟,第二階段是當前數據應用的主流,即財務、人力、業務增長等關鍵領域信息,以固定周期、通過 BI 圖表可視化的方式,將其現狀和趨勢呈現給關鍵決策層,再通過人工完成決策。例如招商銀行 BI 分析平臺自 2020年上線,儀表盤數量超過 3 萬,覆蓋零售、信貸、風控、運營等核心業務,累計任務執行次數超 600 萬次,協助完成 44 家分行業務工作,業務滲透率達 80%。第三階段進入萌芽期,實踐經驗正在快速沉淀。隨著現代化企業間競爭加劇,以及數據來源增多、體量變大,數據存

74、儲與計算逐漸升級等環境因素變化,頭部企業開始率先探索第三階段實踐路徑,例如互聯網、金融、電信、制造等行業領域的龍頭企業,在營銷、風控、經營分析等核心業務中,開展從組織架構、數據存儲與計算到商業模式的全方位探索,并取得一定成功經驗。例如某頭部銀行圍繞數據打造風控體系,放款周期從數天降低到秒級,同時壞賬率下降超過 30%。根據中國信通院 2022 年企業數字營銷評估結果,已有約 30%的企業實現了自動決策能力。同時,近年來國內外頭部研究機構已開始針對邁入第三階段的企業實踐過程,總結梳理相關實踐方法論,從而為后期企業大面積邁入第三階段構建理論基礎。表 5 典型數據應用方法論匯總 方法論名稱方法論名稱

75、 提出方提出方 主要內容主要內容 適用范圍和局限性適用范圍和局限性 跨行業數據挖跨行業數據挖掘標準過程掘標準過程 CRISP-DM聯盟 總結了數據挖掘的標準工作流程,包括商業理適用于指導數據挖掘具體工作的展開,由大數據白皮書(2022 年)33 CRISP-DM 解、數據理解、數據準備、建模、評價、部署等環節 于提出時間較早,并未涉及新的分析技術 數據科學能力數據科學能力成熟度模型成熟度模型 DSMM Oracle 全面總結了數據科學的方法論,包括戰略、人員角色、協同合作、實施方法、數據探索、數據獲取、流程規范、資產管理、工具、成果部署等方面 適用于指導企業組件數據科學團隊,開展數據科學相關工

76、作。并未涉及如何確定數據應用的具體目標,以及如何提升其它團隊的數據能力 決策智能模型決策智能模型 Gartner 重構了決策的各個環節,即觀測、調研、建模、優化、執行等。并給出了相應環節的實施方法和具體案例 適用于指導專業的數據分析、數據科學團隊以及決策層系統性地優化決策流程,缺乏實踐的驗證 分析優勢模型分析優勢模型 GAAM Gartner 梳理了分析的各個階段,即描述、診斷、預測、規范性分析。并給出了各階段所需具備的能力 適用于指導專業數據分析團隊發現并解決具體問題。不涉及組織、流程等方面 數據驅動型企數據驅動型企業的七大特征業的七大特征 McKinsey 描述了建設數據驅動型企業的 7

77、個主要方向,包括數據支撐決策的能力、數據實時性、數據存儲及管理方式、數據相關崗位職能等 側重點是幫助企業構建數據能力,對于數據應用最核心的問題,即如何使用數據支撐決策的相關敘述較為籠統 成為數據驅動成為數據驅動型組織的分步型組織的分步指南指南 Tableau Blueprint Tableau 從組織架構、人員、技術、流程等方面說明了企業分析決策體系的建設方法 主要以 Tableau 的 BI產品為示例,且沒有涉及具體的分析類型 來源:中國信息通信研究院(二)當前數據應用發展呈現三大特點(二)當前數據應用發展呈現三大特點 1.從應用方向看,面向個人消費者領域的應用相對領先 針對每個用戶進行精細

78、化運營是企業競爭力躍遷的必要手段。個人消費端用戶量大,導致精細化運營資源成本高,而數據應用可以有大數據白皮書(2022 年)34 效助力個人消費端的精細化運營,所以面向個人消費端的領域數據應用水平普遍較高。如表 6 所示,根據神策研究院發布的 2022 中國企業數字化運營成熟度報告,泛零售、金融、互聯網的數據應用綜合評分排名前三。全球跨境電商企業希音通過將消費側和生產側進行業務數據實時互通從而搭建敏捷供應鏈系統,從開發、生產、倉儲、物流等各環節進行全鏈路的數據應用商業模式改造,快速響應消費市場需求。目前,希音從下單、生產到倉庫驗收最快可在 7 天內完成,庫存率也遠低于行業平均水平。表 6 多個

79、行業的企業數字化運營成熟度情況 泛零售泛零售 金融金融 互聯網互聯網 企業服務企業服務 其他行業其他行業 樣本數量 N 58 68 88 60 41 數據驅動綜合指數 46.2 43.8 43 32.1 34.3 數字洞察能力 15.3 15.1 13.8 10.9 11.8 數據決策能力 8.4 8.5 8.6 5.7 6.1 數字運營能力 11.5 10 9.1 7.5 7.9 提升優化能力 11 10.3 11.4 8 8.5 來源:神策研究院 2.從服務對象看,正在從決策層向基層業務人員延伸 由于數據分析工作的專業性和復雜性,傳統數據應用依托專業的數據分析工具以及數據分析師等,主要以大

80、屏、報表、領導駕駛艙等形式,用于企業高層或戰略、財務等進行周期性的大決策。這種模式決策效率低、線條粗,無法精細指導基層人員的業務執行方式。隨著市場變化逐漸加速,數據應用在固定的分析邏輯和報表基礎上,向個性化、多樣化轉變,伴隨自助式分析工具的成熟,數據應用門檻不斷降低,業務終端小決策中的數據應用滲透率也在不斷提高,數據應用在企業中的兩級模式正在不斷形成。例如某省運營商大數據平臺直接大數據白皮書(2022 年)35 支撐社區網格運營人員,在 2021 年實現 5.3 億次拓客營銷、提供 2486萬條任務商機等。來源:中國信息通信研究院 圖 5 數據應用向基層滲透 3.從價值導向看,以人為本和可持續

81、發展的定位日益明確 隨著數據應用對各行業的經營模式進行革新和升級,也出現了大數據殺熟、個人信息泄露、數字鴻溝等問題。為構建數據應用的可持續發展秩序,監管部門迅速出臺相關措施,多管齊下強化數據應用價值導向監管。一是加強個人信息保護。個人信息保護法征信業務管理辦法等政策法規相繼出臺,持續細化個人數據在國內金融、電信、互聯網領域的應用規范。二是明確界定大數據殺熟行為。國務院反壟斷委員會制定發布反壟斷指南對大數據殺熟行為做出明確界定,規制企業價格歧視和差別待遇等損害消費者權益行為。三是建立大數據算法治理體系。中央網信辦等四部門聯合發布互聯網信息服務算法推薦管理規定,全面搭建算法治理機制,強化信息服務領

82、大數據白皮書(2022 年)36 域算法推薦活動治理。四是倡導提升數字素養。為降低城市與鄉村數字發展鴻溝,提升全民數字素養與技能行動綱要數字鄉村發展行動計劃(2022-2025 年)等文件多次提出并強調提升全民數字素養,倡導大數據企業在青少年數字倫理教育、大數據應用適老化等方面持續發力。(三)數據應用面臨的主要挑戰與發展趨勢(三)數據應用面臨的主要挑戰與發展趨勢 從全行業發展角度看,數據應用仍面臨四大挑戰:一是數據管理等前序工作難就緒。數據應用對數據管理等前序工作具有強依賴性,但由于企業治理工作待完善,造成業務側難以進行數據的二次加工利用。二是組織架構不符合新需要。數據應用需要多部門共同協作,

83、傳統組織架構責權分工過于明確,存在業務對接盲區,不符合數據應用新業務模式發展需要。三是復合型人才緊缺。數據應用需要兼具業務理解和科技能力的數字化復合人才,人才門檻高,隨著數據應用持續深入業務,人才緊缺已成為制約數據應用效能提升的最主要因素。四是技術工具適配度不足。供給側標準化技術工具不能適應不同企業實際情況,甚至倒逼企業開展定制化業務改造,導致企業開發工作負擔過重,業務人員也存在上手難等問題。未來,數據應用呈現以下四點趨勢。一是自動決策將成為數據應用的主要形態。當前,一方面伴隨業務的精細化運營需求,傳統人工決策效率瓶頸逐步顯現,且成本居高不下;另一方面,隨著數據源增多、模型精細度提高、數據應用

84、技術工具優化,數據應用的能力不斷提高,所以數據應用正快速從感知、大數據白皮書(2022 年)37 診斷向研判智能決策延伸。以金融風控業務為例,傳統風控主要依靠專家經驗,通過客戶信息、央行征信數據以及公司內部資料進行簡單規則觸發和人工審核;而智能風控當前則是結合了更多的第三方數據和線上線下多維數據及行為特征數據,通過復雜模型和策略體系完成自動化分析,極少觸發人工復核。二是企業組織架構以數據應用為中心加速演進。數據應用需要業務、技術、數據管理等多部門共同協作,但是部門間對數據應用的溝通理解存在明顯偏差。為配合數據應用新業務模式開展需要,部分企業嘗試調整組織架構以配合數據應用。一方面高層領導牽頭總體

85、工作。據金融業數字化轉型發展報告(2020-2021)調研,34.78%的金融機構由最高領導牽頭數據應用的總體管理決策,自上而下加大數據應用實施力度。另一方面引入業務伙伴(Business Partner)模式助力應用協作。為業務部門配置技術和數據人員,進行點對點業務對接,提供技術和數據的專業化決策與長期運營支撐。三是咨詢、技術、代運營一體型數據應用服務形態將崛起。在數據應用層面,技術工具僅僅能夠快速進行數據采集、處理及策略觸達等,要充分釋放數據價值,則需要業務人員具有優質策略產出及運營等能力。目前大部分應用側企業缺乏運營及策略能力,因而在其采購技術工具的同時需要配套的咨詢服務,以及一段時間的

86、代運營服務,從而助力其數據應用落地。以零售行業為例,業內應用側企業對實時效果要求較高,在選購技術工具時會更在意通過怎樣的策略與技術產品的結合能立即推動業務增長。因此,有較強咨詢能力和代運營的供大數據白皮書(2022 年)38 給側企業將更能獲得應用側企業的青睞。四是低代碼數據分析工具將助推數據應用平民化進程加速。我國各行業企業發展水平差異較大、業務屬性不同,隨著數據應用的持續推廣,企業在業務層面延伸出越來越多的個性化、敏捷化的產品需求,但是傳統的 SaaS 服務難以滿足。此外,數據應用要求業務人員參與到數據建模與運營過程中,因此標準化的技術工具必須考慮如何降低其使用門檻以便用戶操作使用。當前國

87、內大多數應用服務商陸續推出低代碼技術工具,試圖通過模塊封裝、可視化建模、自動化建模等方式讓用戶快速地、直觀地完成應用程序的組裝和配置,有效降低了數據應用門檻。六、數據安全:強需求牽引產業生態飛速發展 2021 年數據安全法 個人信息保護法頒布以來,數據安全監管要求逐漸落地,國家、行業、地方相繼頒布了一批數據安全方面的配套性政策文件,數據安全體系建設進程明顯提速,數據安全供應能力不斷增強,數據安全產業生態各方面都呈現快速發展態勢。本章將從 2022 年度數據安全建設熱點入手,梳理數據安全建設現狀,探討下一步發展趨勢。(一)數據安全發展基礎不斷夯實(一)數據安全發展基礎不斷夯實 數據安全法律政策逐

88、步細化,政策環境不斷完善。國家層面,逐漸明晰的監管紅線,為企業數據安全建設提供政策引領。2022 年 7 月,中央網信辦公布數據出境安全評估辦法,為各行業企業規范數據出境活動、保護個人信息權益提出了更加具體的要求和措施,翻開了大數據白皮書(2022 年)39 數據出境安全管理的新篇章。行業方面,工信部于 2022 年 12 月印發工業和信息化領域數據安全管理辦法(試行),明確了本領域數據安全監管范圍和監管職責,提出了對包括重要和核心數據在內的管理要求,是對工業和信息化領域數據安全管理工作的進一步指導。地方層面,河南省、江西省、重慶市等省市紛紛出臺數據條例,明確數據安全責任義務和管理監督措施等內

89、容,規范各地方數據安全建設工作。數據安全技術產品持續變革,產業發展動力愈發強勁。隨著 5G、物聯網、云計算等數字技術的快速發展,數據形式更加靈活多樣,傳統數據安全防護邊界被顛覆,新技術應運而生。根據 IDC 發布的 IDC TechScape:中國數據安全發展路線圖,2022,零信任之數據安全、AI 賦能數據安全、數據風險管理、數據安全基礎設施管理平臺等 9 項變革性數據安全技術將重塑數據安全市場,創造新的市場機會、新的技術公司以及新的用戶需求。數據安全意識及能力逐漸提升,數據安全建設工作逐步啟動。隨著企業數字化轉型的逐漸深入,各行業企業的數據安全意識有效提升,數據安全能力建設不斷突破。據中國

90、信通院調研,企業在開展數據安全培訓、參與數據安全評估、部署數據安全技術產品等方面需求旺盛。目前已有聯通數科、電信云、中移信息、百度、螞蟻等 40 余家企業完成數據安全治理能力評估工作,旨在通過“以評促建”方式對標監管要求,梳理建設現狀,推動企業數據安全建設工作的開展。同時,供應側受市場需求引導,奇安信、衛士通等企業也全面開展了數據安大數據白皮書(2022 年)40 全相關產品及服務的研究布局,根據中國信通院數據安全推進計劃發布的數據安全產品與服務圖譜(2.0),目前共有 116 家企業、488款產品與服務收錄其中。(二)當前數據安全發展呈現三大特點(二)當前數據安全發展呈現三大特點 1.全面布

91、局成為需求側建設重心 有效的數據安全治理是企業利用數據賦能業務的重要前提,但傳統的離散式、補丁式的數據安全策略已不能適應當前敏捷化、動態化的業務創新。企業數據安全能力建設重心,也開始從單點技術部署走向廣范圍、細粒度、一體化的全面布局,圍繞組織架構、制度流程、技術工具、人員能力構建“閉環”數據安全體系。金融、電信、互聯網等行業作為數據密集型行業,是產生數據、使用數據最頻繁、場景最豐富的領域,其數據安全已成為企業保障業務發展的內生需求。這些行業企業基于不斷細化的法規政策,已開展較為體系化數據安全建設。組織架構方面,工行、建行、移動、聯通、電信、百度、螞蟻等頭部企業已經確立了由數據管理部、信息安全管

92、理部或數據安全部等部門牽頭管理協調全企業內部的數據安全工作,一方面向上對接相應委員會,細化工作內容,另一方面向下對接各業務部門,制定管理要求。制度流程方面,基本建立了自上而下的多層級數據安全管理制度體系,通過一級數據安全管理制度明確原則要求,再通過二級、三級等管理規范的逐級細化,形成可落地的實施細則。技術工具方面,圍繞數據全生命周期,在數據脫敏、監控預警、安全審計等方面構建了大數據白皮書(2022 年)41 覆蓋事前預防、事中監控、事后審計的全流程技術能力底座。人員能力方面,通過建立企業內部數據安全學習專欄,學習國家、行業、企業發布的相關管理要求和工作規程,提高全員數據安全認知水平和建設水平。

93、2.一站式解決方案成為數據安全主流服務形態 數據存在于業務中,離業務越近才越能解決客戶的問題。在數據安全市場中,僅通過把相關產品和平臺部署在需求方網絡內的交付過程已不能滿足當前數據安全建設需求,深入業務場景和數據視圖是必經之路。因此,相較于提供單一技術產品,融合了“技術”與“服務”的整體解決方案已成為供應商角逐的新領域,這也體現了數據安全需求方企業開始布局體系化數據安全建設的發展重心。目前,供應側數據安全解決方案主要有以下三種服務方式:一是提供行業化的數據安全治理建設解決方案。主要針對特定行業的某一項或某些項具體數據安全需求,輸出體系化的整體建設方案。例如,電信行業數據安全解決方案通過交付數據

94、資產梳理服務,部署脫敏、防泄漏、審計等工具幫助運營商企業建設數據安全治理體系。二是提供場景化的數據安全解決方案。這種服務方式的關鍵在于對通用場景的提煉,目前常見的場景劃分方式分為基于數據全生命周期(如數據使用、數據共享場景等)和基于業務運行環境(如辦公、生產、研發、云場景等)兩種劃分方式。比如數據安全合規解決方案,一方面通過實施風險評估服務、梳理管控點、明確管控措施等手段,大數據白皮書(2022 年)42 對管理制度體系進行補充完善;另一方面通過部署監控審計等技術工具,對各項管控措施進行落地實踐。三是提供“行業+場景”的數據安全解決方案。這種服務將建設思路聚焦在某個具體的行業業務應用中,有助于

95、需求側快速解決重要業務場景面臨的數據安全問題。比如金融行業數據分類分級解決方案,聚焦金融行業數據分類分級相關標準規范,梳理識別規則,編制分類分級模板,通過數據自動發現和動態運營技術實現企業全域數據的分類分級和安全管控工作。3.數據分類分級成為全行業關注焦點 數據分類分級方法論逐漸形成共識。數據分類分級作為數據安全法明確提到的概念之一,引起地方、行業、企業的研究探討,并逐漸形成從建立組織保障到落實對應級別數據安全管控策略的“七步走”方法論共識,如圖 6 所示。通過建立一個包含高層領導的數據分類分級組織架構推動各業務的數據資源及業務數據流向梳理工作,進而完成分類和定級,并最終根據級別定義完成數據安

96、全策略制定。大數據白皮書(2022 年)43 來源:中國信息通信研究院 圖 6 數據分類分級“七步走”方法論圖示 數據分類分級工作在各領域逐漸細化。為指導數據分類分級工作的推進落實,各行業、各領域紛紛制定相關標準規范,通過明確分類分級工作的原則、方法、定義,并在此基礎上給出部分分類分級示例,進一步細化國家關于數據分類分級工作的要求,推動該項工作在不同行業企業及組織機構的落地實施。表 7 展示了近幾年關于數據分類分級相關規范的編制情況。表 7 近幾年數據分類分級相關規范 發布時間 名稱 發布方 2020 年 2 月 工業數據分類分級指南(試行)工業和信息化部辦公廳 2020 年 4 月 GB/T

97、 38667-2020信息技術 大數據 數據分類指南 國家市場監督管理總局、國家標準化管理委員會 2020 年 9 月 JRT 0197-2020金融數據安全 數據安全分級指南 中國人民銀行 2020 年 12 月 YD/T 3813-2020基礎電信企業數據分類分級方法 工業和信息化部 2021 年 5 月 YD/T 3867-2021基礎電信企業重要數據識別指南 工業和信息化部 2021 年 7 月 DB33/T 2351-2021數字化改革 公共浙江省市場監督管理局 大數據白皮書(2022 年)44 數據分類分級指南 2021 年 10 月 重慶市公共數據分類分級指南(試行)重慶市大數據

98、應用發展管理局 2021 年 12 月 網絡安全標準實踐指引網絡數據分類分級指引 全國信息安全標準化技術委員會秘書處 2022 年 3 月 信息安全技術 重要數據識別規則(征求意見稿)國家市場監督管理總局、國家標準化管理委員會 2022 年 9 月 信息安全技術 網絡數據分類分級要求(征求意見稿)國家市場監督管理總局、國家標準化管理委員會 來源:中國信息通信研究院 數據分類分級工具及服務蓬勃發展。數據分類分級作為一項長期工程,自動化及智能化的“工具+服務”發展模式已成定局。一方面由于企業數量大,僅靠人工方式導致投入產出比低,需要借助自動化工具降本增效。另一方面由于業務場景將不間斷地采集并衍生新

99、數據,需要借助智能化技術提高識別率和準確率,以適應數據分類分級的常態化和持續化工作方向。同時,數據分類分級的順利開展需要參與團隊具備數據治理、數據安全、數據合規等領域的綜合知識體系,對人員能力的要求較高,因此相較于采購單一工具產品,企業針對數據分類分級專業服務的采購需求也在持續發酵。(三)數據安全面臨的主要挑戰與發展趨勢(三)數據安全面臨的主要挑戰與發展趨勢 隨著數據安全與合規要求的逐步完善,數據安全建設動力逐漸加強,雖然各行業企業在建設方案以及分類分級等焦點問題的推進方面取得了相應進展,但在管理和技術方面仍面臨相應挑戰:一是數據安全責任體系構建尚不成熟。數據在實時產生及流動過程中涉及的主體很

100、多,導致數據安全的主體責任邊界模糊,難以清楚劃分,容易影響大數據白皮書(2022 年)45 數據安全建設工作的整體推進。二是數據安全管理與技術易脫鉤。當前大部分企業的數據安全管理制度聚焦在原則、管理規定等較粗顆粒度的層面,對數據業務的下沉指導不充分,導致具體業務場景下的技術落地仍然缺乏實踐指引,容易與管理要求脫節。三是數據安全產品與服務優勢能力構建有待突破。隨著新技術新業務的不斷發展,傳統網絡安全防護思路與措施已無法滿足當下的數據安全防護需求,供給側數據安全技術產品與服務的突破創新成為競爭關鍵點。未來,數據安全領域呈現以下三點趨勢。一是由監管單一驅動轉向監管與內生的雙驅動。由中國信通院數據安全

101、推進計劃發布的 2021 年數據安全行業調研報告 顯示,97.0%的受訪企業認為“合規需求”是開展數據安全能力建設的主要原因之一。由此可以看出,監管驅動對企業數據安全建設具有強推進作用。然而隨著數字經濟的迅猛發展,數據驅動的業務創新成為各行業企業的重要營收來源,保障數據安全在推動業務健康運營方面的重要作用愈加明顯,企業數據安全建設的驅動力也逐漸由合規監管的單一驅動轉向合規與發展的雙重驅動。二是數據安全左移逐漸成為建設核心思路。伴隨著數字化轉型的深入,數據資源的爆發可以預見,數據安全的管控范圍和管控深度也因此擴大,為了提高數據安全工作效率,降低數據安全事件發生概率,需要在數據安全的風險源頭進行及

102、時管控與處置,這就要求企業必須把數據安全能力從運維環節前置、左移到設計、編碼階段。管理層面,需要提升各項安全管理要求在企業內的技術落地能力,部分互聯網企大數據白皮書(2022 年)46 業已經建立了較為完善的從管理到技術的映射能力。技術層面,聚焦于智能化在數據安全領域的應用,需要加強其對數據識別、風險識別等多項數據安全技術的賦能,提高數據安全監控分析的準確率,進而持續推動數據安全工作左移。三是數據安全風險治理能力將成為下一步建設重點。由于數據本身具備流動性、泛在性等特點,導致數據在不同的網絡區域、業務場景、應用系統中流轉時,有可能被具有不同角色、權限的用戶采取不同的處理方式訪問使用。過長的流轉

103、鏈條、過大的威脅暴露面、過多的數據處理活動,導致數據安全風險的觸發源和不可控性顯著增加。據 IBM 發布的2022 年數據泄露成本報告顯示,2022 年全球數據泄露平均成本高達 435 萬美元,創下該年度報告發布 17 年以來的最高紀錄。為了進一步防范數據泄露、數據篡改等安全事件的發生,落實數據安全風險的源頭管控,將常態化數據安全風險評估提上日程,提升數據安全風險治理能力也成為企業的關注重點。七、總結與展望 宏觀看,各國為搶占未來發展先機,均持續深化推進自身大數據戰略。我國大數據技術產業經過多年高速發展,整體水平已大幅提升,近一年來,在大數據政策、人才、資金等方面持續加碼,發展潛力得到進一步釋

104、放。微觀看,大數據五大核心領域不斷演進,發展方向進一步清晰。數據存儲與計算領域正通過云化、融合一體化、內生安全等深度優化手段實現提質增效;數據管理領域正在政策引領下實現規?;涞?;數據流通領域正在制度創新和技術創新大數據白皮書(2022 年)47 雙輪驅動下構建“規范化發展”的模式和體系;數據應用領域正通過在不同行業、不同場景進行滾動式實踐,探索數據深層價值的釋放路徑;數據安全領域正通過外規內化、風險治理等手段,快速推動全面布局和一站式解決方案的落地?!傲紩r正可用,行矣莫徒然”。當前是我國進入全面建設社會主義現代化國家開局起步的關鍵時期,也是我國大數據實現跨越式發展的重大戰略機遇期。黨的二十大

105、更是對加快發展數字經濟、建設網絡強國和數字中國提出了明確要求。未來我們應緊抓大數據發展的核心問題,加強全局、全域、全鏈的統籌謀劃,廣泛調動各方面積極因素,提升產業鏈供應能力,推動數據高質量管理,促進數據高價值轉化,筑牢數據安全防線,加快培育數據要素市場。我們相信,在我國海量數據和豐富應用場景優勢的驅動下,我國大數據行業終將披荊斬棘,助力數字經濟高質量可持續發展,在全面建設社會主義現代化國家的征程中發揮至關重要的推動作用。大數據白皮書(2022 年)48 參考文獻 1 國 務 院.“十 四 五”數 字 經 濟 發 展 規 劃 EB/OL.2021.http:/ 國務院.要素市場化配置綜合改革試點

106、總體方案EB/OL.2021.http:/ 中共中央,國務院.關于加快建設全國統一大市場的意見EB/OL.2022.http:/ 國務院.關于加強數字政府建設的指導意見EB/OL.2022.http:/ 商務部,中央網信辦,工業和信息化部.數字經濟對外投資合作工作指引EB/OL.2021.http:/ 工業和信息化部.“十四五”大數據產業發展規劃EB/OL.2021.https:/ 工業和信息化部.“十四五”軟件和信息技術服務業發展規劃EB/OL.2021.https:/ 068acfb14f15b8daf4238945deb0.html.8 工業和信息化部.“十四五”信息化和工業化深度融合發

107、展規劃EB/OL.2021.https:/ 國 家 互 聯 網 信 息 辦 公 室.數 字 中 國 發 展 報 告 R.2022.大數據白皮書(2022 年)49 http:/ 人力資源和社會保障部.新職業大數據工程技術人員就業景氣現狀分析報告R.2020.http:/ 金融信息化研究所.金融業數字化轉型發展報告R.2022.12 神策研究院.2022 中國企業數字化運營成熟度報告R.2022.13 隱私計算聯盟,中國信通院云大所.隱私計算白皮書(2021 年)R.2021.14 李橋興,胡雨晴.大數據產業的屬性與分類界定及其模糊識別研究J.科技管理研究,2020.040(003):163-1

108、73.15 中國信息通信研究院.數據庫發展研究報告(2022 年)R.2022.16 魏凱,閆樹,呂艾臨.數據要素市場化進展綜述J.信息通信技術與政策,2022(08):59-64.17 賈軒,白玉真,馬智華.隱私計算應用場景綜述J.信息通信技術與政策,2022(05):45-52.18 華中師范大學信息管理學院,湖北省數據治理與智能決策研究中心.中國政府開放數據利用研究報告(2022)R.2022.19 復旦大學數字與移動治理實驗室.中國地方政府數據開放報告(2021 年度)R.2022.20 Gartner.Gartner 2022年 重 要 戰 略 技 術 趨 勢 R.2021.https:/ 年)50 21 中國信息通信研究院.中國數字經濟發展白皮書R.2021.22 騰訊研究院.中小企業數字化轉型路徑報告R.2022.23 Gartner.2022 年企業需要關注的十二項數據和分析趨勢R.2022.https:/ IDC.IDC TechScape:中國數據安全發展路線圖,2022R.2022.https:/ 數據安全推進計劃.數據安全產品與服務圖譜 1.0R.2022.https:/ 地址:北京市海淀區花園北路 52 號 郵編:100191 電話:010-62302928 傳真:010-62304980 網址:

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(中國信通院:大數據白皮書2022(56頁).pdf)為本站 (數據大神) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站