《中國信通院:大數據白皮書(2020年)(72頁).pdf》由會員分享,可在線閱讀,更多相關《中國信通院:大數據白皮書(2020年)(72頁).pdf(70頁珍藏版)》請在三個皮匠報告上搜索。
1、 大數據白皮書大數據白皮書 (2020年)年) 中國信息通信研究院中國信息通信研究院 2020年年12月月 前前 言言 即將過去的 2020 年是歷史發展進程中極不平凡的一年。世界正經歷百年未有之大變局, 特別是突如其來的新冠肺炎疫情為各行各業帶來了前所未有的挑戰。然而,危機之中,數字化技術驅動的技術和產業變革仍加速發展,大數據技術、產業和應用逆勢而上,數據的作用在助力疫情防控和復工復產中大放異彩, “數據驅動”的價值更加深入人心。 今年 4 月,中共中央、國務院發布關于構建更加完善的要素市場化配置體制機制的意見,將“數據”與土地、勞動力、資本、技術并列,作為新的生產要素,并提出“加快培育數據
2、要素市場”。 5月 18 日,中央在關于新時代加快完善社會主義市場經濟體制的意見中進一步提出加快培育發展數據要素市場。數據要素市場化配置上升為國家戰略,將對未來經濟社會發展產生深遠影響。 本白皮書是繼 大數據白皮書 (2014 年) 大數據白皮書 (2016年)大數據白皮書(2018 年)大數據白皮書(2019 年)之后中國信通院第五次就大數據發布白皮書。 本白皮書在此前四版的基礎上,回顧了去年以來大數據各領域的最新進展,梳理了中美英等國數據戰略的最新動向,闡述了大數據技術的最新趨勢,分析了我國大數據產業、重點領域應用以及數據治理的熱點與現狀,并對“十四五”期間大數據的發展趨勢進行了展望。 目
3、目 錄錄 一、各國的數據戰略. 1 (一)數據要素市場化配置上升為國家戰略 . 2 (二)各國加快布局探索數據未來發展之路 . 4 二、大數據技術發展. 7 (一)大數據技術全景解析 . 7 (二)大數據技術發展趨勢 . 10 (三)大數據科研創新進展 . 16 三、大數據產業發展. 19 (一)大數據產業生態界定探討 . 19 (二)大數據產業商業模式解讀 . 22 (三)大數據產業主體發展洞察 . 23 (四)大數據企業融資趨勢分析 . 26 四、大數據行業應用. 28 (一)大數據全面助力打贏疫情防控阻擊戰 . 28 (二)需求推動通信大數據價值進一步發揮 . 31 (三)政策鋪墊為工業
4、大數據提供發展機遇 . 34 (四)互聯網大數據助推商業模式創新拓展 . 35 (五)金融大數據應用成為行業核心競爭力 . 37 五、數據治理. 39 (一) 組織內部的數據管理能力逐步提升 . 39 (二) 組織間的數據共享與流通加速推進 . 44 (三) 數據安全治理成為不可忽視的焦點 . 51 六、大數據法制. 55 (一)強化個人權益,個人信息保護立法加快 . 55 (二)堅持多邊合作,數據跨境流動立法加強 . 57 (三)明確權利屬性,數據權屬立法探索初現 . 60 七、展望與建議. 62 參考文獻. 64 圖圖 目目 錄錄 圖 1 全球每年產生數據量估算圖. 1 圖 2 我國數據戰
5、略的布局歷程. 2 圖 3 大數據技術體系及主要開源軟件. 8 圖 4 數據庫領域關注度變化態勢. 14 圖 5 大數據領域論文發表數量及各國占比. 17 圖 6 大數據領域專利申請數量及各國占比. 18 圖 7 大數據企業數量增長統計. 24 圖 8 大數據企業規模分布. 24 圖 9 大數據企業地域分布. 25 圖 10 大數據行業應用企業類型分布. 26 圖 11 大數據企業賽道分布 . 27 圖 12 大數據獲投輪次分布. 28 圖 13 通信大數據行程卡查詢量變化情況. 31 圖 14 國內大數據交易市場建設歷程. 48 表表 目目 錄錄 表 1 不同大數據產業分類方式間的對應關系.
6、 21 表 2 數據資產管理能力劃分. 40 表 3 各?。▍^、市)政務數據開放相關政策文件. 45 表 4 新設大數據交易所(中心)的基本情況. 50 表 5 個人信息保護相關的主要規范. 55 表 6 我國數據跨境流動的相關政策法規及標準情況. 58 大數據白皮書(2020 年) 1 一、各國的數據戰略 當前,全球數據量仍在飛速增長的階段。根據國際權威機構Statista 的統計和預測,2020 年全球數據產生量預計達到 47ZB1,而到 2035 年,這一數字將達到 2142ZB,全球數據量即將迎來更大規模的爆發。 數據來源: Statista,2020 年 11 月 圖 1 全球每年產
7、生數據量估算圖 隨著數字經濟在全球加速推進以及 5G、人工智能、物聯網等相關技術的快速發展,數據已成為影響全球競爭的關鍵戰略性資源。只有獲取和掌握更多的數據資源, 才能在新一輪的全球話語權競爭中占據主導地位。2020 年以來,各國數據戰略布局步伐加快,本章將梳理我國數據戰略的布局歷程, 并對美歐等各國的數據戰略發展重點進行簡要敘述。 1 ZB 為字節計量單位,1ZB=1012GB。 大數據白皮書(2020 年) 2 (一)數據要素市場化配置上升為國家戰略(一)數據要素市場化配置上升為國家戰略 自 2014 年以來,我國大數據戰略的謀篇布局大致經歷了四個不同階段,正逐步從數據大國向數據強國邁進。
8、 來源: 中國信息通信研究院 圖 2 我國數據戰略的布局歷程 2014 至 2017 年間,國家大數據戰略經歷了最初的預熱、起步后開始落地實施。2014 年 3 月,“大數據”一詞首次寫入政府工作報告,大數據開始成為國內社會各界的熱點。2015 年 8 月印發的促進大數據發展行動綱要 (國發201550 號)對大數據整體發展進行了頂層設計和統籌布局,產業發展開始起步。2016 年 3 月, 十三五規劃綱要 正式提出“實施國家大數據戰略”, 國內大數據產業開始全面、快速發展。 隨著國內大數據相關產業體系日漸完善, 各類行業融合應用逐步深入,國家大數據戰略走向深化階段。2017 年 10 月,黨的
9、十九大報告中提出推動大數據與實體經濟深度融合, 為大數據產業的未來發展指明方向。12 月,中央政治局就實施國家大數據戰略進行了集體學習。2019 年 3 月,政府工作報告第六次提到“大數據”,并且有多項任大數據白皮書(2020 年) 3 務與大數據密切相關。進入 2020 年, 數據正式成為生產要素, 戰略性地位進一步提升。4 月 9 日,中共中央、國務院發布關于構建更加完善的要素市場化配置體制機制的意見,將“數據”與土地、勞動力、資本、技術并稱為五種要素, 提出“加快培育數據要素市場”。 5 月 18 日, 中央在 關于新時代加快完善社會主義市場經濟體制的意見 中進一步提出加快培育發展數據要
10、素市場。 這標志著數據要素市場化配置上升為國家戰略,將進一步完善我國現代化治理體系,有望對未來經濟社會發展產生深遠影響。我國在國家級政策中將數據定義為“生產要素”, 建立在對歷史和現實的深入思考之上。人類社會發展的不同時期,都會有相對應的關鍵性生產要素。這些關鍵的生產要素都釋放了強勁動能,催生了生產技術組織變革,從而拉動了時代快速發展變遷。進入數字社會,數據就成為了這一關鍵性生產要素。以史觀今,隨著人類社會步入數據驅動的數字經濟時代,數據要素進一步提升了全要素生產率。在數字社會,數據具有基礎性戰略資源和關鍵性生產要素的雙重角色。一方面,有價值的數據資源是生產力的重要組成部分,是催生和推動眾多數
11、字經濟新產業、新業態、新模式發展的基礎。另一方面,數據區別于以往生產要素的突出特點是對其他要素資源的乘數作用,可以放大勞動力、資本等要素在社會各行業價值鏈流轉中產生的價值。善用數據生產要素,解放和發展數字化生產力,有助于推動數字經濟與實體經濟深度融合,實現高質量發展。從目前來看,作為關鍵生產要素,大量數據資源還沒有得到充分大數據白皮書(2020 年) 4 有效的利用。根據 IDC 和希捷科技的調研預測2,隨著各行各業企業的數字化轉型提速,未來兩年,企業數據將以 42.2%的速度保持高速增長,但與此同時,調研結果顯示,企業運營中的數據只有 56%能夠被及時捕獲,而這其中,僅有 57%的數據得到了
12、利用,43%的采集數據并沒有被激活。也就是說,僅有 32%的企業數據價值能夠被激活。 隨著數據要素市場培育和建設的步伐加快,數據的有效利用、數據價值的充分釋放將成為多方力量共同努力的方向。 (二)各國加快布局探索數據未來發展之路(二)各國加快布局探索數據未來發展之路 為了應對信息技術時代在數據方面的發展和挑戰,2019 年底以來, 美國、 歐盟和英國相繼出臺數據戰略, 探索未來的數據發展之路。 美國聯邦數據戰略焦點從“技術”轉移到“資源”。 自 2012年以來,美國極力推動大數據領域前沿核心技術的發展和科學工程領域的發明創造,致力打造有活力的數據創新生態。在當前數據成為國家治理重要工具的背景之
13、下,美國政府對于數據的重視程度進一步提升。 2019 年 12 月 23 日, 美國白宮行政管理和預算辦公室(OMB)發布 聯邦數據戰略與 2020 年行動計劃 (以下簡稱“聯邦數據戰略”),以政府數據治理為主要視角, 描述了聯邦政府未來十年的數據愿景和2020 年所要推行的關鍵行動。 聯邦數據戰略 的核心目標是“將數據作為戰略資源開發”。聯邦數據戰略 確立了 40 項數據管理的具體實踐目標, 分為三個層面。第一,重視數據并促進共享,如通過數據指導決策、促進各機構間數據流通等;第二,保護數據資源,如保護數據的真實性、完整性和安 2 數據來源:希捷數據新視界調研,IDC,2020 年。 大數據白
14、皮書(2020 年) 5 全性;第三,有效使用數據資源,如增強數據分析能力、促進數據訪問形式多樣化等。 歐盟數據戰略致力于發展數據敏捷型經濟體。 數據已成為經濟社會發展的重要命脈,是新產品和服務衍生的基礎。為應對未來發展,歐盟致力于平衡數據流動和廣泛使用, 希望通過建立單一的數據市場,確保歐洲在未來的數據經濟中占據領先地位。2020 年 2 月 19 日,歐盟委員會公布了歐盟數據戰略,以數字經濟發展為主要視角,概述了歐委會在數據方面的核心政策措施及未來五年的投資計劃, 以助力數字經濟發展。 歐盟數據戰略對歐盟數據發展提出了明確的愿景目標2030 年歐洲將成為世界上最具吸引力、 最安全、 最具活
15、力的數據敏捷型經濟體。即,在保持高度的隱私、安全和道德標準的前提下,充分發掘數據利用的價值造福經濟社會, 并確保每個人能從數字紅利中受益。為推進歐盟數據一體化和提升歐盟國家的市場主體競爭力, 歐盟數據戰略 提出了四大支柱性戰略措施: 一是構建跨部門治理框架;二是加強數據投入;三是提升數據素養;四是構建數據空間。 英國期待數據戰略助力經濟復蘇。 2020 年 9 月 9 日, 英國數字、文化、媒體和體育部(DCMS)發布國家數據戰略,支持英國對數據的使用,設定五項“優先任務”,幫助該國經濟從疫情中復蘇。這五項任務包括:(1)釋放數據的價值;(2)確保促進增長和可信的數據體制;(3)轉變政府對數據
16、的使用,以提高效率并改善公共服務;(4)確保數據所依賴的基礎架構的安全性和韌性;(5)倡導國際數據流動。 除五項優先任務以外,英國國家數據戰略還包括多項計劃,大數據白皮書(2020 年) 6 如: 到 2021 年, 對 500 名分析師進行公共部門數據科學方面的培訓,并設立政府首席數據官,改變政府當前的數據使用方式,從而提高效率并改善公共服務;通過立法提高智慧數據計劃的參與度;新建一個260 萬英鎊的項目,在支持創新發展的同時致力于解決當前數據共享中存在的障礙等。 除各個國家的數據戰略外, 國際組織也十分強調數據在全球化發展中的重要性。2020 年 4 月,世界銀行呼吁各國政府、相關企業以及
17、學術界共同合作, 通過大數據等技術手段應對新冠肺炎疫情所帶來的危機。在 2020 年 7 月召開的 G20 數字經濟部長會議中,數據流動成為各國部長們重點討論的議題之一。 在新一輪的國際經貿規則中,跨境數據流通成為全球雙邊/多邊貿易合作的重要議題。一方面,基于“共同理念”的全球數據同盟體系加速構建,形成了歐盟 GDPR 和 APEC 跨境隱私規則體系(CBPR)兩大區域性的數據隱私與保護監管框架,眾多國家以二者為藍本,對本國的數據跨境與數據保護規則進行修訂;另一方面,兩大框架在國與國、區域與區域之間衍生諸多靈活性的解決方案。2019 年,日韓分別啟動與美歐之間的推動跨境數據流動的雙邊協定, 并
18、與歐盟達成充分性保護互認協議。 2020 年 3 月, 澳大利亞信息專員辦公室 (OAIC)與新加坡個人數據保護委員會(PDPC)簽訂關于跨境數據流動的諒解備忘錄,加強數據治理方面的合作,促進兩國之間的經濟一體化;2020 年 6 月,英國宣布脫歐后的未來科技貿易戰略,允許英國和某些亞太國家間的數據自由流動, 并希望與日本等國達成比其作為歐盟成員國時期更進一步的數據協議。 大數據白皮書(2020 年) 7 二、大數據技術發展 近年來, 大數據技術的內涵伴隨著大數據時代的發展產生了一定的演進和拓展,從基本的面向海量數據的存儲、處理、分析等需求的核心技術延展到相關的管理、流通、安全等其他需求的周邊
19、技術,逐漸形成了一整套大數據技術體系,成為數據能力建設的基礎設施。伴隨著技術體系的完善,大數據技術開始向著降低成本、增強安全的方向發展。 本章將對當前大數據技術的涵蓋范圍以及未來發展態勢進行介紹。 (一)大數據技術全景解析(一)大數據技術全景解析 大數據技術起源于 2000 年前后互聯網的高速發展。伴隨著時代背景下數據特征的不斷演變以及數據價值釋放需求的不斷增加, 大數據技術已逐步演進針對大數據的多重數據特征,圍繞數據存儲、處理計算的基礎技術,同配套的數據治理、數據分析應用、數據安全流通等助力數據價值釋放的周邊技術組合起來形成的整套技術生態。 如今,大數據技術已經發展成為覆蓋面龐大的技術體系。
20、 圖 3 展示了大數據技術體系圖譜及相關代表性的開源軟件。 大數據白皮書(2020 年) 8 來源:中國信息通信研究院 圖 3 大數據技術體系及主要開源軟件 大數據基礎技術為應對大數據時代的多種數據特征而產生。 大數據時代,數據量大、數據源異構多樣、數據實效性高等特征催生了高效完成海量異構數據存儲與計算的技術需求。在這樣的需求下,面對迅速而龐大的數據量,傳統集中式計算架構出現難以逾越的瓶頸,傳統關系型數據庫單機的存儲及計算性能有限, 出現了規模并行化處理(Massively Parallel Processing,MPP)的分布式計算架構;面向海量網頁內容及日志等非結構化數據, 出現了基于Ap
21、ache Hadoop和Spark生態體系的分布式批處理計算框架; 面向對于時效性數據進行實時計算反饋的需求,出現了 Apache Storm、Flink 和 Spark Streaming 等分布式流處理計算框架。 大數據白皮書(2020 年) 9 數據管理類技術助力提升數據質量與可用性。 技術總是隨著需求的變化而不斷發展提升。在較為基本和急迫的數據存儲、計算需求已在一定程度上得到滿足后, 如何將數據轉化為價值成為了下一個最主要需求。最初,企業與組織內部的大量數據因缺乏有效的管理,普遍存在著數據質量低、獲取難、整合不易、標準混亂等問題,使得數據后續的使用存在眾多障礙。在此情況下,用于數據整合
22、的數據集成技術, 以及用于實現一系列數據資產管理職能的數據管理技術隨之出現。 數據分析應用技術發掘數據資源的內蘊價值。 在擁有充足的存儲計算能力以及高質量可用數據的情況下, 如何將數據中蘊涵的價值充分挖掘并同相關的具體業務結合以實現數據的增值成為了關鍵。 用以發掘數據價值的數據分析應用技術, 包括以 BI (Business Intelligence)工具為代表的簡單統計分析與可視化展現技術,及以傳統機器學習、基于深度神經網絡的深度學習為基礎的挖掘分析建模技術紛紛涌現,幫助用戶發掘數據價值并進一步將分析結果和模型應用于實際業務場景中。 數據安全流通技術助力安全合規的數據使用及共享。 在數據價值
23、的釋放初現曙光的同時,數據安全問題也愈加凸顯,數據泄露、數據丟失、數據濫用等安全事件層出不窮,對國家、企業和個人用戶造成了惡劣影響,如何應對大數據時代下嚴峻的數據安全威脅,在安全合規的前提下共享及使用數據成為了備受矚目的問題。訪問控制、身份識別、數據加密、數據脫敏等傳統數據保護技術正積極向更加適應大數據場景的方向不斷發展,同時,側重于實現安全數據流通的隱私計算技術也成為了熱點發展方向。 大數據白皮書(2020 年) 10 (二)大數據技術發展趨勢(二)大數據技術發展趨勢 2020 年以來, 大數據技術環境發生了一些變化, 一些新的技術趨勢應運而生,重點呈現出以下幾點趨勢。 1. 基礎技術:控制
24、成本按需索取成為主要理念 大數據技術自誕生以來始終沿襲著基于 Hadoop 或者 MPP 的分布式框架, 利用可擴展的特性通過資源的水平擴展來適應更大的數據量和更高的計算需求, 并形成了具備存儲計算處理分析等能力的完整平臺。以往,為了應對網絡速度不足、數據在各節點間交換時間較長的問題,大數據分布式框架設計采用存儲與計算耦合,使數據在自身存儲的節點上完成計算,以降低交互。同時,無論是私有化部署還是云化服務, 大數據平臺始終以具備數據存儲計算處理分析等完整能力的形態提供服務。 存儲與計算耦合的自建平臺造成了額外成本。 實際業務中對于數據存儲與計算能力的要求往往是不斷變化且各自獨立的, 使得兩類資源
25、的需求配比不可預見且二者到達資源瓶頸的時間無法同步。 在存儲與計算耦合的情況下,當兩者其一出現瓶頸時,資源的橫向擴展必然導致存儲或是計算能力的冗余, 由此必須進行大量的數據遷移才能保證擴展節點的資源得以有效利用, 這無疑造成了難以避免的額外成本。同時,以完整產品形式提供服務的大數據平臺在應對彈性擴展、功能迭代、成本控制等特性需求時,無論是開發迭代新版本還是集成混搭其他工具,總會引發需求延遲滿足、性能持續降低、額外新增成本等其他問題。 存算分離有效控制成本。 存算分離是將存儲和計算兩個數據生命大數據白皮書(2020 年) 11 周期中的關鍵環節剝離開,形成兩個獨立的資源集合。兩個資源集合之間互不
26、干涉但又通力協作。 每個集合內部充分體現資源的規模聚集效應,使得單位資源的成本盡量減少,同時兼具充分的彈性以供橫向擴展。當兩類資源之一緊缺或富裕時,只需對該類資源進行獲取或回收,使用具備特定資源配比的專用節點進行彈性擴展或收縮,即可在資源需求差異化的場景中實現資源的合理配置。 按需索取的處理分析能力服務化概念開始流行。 在存算分離理念的基礎上, Serverless、 云原生等概念的提出進一步助力處理分析等各項能力的服務化。通過存算分離的深入以及容器化等技術的應用,Serverless 概念的落實從簡單的計算函數向著更豐富的處理分析能力發展,通過預先實現的形式將特定的數據處理、通用計算、復雜分
27、析能力形成服務,以供按需調用。由此,數據的處理分析等能力擺脫了對于完整平臺和工具的需求,大大降低開發周期、節省開發成本,同時服務應用由提供方運維,實行按需付費,消除了復雜的運維過程和相應的成本。 國內外眾多廠商深入進行了存算分離和能力服務化的實踐。 目前,阿里云和華為一眾云計算廠商, 紛紛提供了基于各自云化大數據平臺、分布式數據庫產品的存算分離解決方案。其中,阿里云使用自身EMR+OSS 產品代替原生 Hadoop 存儲架構,整體費用成本估算下降50%;華為則使用了自身 FusionInsight+EC 產品,存儲利用率從 33%提升至 91.6%。在能力服務化方面,國外最為出名的是 Snow
28、flake 公司提出的數據倉庫服務化(Data warehouse as a Service,DaaS),將分析能力以云服務的形式在 AWS、 Azure 等云平臺上提供按次計費的服務,成為云原生數據倉庫的代表,并于今年以超過 700 億美元的市大數據白皮書(2020 年) 12 值 IPO,成為軟件企業最大 IPO 案例。在國內則有以阿里云的AnalyticDB、 DLA 為代表的一系列產品提供基于類似思想的服務化的數據處理分析能力。 2. 數據管理:自動化智能化數據管理需求緊迫 數據管理相關的概念和方法論近年備受關注, 在大數據浪潮下越來越多的政府、企業等組織開始關注如何管理好、使用好數據
29、,從而使數據能夠藉由應用和服務轉化為額外價值。 數據管理依賴人工操作帶來居高不下的人力成本。 數據管理技術包括數據集成、元數據、數據建模、數據標準管理、數據質量管理和數據資產服務,通過匯聚盤點數據和提升數據質量,增強數據的可用性和易用性,進一步釋放數據資產的價值。目前以上技術多集成于數據管理平臺,作為開展數據管理的統一工具。但是數據管理平臺仍自動化、智能化程度低的問題,實際使用中需要人工進行數據建模、數據標準應用、數據剖析等操作。 更加自動化智能化的數據管理平臺助力數據管理工作高效進行。在基于機器學習的人工智能不斷進步的情況下, 將有關技術應用于數據管理平臺的各項職能, 以減少人力成本提高治理
30、效率成為當下數據管理平臺研發者關注的重點。 其中數據建模、 數據標簽、 主數據發現、數據標準應用成為幾個主要的應用方向。數據建模方面,機器學習技術通過識別數據特征,推薦數據主題分類,進一步實現自動化建立概念數據模型,同時,對表間關系的識別將大大降低逆向數據建模的人力成本,便于對數據模型持續更新。數據標準應用方面,基于業務含義、數據特征、數據關系等維度的相似度判別,在數據建模時匹配數大數據白皮書(2020 年) 13 據標準,不僅提升了數據標準的應用覆蓋面,也減少了數據標準體系的維護成本。數據剖析方面,人工智能通過分析問題數據和學習數據質量知識庫,提取數據質量評估維度和數據質量稽核規則,并識別關
31、聯數據標準,實現自動化的數據質量事前、事中、事后管理。 在數據資產管理概念火熱,各項工作備受重視的當下,市場上的數據管理平臺產品也在不斷演進力爭上游。華為、浪潮、阿里云、數夢工場、數瀾科技、Datablau 等數據管理平臺供應商也在各自的產品中不斷更新自動化智能化的數據管理功能。 其中華為著重于智能化的數據探索,浪潮關注自動化的標簽、主數據識別,阿里云實現了高效的標簽識別以及數據去冗,中國系統則聚焦助力數據標準有效落地。 3. 分析應用:圖分析需求旺盛引導數據分析新方向 隨著深度學習的迅速發展, 傳統的針對以獨立數據集合為對象的分析技術不斷成熟。相對的,對于存在關聯關系的數據進行關聯分析的需求
32、愈加旺盛。關聯分析最早始于由上世紀九十年代,由“購物籃分析” 問題, 即通過從顧客交易列表中發掘其購物行為模式引申而來。早期機器學習領域中也有 Apriori、FP-growth 等經典頻繁模式挖掘算法實現對于關聯規則的挖掘分析。 傳統數據分析方法難以應對圖結構數據中關聯關系的分析需求。以社交網絡、用戶行為、網頁鏈接關系等為代表的數據,往往需要通過“圖”的形態以最原始、 最直觀的方式展現其關聯性。 在圖的形式下,自然而然地存在著連通性、中心度、社區關系等一系列內蘊的關聯關系,這類依賴于對圖結構本身進行挖掘分析的需求難以通過分類、聚類、回歸和頻繁模式挖掘等傳統數據分析方法進行實現,需要能夠對大數
33、據白皮書(2020 年) 14 于圖結構本身進行存儲、計算、分析挖掘的技術合力完成。 專注于圖結構數據的圖分析技術成為數據分析技術的新方向。 圖分析是專門針對圖結構數據進行關聯關系挖掘分析的一類分析技術,在分析技術應用中占據的比重不斷上升。 與圖分析相關的多項技術均成為熱點的產品化方向, 其中以對圖模型數據進行存儲和查詢的圖數據庫、對圖模型數據應用圖分析算法的圖計算引擎、對圖模型數據進行抽象以研究展示實體間關系的知識圖譜三項技術為主。 通過組合使用圖數據庫、圖計算引擎和知識圖譜,使用者可以對圖結構中實體點間存在的未知關系進行探索和發掘, 充分獲取其中蘊含的依賴圖結構的關聯關系。 根據 DB-E
34、ngines 排名分析,圖數據庫關注熱度在 2013-2020 年間增長了 10 倍,關注度增長排名第一。圖數據庫、圖計算引擎、知識圖譜三項熱點技術方向正在全球范圍內加速產業化。國內阿里云、華為、騰訊、百度等大型云廠商以及部分初創企業均已布局這一技術領域。其中,知識圖譜已經開始深入地應用于公安、金融、工業、能源、法律等諸多行業,紛紛落地內部試點應用。 數據來源:DB-Engines,2020 年 11 月 圖 4 數據庫領域關注度變化態勢 大數據白皮書(2020 年) 15 4. 安全流通:隱私計算技術穩步發展熱度持續上升 除了對數據進行分析挖掘以外, 數據的共享及流通是另一個實現數據價值釋放
35、的方向。 無論是直接對外提供數據查詢服務還是與外部數據進行融合分析應用,都是實現數據價值變現的重要方式。在數據安全事件頻發的當下, 如何在不同組織間進行安全可控的數據流通始終缺乏有效的技術保障。同時,隨著相關法律的逐步完善,數據的對外流通面臨更加嚴格的規范限制, 合規問題進一步對多個組織間的數據流通產生制約。 基于隱私計算的數據流通技術成為實現數據聯合計算的主要思路。在數據合規流通需求旺盛的環境下,隱私計算技術發展火熱。作為旨在保護數據本身不對外泄露的前提下實現數據融合的一類信息技術,隱私計算為實現安全合規的數據流通帶來了可能。當前,隱私計算技術主要分為多方安全計算和可信硬件兩大流派。其中,多
36、方安全計算基于密碼學理論, 可以實現在無可信第三方情況下安全地進行多方協同計算;可信硬件技術則依據對于安全硬件的信賴,構建一個硬件安全區域,使數據僅在該安全區域內進行計算。在認可密碼學或硬件供應商的信任機制的情況下, 兩類隱私計算技術均能夠在數據本身不外泄的前提下實現多組織間數據的聯合計算。此外,還有聯邦學習、 共享學習等通過多種技術手段平衡了安全性和性能的隱私保護技術,也為跨企業機器學習和數據挖掘提供了新的解決思路。 由于解決的問題十分契合數據流通領域的熱點命題, 近年來隱私計算技術持續穩步發展,各類市場參與者逐漸清晰。一方面,互聯網巨頭、電信運營公司以及眾多大數據公司紛紛布局隱私計算,這類
37、企業自身有很強的數據業務合規需求,也有豐富的數據源、數據業務、大數據白皮書(2020 年) 16 數據交易場景和過硬的研發能力。另一方面,一批專注于隱私計算技術研發應用的初創企業也相繼涌現, 對外提供算法、 算力和技術平臺,相關理論技術較為扎實專業。 整個隱私計算技術領域開始呈現百花齊放的快速發展態勢。 (三)大數據科研創新進展(三)大數據科研創新進展 自 2012 年大數據廣泛進入實際應用以來,產業界和學術界在大數據技術與應用方面的研究創新不斷取得突破, 大數據領域的論文發表數量和專利申請數量快速增長。 在論文發表方面,根據 Web of Science 數據庫收錄的 SCI 論文數據統計,
38、2012 年至今,全球共發表以“big data”為關鍵詞的大數據領域相關論文 64739 篇。其中,2012-2018 年大數據相關論文發表量持續增長,并在 2018 年達到高峰,2018 年全年共發表相關論文 11453篇,是 2012 年論文數量的 5.4 倍,七年間的年均增長率約為 32.5%。2019 年論文數量較前一年有所減少,但仍然超過一萬篇,2020 年 1-6 月,論文發表數量則為 3915 篇。隨著科學研究的不斷進展,大數據相關的理論體系將逐漸成熟, 未來學術論文成果發表的增長速度或將放緩。從發表論文的國家和地區來看,中國和歐美地區仍是大數據相關學術研究的核心地帶。 中國和
39、美國是大數據相關論文發表最多的國家,分別發表論文 18216 篇和 16241 篇,占論文總量的 28.14%和25.09%,遙遙領先于其他國家。英國、印度和德國的論文發表數量占比分別為 6.03%、5.92%和 5.66%,意大利、澳大利亞、西班牙及其他國家的論文數量占比均低于 5%。 大數據白皮書(2020 年) 17 數據來源: Web of Science,2020 年 10 月 圖 5 大數據領域論文發表數量及各國占比 在專利申請方面,根據 WIPO(世界知識產權組織)的PATENTSCOPE 數據庫的統計數據, 2012 年至今, 全球共申請大數據領域的相關專利 136694 項。
40、2012-2019 年間,大數據技術快速發展,各國和國內外大數據企業對知識產權保護更加重視, 專利申請數量始終保持穩定增長,從 2012 年的 9135 項持續增長至 2019 年的 25854項,年均增速約為 16.0%。2020 年 1-6 月,全球大數據相關專利申請數量則為 10789 項。從受理專利申請的國家和地區來看,大數據相關專利的申請較為集中,93%以上的專利均分布在美國、中國、PCT 組織(專利合作條約體系)和歐洲專利局。美國受理的專利數量位居首位,占比近 1/2,約為 49.19%,IBM、微軟、Oracle、EMC 等美國企業的技術優勢仍然顯著; 中國為第二大專利受理國,
41、占比約為 19.25%,一方面,我國大數據發展態勢良好,在國際上有重要的市場地位,另一方面在技術創新與突破上,我國與美國仍有較大差距。此外,PCT組織和歐洲專利局受理的專利數量占比分別為 16.39%和 8.31%;其他國家的占比均在 5%甚至 1%以下。 391521193447528277839670106731145310397020004000600080001000012000140002012年2013年2014年2015年2016年2017年2018年2019年2020年(1-6月)2012-2020年全球大數據論文發表數量年全球大數據論文發表數量各國論文發表數量占比各國論文發表
42、數量占比中國美國英國印度德國意大利澳大利亞西班牙其他大數據白皮書(2020 年) 18 數據來源: PATENTSCOPE 數據庫,2020 年 10 月 圖 6 大數據領域專利申請數量及各國占比 從細分領域來看,在大數據領域的科學研究中,針對基于分布式計算技術的數據關聯分析或數據挖掘的論文和專利數量明顯多于其他領域,可見數據分析挖掘依舊是大數據科研創新的熱點方向。 91359778115631278315102187462294425854107890500010000150002000025000300002012年2013年2014年2015年2016年2017年2018年2019年20
43、20年(1-6月)20122012- -20202020年全球大數據專利申請數量年全球大數據專利申請數量各國各國和地區專利申請和地區專利申請數量占比數量占比美國中國PCT歐洲專利局澳大利亞加拿大韓國英國其他大數據白皮書(2020 年) 19 三、大數據產業發展 “十三五”以來,我國大數據蓬勃發展,融合應用不斷深化,數字經濟量質提升,對經濟社會的創新驅動、融合帶動作用顯著增強。工業和信息化部運行監測協調局發布的數據顯示,2019 年我國以云計算、 大數據技術為基礎的平臺類運營技術服務收入 2.2 萬億元, 其中,典型云服務和大數據服務收入達 3284 億元,提供服務的企業達 2977家3,大數據
44、產業發展日益壯大。 本章將結合最新趨勢對當下大數據產業的范圍和內涵進行了界定,并從產業主體、企業投融資趨勢等方面對我國大數據產業發展的態勢進行簡要分析。 (一)大數據產業生態界定探討(一)大數據產業生態界定探討 隨著大數據技術不斷演進和應用持續深化, 以數據為核心的大數據產業生態正在加速構建。盡管自實施國家大數據戰略以來,我國的大數據產業發展已取得明顯的成績,但產業相關的基本問題,包含產業內涵、外延與特征等尚未達成共識。厘清大數據產業范疇和體系結構,區分大數據產業核心要素與關聯要素,對于推動大數據產業發展起著十分重要的基礎作用。在這里,將對大數據產業生態的各類界定方式進行簡要敘述。 出于理解視
45、角的差異,大數據產業內涵的界定目前仍有爭議。一類觀點從產業經濟學出發, 認為大數據產業是以大數據為出發點和落腳點,通過對自身生產或從外部獲取的數據進行挖掘、應用以創造價值的經濟活動集合。 但也有一類觀點認為大數據只是現代信息技術產 3 工信部運行局2019 年軟件和信息技術服務業統計年報,2020 年 10 月 大數據白皮書(2020 年) 20 業中的一部分,因為大數據的本質是在互聯網、軟件、計算機等基礎上實現的數據服務,其圍繞的數據采集、傳輸、加工、分析、應用等一系列活動仍包含于現代信息技術產業的范疇之內。 從大數據的價值體現出發, 結合以上各類研究機構和學者的觀點,我們認為大數據產業是以
46、數據及數據所蘊含的信息價值為核心生產要素,通過數據技術、數據產品、數據服務等形式,使數據與信息價值在各行業經濟活動中得到充分釋放的賦能型產業。 傳統的大數據產業定義一般分為核心業態、關聯業態、衍生業態三大業態。核心業態是包括從大數據采集到服務、數據交易、數據安全以及相關平臺運營建設等圍繞數據全生命周期的大數據關鍵技術與業務; 關聯業態是以軟件、 電子信息制造業為代表, 包括智能終端、集成電路、軟件和服務外包等大數據產業所需的軟硬件制造業務;衍生業態是包括工業、農業、金融等各行業的大數據融合應用。 對大數據產業的另一種分類是劃分為基礎支撐、 數據服務和融合應用三層業態?;A支撐層包含網絡、存儲和
47、計算等硬件設施,資源管理平臺以及與數據采集、分析、處理和展示相關的技術和工具;數據服務層是圍繞各類應用和市場需求,提供包括數據交易、數據采集與處理、數據分析與可視化、數據安全等輔助性服務;融合應用層則包含了與政府、工業、交通等行業密切相關的應用軟件和整體解決方案。 通過對比,不難看出以上兩種分類的本質幾乎一致。核心業態與數據服務、關聯業態與基礎支撐、衍生業態與融合應用之間各自相互對應,后一種分類可以看作是圍繞前者描述的具體展開。 還有部分觀點認為以上兩種分類較為籠統, 并未將數據資源明確大數據白皮書(2020 年) 21 納入到大數據產業的相關業態中, 而數據資源應是大數據產業鏈條的起始點,不
48、可忽略?;谶@樣的觀點,有學者提出基于數據價值的實現流程,應將大數據產業分為大數據資源供應、大數據設備提供、大數據技術服務和大數據融合應用四層。 這一分類方式是在沿用上述兩種分類的基礎之上,將基于互聯網、物聯網等信息技術渠道大量產生并提供數據資源的經濟活動單列出來, 成為大數據產業鏈條的第一層。此外,也有觀點將大數據產業劃分為五個層次,這里暫不展開介紹。 表 1 不同大數據產業分類方式間的對應關系 分類方式分類方式 層次名稱與定義層次名稱與定義 三層分類(一)三層分類(一)4 核心業態核心業態 指圍繞數據全生命周期、大數據關鍵技術和大數據核心業務所形成的產業業態,包括大數據的采集、處理、 存儲
49、、 分析、 交易、安全、服務和云平臺建設運營 關聯業態關聯業態 指大數據產業鏈上下游與大數據核心業態緊密聯系的電子信息產業, 包括智能終端、集成電路、電子材料和元器件、 呼叫服務、電子商務、互聯網金融、軟件和服務外包等 衍生業態衍生業態 指大數據、互聯網+在各行業、各領域的融合應用所產生的業態 / 三層分類(二)三層分類(二)5 數據服務數據服務 圍繞各類應用和市場需求,提供輔助性服務, 包括數據交易、 數據采集與處理、數據分析與可視化、數據安全等 基礎支撐基礎支撐 包括網絡、存儲和計算等硬件設施資源管理平臺以及與數據采集、 分析、 處理和展示相關的技術和工具 融合應用融合應用 包含了與政務、
50、工業、交通等行業緊密相關的應用軟件和整體解決方案 / 四層分類四層分類6 大數據技術服務業大數據技術服務業 貫穿大數據產業鏈的軟件及技術服務提供大數據設備提供業大數據設備提供業 貫穿大數據產業鏈的硬件設施提供方,包大數據融合應用業大數據融合應用業 大數據產業鏈后端的數據應用方,包大數據資源供應業大數據資源供應業 大數據產業鏈前端的數據資源提供 4 中國共產黨貴州省第十二次代表大會報告關鍵詞解讀http:/ 5 大數據產業生態聯盟,中國大數據產業生態地圖暨中國大數據產業發展白皮書 6 李橋興, 胡雨晴. 大數據產業的屬性與分類界定及其模糊識別研究J. 科技管理研究, 2020, 040(003)
51、:163-173. 大數據白皮書(2020 年) 22 方, 包括前端采集、 數據清洗、大數據管理分析平臺建設、商務智能挖掘等圍繞數據提供的相關技術服務及軟件研發 括光纜、 網絡設備、 高核能計算機、大數據一體機、集成電路等大數據所需的硬件設備的設計、制造、租賃、批發和零售等 括與互聯網、金融、交通、政務等行業的融合,為不同行業提供相應的服務和解決方案以實現經濟目標 方,包括移動互聯網行業、 金融業、 電信業、交通運輸業等能夠產生并擁有大量數據資源的行業 來源:根據公開資料整理,中國信息通信研究院 (二)大數據產業商業模式解讀(二)大數據產業商業模式解讀 大數據產業層次劃分難以明確統一的原因之
52、一在于各層次之間的企業業務經營存在交叉覆蓋。從實踐看,以互聯網巨頭為代表的諸多科技企業在大數據產業上的布局已跨越了多個層次, 提供硬件設備、技術軟件與應用方案等多類產品與服務。在這里,簡要對大數據產業的主要商業模式進行分析。 一是提供數據或技術工具。這類模式以數據資源本身或數據庫、各類 Hadoop 商業版本、大數據軟硬件結合一體機等技術產品,為客戶解決大數據業務鏈條中的某個環節的對應問題。 按照資源的不同分類收費, 既可以買斷數據資源或技術產品, 也可以按需、 按月、 按年、按量等方式獲得付費服務,方便零活。 二是提供獨立的數據服務。 這類模式主要指為數據資源擁有或使用者提供數據分析、挖掘、
53、可視化等第三方數據服務,如情報挖掘、輿情分析、精準營銷、個性化推薦、可視化工具等,以付費工具或產品的形式向客戶提供。 三是提供整體化的解決方案。 這類模式主要是為缺乏技術能力但需要引入大數據系統支撐企業或組織業務升級轉型的用戶定制化構建和部署一整套完整的大數據應用系統, 并負責運營、 維護、 升級等。 大數據白皮書(2020 年) 23 (三)大數據產業主體發展洞察(三)大數據產業主體發展洞察 2020 年, 我國大數據產業迎來新的發展機遇期, 產業規模日趨成熟。大數據產業主體從“硬”設施向“軟”服務轉變的態勢將更加明顯,面向金融、政務、電信、醫療等領域的大數據服務將實現倍增創新,大數據與特定
54、場景的結合度日益深化, 應用成熟度和商業化程度將持續升級。在這里,將對我國大數據企業的發展現狀進行觀察與分析。 1. 大數據企業數量平穩增長 根據中國信息通信研究院監測統計, 當前我國活躍的大數據企業共有 3242 家7。大數據企業的快速增長階段出現在 2013 至 2015 年,增長速度在 2015 年達到最高峰。2015 年后,市場日趨成熟,企業新增開始趨于平穩,大數據產業走向成熟。其中企業數量的變化與新政策的出臺密不可分。2015 年 8 月國務院頒布促進大數據發展行動綱要,大數據由此正式上升為國家發展戰略。2016 年工信部印發了大數據產業發展規劃(2016-2020 年),推動大數據
55、產業進一步發展。另一方面,新一代信息技術、智慧城市、數字中國等發展戰略逐步推動社會經濟數字化轉型,大數據的產業支撐得到強化,應用范圍加速拓展,產業規模實現相應快速增長。 7 中國信通院根據公開監測、獲取到的企業信息,結合企業介紹、主營業務及服務介紹及相關其他信息,按照從事數據生產、采集、存儲、加工、分析、服務等業務類型對企業進行篩選和分類得到。 大數據白皮書(2020 年) 24 數據來源: 中國信息通信研究院,2020 年 10 月 圖 7 大數據企業數量增長統計 2. 10-100 人的小型企業占主導 我國目前大數據領域的企業超 3,000 余家,而超 70%的大數據企業為 10 人至 1
56、00 人規模的小型企業,在產業蓬勃向上的發展階段離不開中小企業發揮其在創新創業中的重要作用。政策上伴隨“新基建”成為拉動國內經濟發展的新一輪驅動力,大數據中小企業面臨的外部市場環境和依托的基礎設施也發生重大變化從而影響企業規模分布。 數據來源: 中國信息通信研究院,2020 年 10 月 圖 8 大數據企業規模分布 050010001500200025003000350001002003004005006007002010201120122013201420152016201720182019年累計企業數年新增企業數年新增年累計大型企業(300人), 523中型企業(100300人), 833
57、小型企業(10100人), 3534微型企業(300人)中型企業(100300人)小型企業(10100人)微型企業(10人)大數據白皮書(2020 年) 25 3. 地域分布以北上廣為主 根據統計,我國大數據企業主要分布在北京、廣東、上海、浙江等經濟發達省份。受政策環境,人才創新,資金資源等因素影響,北京大數據產業實力雄厚, 大數據企業數量約占全國總數的 35%。 依托京津冀大數據綜合試驗區,天津、石家莊、廊坊、張家口、秦皇島等地大數據產業蓬勃發展,依靠良好的政策基礎、科研實力、地理位置和交通優勢, 分別形成了大數據平臺服務和應用開發、 數字智能制造、旅游大數據等創新企業集聚中心,在信息產業領
58、域形成了競爭優勢。 2020 年, 隨著數字經濟發展熱潮興起、 數字中國建設走向深入,我國大數據產業迎來新的發展機遇期, 各區域更重視大數據發展與地區經濟結構轉型升級的緊密結合, 同時各級政府也都更積極地探索數據驅動的政府服務模式創新。 數據來源: 中國信息通信研究院,2020 年 10 月 圖 9 大數據企業地域分布 4. 行業應用領域豐富 北京 35%廣東 18%上海 16%浙江 8%江蘇 5%四川 4%湖北 3%福建 2%湖南 1%陜西 1%其他 7%北京廣東上海浙江江蘇四川湖北福建湖南陜西大數據白皮書(2020 年) 26 根據大數據企業的業務標簽,將 1404 家涉及行業大數據應用的
59、企業進行了統計整理。 圖 9 顯示出行業大數據應用企業涉及的行業分布。從圖中可以看出,金融、醫療健康、政務是大數據行業應用的最主要類型。除此之外依次是互聯網、教育、交通運輸、電子商務、供應鏈與物流、 農業、 工業與制造業、 體育文化、 環境氣象、 能源行業。 數據來源: 中國信息通信研究院,2020 年 10 月 圖 10 大數據行業應用企業類型分布 (四)大數據企業融資趨勢分析(四)大數據企業融資趨勢分析 本白皮書還統計了我國大數據企業獲得投融資的情況8。 1. 企業服務為主要融資領域,金融和醫療前景可期 從融資細分領域分布來看,大數據行業融資企業分布在近 20 個領域,大數據行業迎來歷史新
60、機遇,在企業服務、醫療健康、金融等垂直細分領域的大數據應用展現出巨大潛力。 大數據產業增量藍海市場正在逐步打開,截止到 2019 年,企業服務領域的企業獲投占比最 8 中國信通院根據專業行業投融資數據庫進行數據篩選、清洗,并聯合大數據企業信息完成整體處理和分析得到。 金融30%醫療健康14%政務13%互聯網8%教育8%交通運輸6%電子商務4%其它17%金融醫療健康政務互聯網教育交通運輸電子商務其它大數據白皮書(2020 年) 27 高為 62%,金融行業次之為 13%,健康醫療為 8%。隨著互聯網與移動互聯網的進一步普及滲透,以及 IT 基礎設施的逐步完善,企業服務市場仍將繼續擴大。 數據來源
61、: 中國信息通信研究院,2020 年 10 月 圖 11 大數據企業賽道分布 2. B 輪之后競爭加劇,初創公司經受考驗 從融資輪次上看,大數據行業融資主要集中在早期項目,其中天使輪項目占 33%,Pre-A、A、A+輪項目 40%,合計占比 73%。大部分企業仍處于早期投資占主導的階段, 這也可以佐證投資機構對大數據市場依然充滿信心。隨著行業知識、技術架構等方面日趨成熟,早期初創公司經受過市場的檢驗,贏得了投資人的信任,融資估值也日趨增高。 企業服務62%金融13%醫療健康8%硬件3%汽車交通2%其他12%企業服務金融醫療健康硬件汽車交通其他大數據白皮書(2020 年) 28 數據來源: 中
62、國信息通信研究院 圖 12 大數據獲投輪次分布 四、大數據行業應用 “十三五”期間,我國大數據融合應用能力不斷深化。大數據在工業領域的應用不斷深入拓展,驅動網絡化協同、個性化定制、智能化生產等新業態新模式快速發展。電信、互聯網、金融等重點領域優秀大數據產品和解決方案加速涌現,精準營銷、智能推介等應用日益成熟。疫情監測、病毒溯源、資源調配、行程跟蹤等大數據創新應用場景快速興起迭代,在常態化疫情防控中發揮了突出作用。本章將重點介紹大數據在疫情防控、通信、工業、互聯網及金融行業應用的最新趨勢。 (一)大數據全面助力打贏疫情防控“阻擊戰”(一)大數據全面助力打贏疫情防控“阻擊戰” 2020 年開年之際
63、, 新型冠狀病毒引發的肺炎疫情洶涌而至。 經過全國社會上下艱苦卓絕的努力, 國內疫情防控阻擊戰取得了重大的戰略成果?;仡櫞舜慰埂耙摺睔v程,大數據在疫情監測分析、人員管控、醫療救治、 復工復產等各個方面, 得到了廣泛應用, 發揮了巨大作用,Pre-A,A,A+輪, 1181天使輪, 987B輪, 342C輪及以后, 179戰略投資, 170C輪, 108Pre-A,A,A+輪天使輪B輪C輪及以后戰略投資C輪大數據白皮書(2020 年) 29 為疫情的防控工作提供了強大支撐。 一是疫情分析展現。疫情期間,很多企業選擇從大數據分析和展現入手為政府、公眾和企業的疫情防控提供支撐。通過對人員和車輛流動、
64、資源分布、物流運輸等信息進行全方位、多角度的實時展示,支撐政府的疫情防范管制。通過疫情信息展示、人流遷徙呈現、輿論監測與評價、 民眾信息上報與展示等, 及時為公眾播報疫情信息動態。還有很多企業通過自建或采購疫情分析與展示產品, 實現企業內部疫情的有效防控和管理。 二是疫情防控管制。疫情防范類應用通過模型建立、分析挖掘等手段利用位置數據和各類行為數據實現高危人群識別、 人員健康追蹤、區域監測、市場監管等功能。大量科技企業利用 AI 圖像識別、智能外呼、知識圖譜、安全多方計算、微服務等多項技術,為社會疫情防控及政府決策提供有力支撐。 三是醫療醫治增效。大數據和智能技術在病情診斷、醫學研究、醫療輔助
65、等醫護工作的相關場景中得到了充分應用。 百度研究院開放線性時間算法 LinearFold,提升了新冠病毒 RNA 空間結構的預測速度;浙江省疾控中心基于阿里達摩院研發的 AI 算法上線全基因組檢測分析平臺,有效縮短疑似病例的基因分析時間,且能精準檢測出病毒的變異情況。 四是生活便民舉措。 生活服務類應用也是數據驅動疫情防控的重點突破口。諸多互聯網企業采用 O2O 服務模式,形成線下活動到線上活動的映射。利用大數據技術實現海量生活數據的采集、分類和存儲,為居民提供無接觸外送、實時疫情地圖、互聯網醫療等服務。在便利居民正常生活的同時,確保了各類服務的安全健康。 大數據白皮書(2020 年) 30
66、五是復工復產管理。在復工復產的重要階段,國務院辦公廳電子政務辦指導推出的全國一體化政務服務平臺疫情防控健康信息碼, 解決了數據標準不一致的問題, 實現了跨省跨地區的疫情服務互聯和有序復工復產;百度 Hi 企業智能遠程辦公平臺、阿里“釘釘”、華宇軟件等遠程辦公軟件支撐了政企學的異地協同運轉。 大數據白皮書(2020 年) 31 (二)需求推動通信大數據價值進一步發揮(二)需求推動通信大數據價值進一步發揮 通信大數據作為大數據產業的重要組成部分, 一直備受產業各方 專欄專欄1:通信大數據行程卡有效助力疫情防控:通信大數據行程卡有效助力疫情防控 2020 年 2 月,在工業和信息化部領導下,中國信通
67、院、中國電信、中國移動、中國聯通共同推出“通信大數據行程卡”,并在國務院客戶端微信小程序上線, 為全國 16 億手機用戶免費提供 14天內所到地市信息的查詢服務。 通信大數據行程卡的技術原理是分析手機“信令數據”,獲取用戶設備所在位置信息。 信令數據的采集、 傳輸和處理過程自動化,有嚴格的安全隱私保障機制, 不與其它個人信息進行匹配, 查詢結果實時可得且數據全國通用。行程卡 APP2.0 版本還引入了低功耗藍牙技術 (BLE) , 為用戶提供新冠肺炎密切接觸者追蹤提醒功能。截至 2020 年 11 月,累計查詢量已超過 42 億次。 來源:中國信息通信研究院 圖 13 通信大數據行程卡查詢量變
68、化情況 大數據白皮書(2020 年) 32 關注。我國通信大數據發展迅速,應用市場需求不斷增長,正處于快速發展期。根據 2020 年 8 月工信部發布的數據,1-7 月,全國電信業務收入累計完成 8027 億元,大數據、云計算、數據中心等新興固定業務增長成為電信業務收入增長的第一推動力。數據顯示,1-7 月三大運營商大數據相關的業務收入增速達 47%,增勢顯著。 相對于其他行業,通信大數據具備全面、動態、實時的特點,形成了獨特的優勢: 一是數據資源優勢, 通信數據規模巨大, 基于 16 億移動電話用戶、2 億固定電話用戶、3 億固定寬帶用戶,運營商每天可搜集 PB 級的數據;二是基礎設施優勢,
69、高速的網絡帶寬、全面的網絡覆蓋和高效的網絡運維等為通信大數據的應用提供了可靠保障。 目前, 通信與其他行業間的數據融合成為通信大數據應用的熱點方向,公共安全、民生服務、旅游開發、商業推廣等眾多領域均已有了代表性的實踐案例。在通信大數據的應用中,保護個人信息始終是前提。目前主要的應用場景全部都采用經脫敏、泛化后的數據或不針對特定個人的群體統計數據。 大數據白皮書(2020 年) 33 隨著 5G 的全面商用、物聯網等相關技術的深化拓展和多樣化智能終端的逐漸普及, 可以預期, 通信大數據將有更為廣闊的應用空間?!笆奈濉逼陂g,我國通信大數據將呈現出如下的發展趨勢: 一是合規性要求進一步提升。隨著我
70、國網絡安全法數據安全法的陸續頒布或征求意見,數據安全與合規成為了通信大數據發展的重要基礎。通信大數據涉及用戶廣、社會影響巨大,如何在確保用戶的個人權益的基礎上, 安全合規地發揮數據價值將成為關鍵議題。 專欄專欄2:電信運營商積極探索跨行業數據融合應用:電信運營商積極探索跨行業數據融合應用 當前, 各大運營商都在積極探索大數據商業化運營, 在獲得用戶授權、 保障用戶個人隱私的基礎上, 利用業務運營積累的大數據資源和自身技術能力對外進行商業價值釋放。 通信大數據通信大數據+商業拓展商業拓展。某運營商利用基站定位和大數據分析技術推出了“商鋪選址”業務,面向商業地產、零售連鎖、旅游景區等行業,提供商業
71、選址、位置評估、客流分析等服務。 通信大數據通信大數據+旅游推廣旅游推廣。某運營商通過與地方政府旅游局達成戰略合作, 建設基于通信大數據的旅游產業信息服務平臺, 可以在為游客提供智慧旅游服務的同時, 通過人流統計、 客源分析等幫助旅游景區提升服務質量、制定更優的營銷策略。 通信大數據通信大數據+政府治理。政府治理。某運營商利用基于廣域群體的手機信令數據, 分析用戶群體的活動規律, 在不觸碰市民個人隱私的前提下, 輔助政府部門實時統計轄區內的人口熱力分布, 預測各地區活躍人口的變化趨勢, 為政府部門開展人口統計、 調控與監測提供有力的技術支撐。 大數據白皮書(2020 年) 34 二是價值釋放的
72、路徑更加多元。 隨著多方安全計算等數據流通技術的不斷應用,通信大數據有了更多的價值釋放途徑。例如,可以在運營商環境中布設多方安全計算節點,或通過聯邦學習等方式實現“數據不出門”“可用不可見”。 三是應用模式將更加豐富。 通信大數據的應用正在向“全行業”模式轉變, 覆蓋智慧政府、 城市大腦、 金融風控、 健康醫療、 疫情防控、精準營銷等更多領域。 (三)政策鋪墊為工業大數據提供發展機遇(三)政策鋪墊為工業大數據提供發展機遇 隨著政策環境的鋪墊和工業互聯網基礎設施的逐步完善, 工業大數據迎來重大發展機遇。 工業行業對大數據技術的認知和實踐在幾年間快速積累,技術基礎設施和能力不斷完善,工業大數據的關
73、注焦點從建設工業大數據平臺逐步轉向數據應用解決方案; 大數據在工業行業的應用場景從最初的生產監控到降本增效, 逐步向支撐服務化轉型探索。 2020 年初,工業和信息化部印發工業數據分級分類指南(試行)(工信部信發20206 號),以指導企業提升工業數據管理能力,促進工業數據的使用、流動與共享,釋放數據潛在價值,賦能制造業高質量發展。4 月印發工業和信息化部關于工業大數據發展的指導意見(工信部信發202067 號)從加快數據匯聚、推動數據共享、深化數據應用、完善數據治理、強化數據安全、促進產業發展六個方面全盤布局,系統推進,針對我國工業大數據現階段的發展特點、主要問題和亟待取得突破的重點領域,設
74、置重點任務,精準施策,為工業大數據落地提供良好的政策環境,務實有序推動發展。 大數據白皮書(2020 年) 35 隨著網絡化協同、個性化定制、供應鏈金融等新業態新模式的快速發展,“十四五”期間,我國工業大數據將呈現如下的發展趨勢: 一是積累和拓展更多的應用場景。隨著工業信息化基礎的增強,越來越多的工業企業開始具備數據的積累和掌控能力, 比如能源電力、軌道交通、裝備制造、航空航天等等。工業大數據分析大量應用到生產環節中,如設備健康管理、生產管理優化、生產監控分析、全流程系統性優化、質量管理等,通過大數據賦能企業的生產,保障生產安全、降低生產成本、提升生產效率和產品質量。 二是融合更多相關技術。
75、隨著工業互聯網基礎設施的建設, 5G、物聯網、邊緣計算、區塊鏈等技術將逐步融入工業領域的升級轉型,更高質量地支撐工業大數據采集、匯聚、流通、分析、應用的價值閉環,使工業大數據的數據獲取量更大、數據存儲管理更便捷、數據分析產出更智能, 以此助力更高效的產品工藝研發, 帶動服務模式創新,實現最大化的數據價值變現。 (四)互聯網大數據助推商業模式創新拓展(四)互聯網大數據助推商業模式創新拓展 互聯網行業擁有的數據優勢得天獨厚。一方面,隨著移動信息技術的不斷進步,越來越多、種類各異的互聯網應用迅速落地,使得互聯網行業自身便可產生大規模、多維度、高價值的數據資源;另一方面,互聯網為傳輸數據而生,在“互聯
76、網+”的新經濟形態下,各行業產生的數據資源大都要借助互聯網技術進行流通、共享與交互,互聯網因此匯聚了大規模的數據,并極大促進了數據要素的價值傳導。 作為大數據應用落地成型最早的行業, 互聯網企業深耕于如何將大數據資源轉化為商業價值, 在大數據的助推下進行商業模式的創新大數據白皮書(2020 年) 36 及業務的延伸, 提升用戶體驗, 進行精細化運營, 提高網絡營銷效率。以精準營銷為典型代表的互聯網大數據應用正有力推動著企業升級思維,創新模式,以數據驅動重構商業形態。 2020 年國務院政府工作報告中提出要“全面推進互聯網+”,打造數字經濟新優勢, 互聯網與大數據融合應用的能效將得到進一步發揮。
77、“十四五”期間,我國互聯網大數據呈現出如下的發展趨勢: 一是互聯網大數據的規模將迅速擴大,維度更加豐富?!笆奈濉逼陂g將進入萬物互聯時代,消費互聯網向產業互聯網轉型,物聯網蓬專欄專欄3:互聯網大數據重構商業營銷模式:互聯網大數據重構商業營銷模式 互聯網大數據很大程度地改變了傳統意義的營銷手段。 已往的營銷主要依賴品牌推廣, 根據群體解析; 而大數據分析挖掘通過用戶數據分析,市場趨勢解析、觸達場景解析、營銷推廣產品評析, 洞悉營銷推廣對象的訴求點, 利用智能推薦技術, 實現了真實意義 上的人性化精準營銷。 同時, 互聯網大數據還實現了線下門店和線上營銷渠道的結合,讓傳統意義的營銷手段直接進入到多
78、屏時代。 例如,某電商平臺通過客戶的網絡瀏覽記錄和購買記錄等對 客戶的收入、家庭結構、購買偏好等進行消費行為分析與預測。從消費者進入網站開始,平臺在列表頁、單品頁、購物車頁等 4 個頁面部署了 5 種應用不同算法的推薦欄為其推薦感興趣的商品,從而提高商品曝光率, 促進交叉和向上銷售。 引入大數據進行精準營銷后,平臺下定訂單轉化率增長了 66.7%,下定商品轉化率增長了 18%,總銷量增長了 46%。 大數據白皮書(2020 年) 37 勃發展,對人的特征和行為數據的刻畫維度將更加豐富,業務數據規模同步增大,加之各類傳感器的普及使得物的數據被大量采集,互聯網數據量級將邁上新的臺階。 二是技術的不
79、斷發展將推動互聯網數據加速流通。隱私計算、區塊鏈等數據流通技術的快速發展增強了數據流通過程的安全性, 為數據要素的可信流通提供了有力支撐?!盎ヂ摼W+”的內核是數據流動,作為信息技術能力和數據資源的富礦, 互聯網大數據應用將進一步消除壁壘,在行業內部、跨行業間加速數據流通與融合應用。 (五)金融大數據應用成為行業核心競爭力(五)金融大數據應用成為行業核心競爭力 在全球數字化轉型的熱潮之中,金融行業一馬當先。金融機構具有龐大的客戶群體,企業級數據倉庫存儲了覆蓋客戶、賬戶、產品、交易等大量的結構化數據,以及海量的語音、圖像、視頻等非結構化數據。這些數據背后都蘊藏了諸如客戶偏好、社會關系、消費習慣等豐
80、富全面的信息資源,成為金融行業數據應用的重要基礎。 隨著金融業務與大數據技術的深度融合,數據價值不斷被發現,有效促進了業務效率的提升、金融風險的防范、金融機構商業模式的創新以及金融科技模式下的市場監管。目前,金融大數據已在交易欺詐識別、精準營銷、黑產防范、信貸風險評估、供應鏈金融、股市行情預測等多領域的具體業務中得到廣泛應用。 大數據的應用分析能力,正在成為金融機構未來發展的核心競爭要素。 大數據白皮書(2020 年) 38 毋庸置疑,金融大數據擁有廣闊的發展前景,然而金融大數據應用也面臨著數據質量不高、合規和安全風險嚴峻等一系列制約因素?!笆奈濉逼陂g,我國金融大數據將呈現如下的發展趨勢:
81、一是跨機構數據融合需求更加強烈。長期以來,金融機構在自身經營發展的過程中積累了大量的業務數據, 但是內部數據往往來源單一、片面,無法支撐多樣、全面、深入的數據分析需求。為了能夠全面洞察客戶需求、預測經營風險、支撐經營決策,引入外部數據實現跨機構間的數據融合變得尤為重要。 二是數據安全與合規管理更加重要。中國信通院發布的2018-2019 年度金融科技安全分析報告 顯示, 針對客戶資料與企業重要業務數據的安全事件是金融機構發生頻率最高的風險事件,占比 44%。隨著監管部門對數據安全和個人隱私保護日益重視, 在強監管態勢下,金融行業如何保障數據安全及合規使用, 已成為當前亟需解決的問題。 專欄專欄
82、4:金融大數據成為智能風控的重要基石:金融大數據成為智能風控的重要基石 智能風控是金融領域大數據應用的最主要手段, 通過建立大數據風險控制模型, 分析客戶所需承擔的信用風險, 實時計算統計結果,實現對客戶的精準信用評分和征信結果。 隨著與人工智能等技術的結合, 大數據風控進一步實現了業務流程的智能化,大大提高了金融機構的效率和風控能力。根據中國智能風控市場調研報告,隨著信貸、保險等領域業務需求的日益強烈,我國智能風控行業市場規模逐年擴張,從 2015 年的 19.1億元增至 2019 年的 51.2 億元,預計 2020 年規模達 78 億元。 大數據白皮書(2020 年) 39 五、數據治理
83、 關于數據治理的概念界定,一般有廣義和狹義之分。狹義的數據治理主要是指對數據進行治理的技術與活動, 是組織內部對數據的處置與應用進行規范化的過程; 而廣義的數據治理則是通過多樣化治理手段激活與釋放數據要素價值的一套行為體系, 是發展數字經濟的關鍵所在。 從廣義的角度,我們認為數據治理是企業、政府、社會、市場等多參與主體,通過技術、制度、人員、法律等多種方式,實現提升數據質量與應用價值、促進數據資源整合與流通共享、保障數據安全等目標的一整套行為體系。在數據治理的實施過程中,組織內部的數據管理, 組織間社會化的數據流通和覆蓋數據全生命周期的安全保障是三個關鍵議題。本章將針對以上三點的現狀與熱點進行
84、簡要介紹。 (一)組織內部的數據管理能力逐步提升(一)組織內部的數據管理能力逐步提升 在企業和政府的數字化轉型過程中, 數據是基礎性和戰略性資源。只有夯實數據管理之基,才能提升數據資源質量,支撐上層的數據流轉與應用,充分發揮數據資源的價值。 1. 企業積極實踐數據資產管理 不同行業的數據資產管理實踐模式有所差異。經過多年發展,企業數據資產管理的理論基礎已逐步成熟, 形成了以國際數據管理協會(DAMA)的數據管理模型、數據治理研究所(DGI)的數據治理框架等為代表的理論框架,我國也于 2018 年發布了國家標準 GB/T 36073-2018 數據管理能力成熟度評估模型,簡稱 DCMM。但在大數
85、據白皮書(2020 年) 40 各行業的具體實踐中,理論的共性逐漸被行業的個性所替代。例如,金融行業普遍“管理制度先行”,針對性的建立數據質量部門、數據標準部門、數據開發部門、數據分析部門等相關管理部門,數據資產管理活動側重于監管數據治理、信息系統、數據安全、應急預案?;ヂ摼W企業通常 “實踐探索先行”,將數據模型、數據倉庫、數據分析作為核心應用, 隨著網絡數據安全保護能力專項行動的開展和個人信息保護的加強, 數據安全也逐漸成為互聯網企業的關鍵數據資產管理活動。 不同行業的數據資產管理綜合能力差距明顯。結合 DCMM 對于數據資產管理綜合能力的等級劃分(如表 2 所示),與在 DCMM 貫標與評
86、估工作中對各行業實踐現狀的觀察與總結可以發現,金融、電信、 互聯網等行業的數據資產管理綜合能力多處于穩健級和量化管理級,其它行業多數仍處于初始級和受管理級。 表 2 數據資產管理能力劃分9 數據戰略數據戰略 數據治理數據治理 數據架構數據架構 數據應用數據應用 數據安全數據安全 數據質量數據質量 數據標準數據標準 數據生存數據生存 周期周期 初始級初始級 僅在項目范圍建立了數據戰略 項目層面實現了數據治理 應用系統層面建立了數據架構 項目層面開展數據應用 項目層面開展數據安全管理 項目層面制定了數據質量提升方案 定義了項目范圍的數據標準 項目層面開展數據生存周期管理 受管理級受管理級 數據戰略
87、和業務戰略關聯并實施 部門層面明確了數據職責和數據制度 針對數據管理具體問題構建相對完善的數據架構 部門層面多以線下方式進行數據應用 部門層面建立了數據安全標準和管理策略 部門層面識別了關鍵數據質量需求并逐步提升 定義了部門范圍的數據標準并逐步落地標準 部門層面明確數據需求、數據設計開發、數據運維和數據退役規范 9 此處數據治理為狹義概念。 大數據白皮書(2020 年) 41 穩健級穩健級 建立反映整個組織發展的數據戰略優化路線圖并實施 組織層面建立了完善的數據組織、數據制度體系 組織層面建立了數據模型、數據分布、數據集成與共享、元數據及其管理規范 組織層面以提升數據價值為驅動力,充分利用各類
88、技術平臺全面進行數據分析、開放共享和數據服務 建立組織級數據安全團隊和管理制度,充分識別和滿足數據安全監管要求 確立了組織級數據質量關鍵問題和提升目標,制定了數據質量改善路線并實施 創建了組織級的業務術語、參考數據、主數據、數據元和指標數據及其管理制度,數據標準全面落地 數據生存周期管理覆蓋了組織范圍數據以及數據采集、存儲、加工、退役全流程 量化管理級量化管理級 基于數據戰略量化指標持續跟蹤優化 建立數據組織和數據制度考核指 建立了評價數據架構的量化指標體系 建立數據應用的評價指標以衡量數據價值 根據內外部環境變化,不斷調整數據安全策略 形成數據質量提升方案閉環,從源頭改善質量 對數據標準體系
89、和落地效果不斷改進 數據生存周期管理有效支撐數據戰略和數據應用 優化級優化級 數據戰略有效提升企業競爭力并成為行業標桿 數據組織和制度有力支撐數據管理工作 參與數據架構國際和國家標準制定,持續對外輸出優秀經驗 數據應用為企業和社會創造價值 參與數據安全國際和國家標準制定 數據質量管理實踐具有先進性 參與國際、國家、地方和行業相關數據標準制定 來源:GB/T 36073-2018數據管理能力成熟度評估模型,中國信息通信研究院 金融、電信、互聯網行業的數據資產管理能力優勢集中于數據戰略、 數據治理、 數據架構和數據生存周期方面。 在金融行業, 已有 67%的金融機構建立了組織級的數據治理架構并明確
90、了相關管理層職責,85%的機構表示已經將數據治理納入到組織年度戰略規劃中,67%的機構建立了全行統一的大數據分析平臺10,并開展數據應用、數據服 10 數據來源:2019 年度中國金融行業數據治理調研報告 大數據白皮書(2020 年) 42 務相關的培訓宣貫。在電信行業,以中國聯通為例,在 2014 年就開始了組織層面的數據資產管理綜合能力建設,實現了 31 個省公司指標數據和明細數據的一致,建立了包括信息化管理委員會、數據治理辦公室、業務數據管理單位和數據生產單位在內的組織架構,并于2019 年啟動企業級數據中臺建設, 實現了 BOM 全域物理集中和邏輯集中。在互聯網行業,以滴滴為例,在 2
91、017 年成立了數據治理部、數據架構部、數據平臺部和數據科學部,利用大數據平臺對數據全生存周期的管控,并通過將數據科學家分散至各業務部門的方式,加深數據需求與業務需求的融合。此外,中國互聯網協會于 2020 年 7 月成立了數據治理工作委員會,通過搭建公共平臺、制定共同標準等推動互聯網行業數據治理能力的提升。 其它行業數據資產管理能力不足的主要原因包括信息化基礎薄弱、 數據管理投入人員和專業水平不足、 數據資產管理驅動力受限等。以工業為例,在信息化基礎方面,相較于頭部行業成熟的大數據平臺和正在建立的數據基礎設施, 工業企業依然停留在 ERP、 CRM、 SCM的管理軟件階段,使得企業級數據采集
92、、存儲和分析的成本較高,目前 41%的工業企業仍然使用手工或文檔方式進行數據管理11;在數據管理投入人員和專業水平方面, 將近一半的工業企業在數據管理環節投入的人數為 5 人以下,未建立專業的數據管理團隊;在數據資產管理驅動力方面,數據多用于監控生產運營和設備故障,數據應用場景狹窄,缺少數據資產帶動業務發展的強驅動力。 2. 政府數據管理水平不斷提升 11 數據來源:工業企業數據資產管理現狀調查報告(2018) 大數據白皮書(2020 年) 43 作為“數字中國”的有機組成部分,建設“數字政府”成為近年來各地積極推進的重要工作,在夯實數據基礎之上,通過“用數據說話,靠數據決策,依數據行動”,增
93、強政府決策的科學性、預見性和精準性。自 2014 年部分省市陸續成立大數據局開始,截至目前,全國共有 20 個省級政府和 80 個以上的副省級和地級市政府成立了專門的職能機構,對政府內部的數據資源進行統一協調管理。在此基礎上,各地政府采取了多項舉措進一步加強數據管理能力。 一方面,多地頒發的政府數據管理辦法明確了數據權責清單。各級政府紛紛建立數據統籌集約管理機制, 建立覆蓋數據資源全生命周期的管理制度體系和標準體系。一般的,由當地政府統一領導,各地各部門按照省統一的標準規范和要求,組織開展數據治理專項工作,由大數據主管機構負責指導、監督、管理和協調工作,并對各級行政機關和企事業單位的數據資源管
94、理情況進行考核, 各級行政機關和企事業單位依據“三定權責”進行數據共享開放,并開展數據管理。 以廣西為例,自 2019 年 11 月以來,自治區大數據發展局圍繞廣西政務數據資源管理與應用改革,加快完成政務數據“聚通用”工作。截至目前, 共發布了 自治區廳局數據治理試點協同推進工作方案 、廳局中臺建設工作指引、數據治理實施方案等 11 項標準規范;相關試點廳局開展的數據治理工作共梳理了 479 項權責、740 個事項、1908 條資源目錄,接入 29 個系統、歸集 10 億條數據、制定669 條數據標準,全區已基本形成一云承載初步實現、一網通達逐級貫通、一池共享雛形初顯、一事通辦已見成效和一體安
95、全有序實施的“五個一”政務數據治理新模式。 另一方面,各地加強了對數據質量、數據標準、數據目錄、元數大數據白皮書(2020 年) 44 據、數據采集、數據審計和數據安全等方面的要求。包括確保數據真實準確和完整及時、按照相關技術標準對數據進行結構化處理(據統計,各地開放數據集中滿足可機讀格式標準的比率達到 82%12)、數據目錄更新維護、明確元數據信息、采用“一數一源”采集原則、建立日志記錄以確保數據使用過程可追溯、數據分類分級等。同時,各地政府也有序推動各類數據建庫工作,深化基礎數據庫共建共用,促進政務數據共享開放,充分挖掘分析公共數據潛在價值。 以海南為例, 2019 年, 海南省政府基于當
96、時政務大數據平臺數據采集全面性不足、數據實時性不夠、數據質量有待提升、數據服務出口不統一、數據完整性較差、缺少實時數據服務等現狀,提出建設基礎數據質量提升工程。截至目前,海南省政務大數據公共服務平臺已完成元數據管理系統、數據質量管理系統、數據標準管理系統、數據分析系統、共享體系等系統的完善升級,構建了數據指標管理系統與標簽管理系統,并實現了 317 個政務系統,43037 張表,77 萬個信息項,48 億條記錄數的歸集。 (二)(二) 組織間的數據共享與流通加速推進組織間的數據共享與流通加速推進 作為重要的生產要素, 在提升組織內部數據管理能力的基礎之上,政府與企業之間、 企業與企業之間自由有
97、序的數據流通與共享亦是數據要素價值充分釋放的關鍵。 1. 各地政府數據開放共享效果顯著 相對企業數據來說,政府的數據資源規模更大、種類更多,且事 12 數據來源:2020 聯合國電子政務調查報告 大數據白皮書(2020 年) 45 關百姓生活的方方面面,數據的潛在價值巨大,政府數據的開放將為推進數字經濟高質量發展提供巨大能量。 一方面,各地政府數據開放共享的制度體系逐步完善。根據中國信通院統計,截至目前,除黑龍江以外,全國共有 30 個省份出臺了56 份政府數據開放的相關政策文件(如表 3 所示)。在確定數據共享開放內容方面,各地堅持需求導向、目標導向,征求行業協會、相關企業、 社會公眾和行業
98、主管部門的意見建議, 形成數據開放目錄清單,并動態調整。在共享開放數據范圍方面,由政府數據擴展至企事業單位所涉及的公共數據資源,據統計,全國開放數據集總量從 2017 年到 2019 年增加了 6 倍13。 在共享開放數據成果形式方面, 提供包括服務應用、數據可視化、研究成果、創新方案等數據共享開放形式。 表 3 各?。▍^、市)政務數據開放相關政策文件 地區地區 政策文件政策文件 發布時間發布時間 貴州 貴州省政府數據共享開放條例 貴州省政務信息系統整合共享工作方案 貴州省政務數據資源管理暫行辦法 2020.09.25 2017.10.13 2016.11.01 重慶 重慶市公共數據開放管理暫
99、行辦法 重慶市政務數據資源管理暫行辦法 重慶市政務信息資源共享開放管理辦法 重慶市政務信息系統整合共享工作方案 2020.09.11 2019.07.31 2018.05.05 2017.10.09 天津 天津市公共數據資源開放管理暫行辦法 2020.07.21 浙江 浙江省公共數據開放與安全管理暫行辦法 浙江省公共數據和電子政務管理辦法 2020.06.12 2017.05.01 廣西 加快推進廣西政務信息系統整合共享實施方案 廣西政務數據資源管理與應用改革實施方案 廣西政務信息資源共享管理暫行辦法 2020.03.23 2019.11.02 2016.10.21 山東 山東省電子政務和政務
100、數據管理辦法 山東省政務信息系統整合共享實施方案 山東省政務信息資源共享管理辦法 2019.12.25 2017.10.22 2015.03.01 13 數據來源:2020 聯合國電子政務調查報告 大數據白皮書(2020 年) 46 遼寧 遼寧省政務數據資源共享管理辦法 遼寧省政務信息系統整合共享實施方案 2019.11.26 2017.08.16 上海 上海市公共數據開放暫行辦法 上海市公共數據和一網通辦管理辦法 上海市政務數據資源共享管理辦法 2019.08.29 2018.09.30 2016.02.29 吉林 吉林省公共數據和一網通辦管理辦法(試行) 吉林省加快推進政務信息系統整合共享
101、工作方案 2019.01.04 2017.11.22 廣東 廣東省政務數據資源共享管理辦法(試行) 廣東省政務信息系統整合共享工作方案 2018.11.29 2017.10.30 湖北 湖北省政務信息資源共享管理辦法 2018.09.26 寧夏 寧夏回族自治區政務數據資源共享管理辦法 寧夏回族自治區政務信息系統整合共享分工方案 2018.09.04 2017.10.09 內蒙古 內蒙古自治區政務信息資源共享管理暫行辦法 2018.06.15 海南 海南省公共信息資源管理辦法 海南省政務信息整合共享專項行動實施方案 2018.05.25 2017.09.30 河南 河南省政務信息資源共享管理暫行
102、辦法 河南省政務信息系統整合共享實施方案 2018.01.08 2017.09.29 北京 北京市政務信息資源管理辦法(試行) 2017.12.27 西藏 西藏自治區政務信息系統整合共享實施方案 2017.12.22 云南 云南省政務信息資源共享管理實施細則 2017.12.22 湖南 湖南省政務信息系統整合共享實施方案 湖南省政務信息資源共享管理辦法(試行) 2017.12.19 2017.11.22 江蘇 江蘇省政務信息資源共享管理暫行辦法 江蘇省政務信息系統整合共享工作實施方案 2017.10.26 2017.09.07 福建 福建省政務信息系統整合共享實施方案 福建省政務數據管理辦法
103、福建省政務信息共享管理辦法 2017.10.25 2016.10.15 2010.11.12 山西 山西省政務信息系統整合共享工作方案 2017.10.12 甘肅 甘肅省政務信息系統整合共享實施方案 2017.09.30 河北 河北省政務信息系統整合共享實施方案 河北省政務信息資源共享管理規定 2017.09.22 2015.11.13 陜西 陜西省政務信息系統整合共享實施方案 陜西省政務信息資源共享管理辦法 2017.09.13 2017.08.16 江西 江西省政務信息系統整合共享實施方案 江西省政務信息資源共享管理實施細則 2017.09.13 2017.01.16 大數據白皮書(202
104、0 年) 47 安徽 安徽省政務信息系統整合共享實施方案 安徽省政務信息資源共享管理暫行辦法 2017.08.23 2017.02.21 青海 青海省政務信息系統整合共享工作方案 2017.08.01 新疆 關于推進新疆維吾爾自治區政務信息資源共享管理工作的實施意見 2017.05.20 四川 四川省政務信息資源共享管理實施細則(暫行) 2017.03.05 來源:根據公開資料整理,中國信息通信研究院 另一方面,各地政府數據開放共享的落地實施進展加快。截至2020 年 4 月底,全國已有 130 個省級、副省級和地級政府上線了數據開放平臺14,具備包括數據檢索、數據申請、數據獲取和數據探索等基
105、本能力,形成了省市分級維護數據資源、協同共享數據資源體系的局面。 以深圳市政府數據開放平臺為例, 從2016年11月上線以來,截至 2020 年 7 月, 平臺訪問次數近 2478 萬次, 數據總量近 2.7 億條,內容涉及教育科技、交通運輸等 14 個領域。 同時,多地舉辦數據創新應用活動,推動政府數據開發利用,激發政府數據活力。深圳、貴陽、上海、杭州、成都等地連續舉辦了開放數據應用創新大賽,在進一步推動政府部門開放數據的同時,也提升了政府數據資源利用效率,激發社會創新活力。以深圳市 2020 年開放數據應用創新大賽為例,開放了 2 億 7 千條脫敏后的真實數據,涉及疫情防控、環境保護、社會
106、治理、醫療健康等多個領域,誕生了如“疫情防控下空間智能支持居民生活保障”、“城市地攤經濟解決方案”等數據利用成果。 2. 數據交易市場建設正在努力探索 要實現政府、企業等組織外部社會化的、自由有序的數據交易與 14 復旦 DMG,2020 中國政府數據開放報告,https:/ 大數據白皮書(2020 年) 48 流通需要建立規范有序的交易市場來提供健康發展的土壤。 來源:中國信息通信研究院 圖 14 國內大數據交易市場建設歷程 我國的數據交易產業起步于 2014 年,隨著我國大數據元年的到來一同開啟,各地政府積極支持。2014-2016 年間,國內大數據交易所呈井噴態勢,各地開花,不到三年的時
107、間里先后成立了 13 家大數據交易所(中心、平臺)。但幾年時間過去,各家交易所的運營情況大多不盡如人意,數據交易的成交量遠低于預期設想,甚至很多已經陷入擱置、停運狀態,數據交易產業仍處在小規模探索階段。 究其原因,主要在于數據交易所的定位和模式未明、數據交易配套的法律痼疾未祛。 一方面, 各交易所建設時的定位相似、 功能重復,在缺少核心競爭優勢的同時,服務模式、定價標準等交易規則體系參差混亂,難以培養數據供需雙方對交易所的平臺依賴,只能淪為小規模數據交易的撮合者。另一方面,數據權屬的界定仍處于灰色地帶,在相關立法尚未健全的當下, 行業內的實踐中并未能形成具有共識性或參考性的權屬分割規則,產權爭
108、議、無法監管的風險令供需雙方望而卻步。除此之外,頻發的數據安全和個人隱私泄露事件加劇了社會對數據交易的不信任感,出于對國家安全、個人信息和商業秘密的保護,主體參與數據交易的主動性、積極性因此降低,成為數據交易所大數據白皮書(2020 年) 49 發展的又一大障礙。 隨著中央提出加快培育數據要素市場的愿景, 以及新的市場環境和技術條件,大數據交易市場又出現了新的生機,我國國內的數據交易產業重新起航。 自 2019 年年底以來,各地重新布局數據交易產業的腳步加快。在各地 2020 年政府工作報告中,湖北省提出將籌建湖北大數據交易集團,天津濱海新區提到要加快建設北方大數據交易中心。2019 年12
109、月 11 日, 山東數據交易公司在濟南揭牌成立, 并聯合上海、 江蘇、安徽的數據交易機構共同發起成立華東數據聯盟, 孵化跨省市的數據交易流通生態。2020 年 7 月 14 日,湖南大數據交易中心正式開工建設,預期年內完成基本建設。8 月 12 日,北部灣大數據交易中心在南寧揭牌,作為國際化數據資源交易服務機構,面向中國與東盟區域提供全鏈條、一站式的數據服務。 北京探索建設國際大數據交易所。2020 年 9 月 5 日,北京市委宣布將建設國際大數據交易所。9 月 7 日,北京國際大數據交易所設立工作實施方案正式發布,其建設目標定位于國內領先的大數據交易基礎設施和國際重要的大數據跨境交易樞紐。
110、北京國際大數據交易所明確了五大功能定位: 一是權威的數據信息登記平臺,通過充分的信息披露明晰數據的取得方式及權利范圍;二是受到市場廣泛認可的數據交易平臺,健全報價、詢價、競價和定價機制,對數據產品的所有權交易、使用權交易、收益權交易和跨境交易進行劃分并提供多種交易模式; 三是覆蓋全鏈條的數據運營管理服務平臺,提供數據清洗、法律咨詢、價格評估、分析、評議、盡職調查等全鏈條的服務;四是以數據為核心的金融創新的服務平臺,探大數據白皮書(2020 年) 50 索開展基于數據資產的質押融資、保險、擔保、證券化等金融創新服務;五是新技術驅動的數據金融科技平臺,深入挖掘多方安全計算、區塊鏈等技術在數據安全、
111、數據應用等方面的作用并充分運用。 中央支持深圳建設粵港澳大灣區數據平臺。 2020 年 10 月 11 日,中共中央辦公廳、國務院辦公廳發布深圳建設中國特色社會主義先行示范區綜合改革試點實施方案(2020-2025 年),支持深圳在更高起點、 更高層次、 更高目標上推進改革開放。 其中在數據要素方面,提出了“率先完善數據產權制度,探索數據產權保護和利用新機制,建立數據隱私保護制度。試點推進政府數據開放共享。支持建設粵港澳大灣區數據平臺, 研究論證設立數據交易市場或依托現有交易場所開展數據交易。開展數據生產要素統計核算試點”的要求,為深圳乃至整個粵港澳大灣區數據要素市場化配置提供了整體思路。 表
112、 4 新設大數據交易所(中心)的基本情況 建設進程建設進程 功能定位功能定位 服務模式服務模式 覆蓋的數據資源覆蓋的數據資源 山東數據交易公司山東數據交易公司 已揭牌成立 省級綜合性數據服務平臺 提供數據交易平臺、數據產品開發、 數據應用、 公共數據資源開放及其他類型等五大類服務 以公共數據資源為基礎,吸引商業數據資源; 依托華東數據聯盟, 吸引跨省數據資源 湖南大數據交易中心湖南大數據交易中心 預期年內完成場地的基本建設 具有全國、全球影響的數據集聚、流通、應用的數據資源交易場所 采取“淘寶”的運營模式, 為有交易需求的數據資源提供數據存儲、 定價、 交易、監管服務 作為國家地理空間信息中心
113、的南部分中心, 匯聚湖南、福建、廣東、海南等南方九省的地理信息空間數據資源, 并以此為基礎, 整合政務數據、 通信運營商數據、 互聯網企業數據、金融數據等; 北部灣大數據交易中心北部灣大數據交易中心 已揭牌成立 以“政府指導, 自主經營, 市場化運作”為原則的國際化數以交易傭金、 授權使用費、資源使用費、定制產品開發費、 數面向國內和東盟地區各國匯聚、 處理、 使用和交易各類數據產品 大數據白皮書(2020 年) 51 據資源交易服務機構和數據服務全生態交易平臺 據深度加工服務費等為盈利模式 北京國際大數據交易所北京國際大數據交易所 啟 動 建 設(由具有優質數據資源的市屬國企對現有交易所 進
114、 行 重組、更名) 數據信息登記平臺; 數據交易平臺;數據運營管理服務平臺;數據資產金融創新服務平臺;數據金融科技平臺 基于五大功能定位提供數據信息登記服務、 數據產品交易服務、 數據運營管理服務、 數據資產金融服務和數據資產金融科技服務 北京市政府部門 (含具有公共事務職能的組織) 將數據目錄中的公共數據通過無條件開放和授權開放形式有序匯聚; 同時, 驅動商業數據聚集 來源:根據公開資料整理,中國信息通信研究院 (三)(三) 數據安全治理成為不可忽視的焦點數據安全治理成為不可忽視的焦點 作為生產要素,數據的需求與應用日益廣泛,數據要素價值的釋放路徑更加多元, 但無論是組織內部的數據應用還是組
115、織間的數據流通,數據面臨的安全風險也隨著其價值的逐步凸顯而更加突出。一方面, 數據應用的復雜性和數據分析挖掘的多樣性增加了數據權屬管理和抵御安全攻擊的難度;另一方面,越來越多的跨組織間數據流通進一步加速了數據被盜用、誤用、濫用的安全風險。近年來,數據安全事件的層出不窮使得數據安全治理也成為各界無法忽視的焦點問題。 1. 數據安全標準制度體系逐步構建 數據安全管理的相關標準制度不斷完善。 2019 年 8 月 30 日, 信息安全技術 數據安全能力成熟度模型(GB/T 37988-2019)簡稱DSMM(Data Security Maturity Model)正式成為國標對外發布,并已于 20
116、20 年 3 月起正式實施。 DSMM 從數據采集安全、 數據傳輸安全、數據存儲安全、數據處理安全、數據交換安全、數據銷毀安全六個維度提出了覆蓋全生命周期的數據安全能力要求, 為各類組織開展數據大數據白皮書(2020 年) 52 安全治理提供指引。 除國家標準外,工信部于 2020 年 3 月 4 日印發工業數據分類分級指南(試行),指導工業領域產品和服務全生命周期產生和應用的數據的分類分級工作。更進一步地,于 4 月 10 日發布網絡數據安全標準體系建設指南(征求意見稿),提出了“到 2021 年,初步建立網絡數據安全標準體系”,“到 2023 年,健全完善網絡數據安全標準體系”的標準制度建
117、設目標。中國人民銀行于 2020 年 9月 23 日發布 金融數據安全 數據安全分級指南(JR/T 01972020)金融行業標準,明確了數據安全定級的要素、規則和定級過程,并給出了金融業機構典型數據定級規則供實踐參考。 行業級數據安全合規的監管行動正在積極開展。2019 年 7 月 1日,工信部印發電信和互聯網行業提升網絡數據安全保護能力專項行動方案,開展為期一年的專項行動,集中開展數據安全合規性評估、 專項治理和監督檢查, 推動建立行業級的網絡數據安全保障體系,促進電信和互聯網行業提升數據安全管理提升, 有力推動了行業數據安全治理體系的構建。2020 年 5 月 14 日,工信部發布了20
118、20 年電信和互聯網企業網絡數據安全合規性評估要點,明確了行業數據分類分級、安全評估、安全認證、預警處置等關鍵制度規范和要求。 2. 企業數據安全治理實踐逐步深入 頻發的數據安全事件為企業造成了巨大損失, 在標準制度提供指引和政府監管力度不斷增強的背景之下, 各行業企業對于數據安全治理的自主意識不斷增強,企業級的數據安全治理實踐不斷深入。 一方面, 重視數據安全制度建設成為各類企業共識。 實現數據安大數據白皮書(2020 年) 53 全治理,需要制度流程、技術手段與組織人員三位一體、高度融合。其中,建立完善的數據安全管理制度是重要基礎。在實踐過程中,各行業企業紛紛建立起了覆蓋“事前預防-始終監
119、控-事后處置”全流程的制度規范體系。 以小米集團為例, 在小米的安全保障體系中, 建立了事前安全防范、 事中安全管控、 事后稽核審計的一整套完整安全管理制度。 其中,事前安全防范包括制定數據安全管理細則與完善審批流程、 大數據資產管理、數據分類分級制度與合作方調研審查;事中安全管控包括數據權限管理、數據共享管理、合作方數據安全管理與個人信息保護;事后稽核審計包括數據安全審計、數據安全預警與應急處置??梢钥吹?,在這樣的數據安全制度體系中,不僅針對企業內部數據的管理與應用進行管控, 對于企業外部數據的流通共享也建立了針對性的管理制度,可以覆蓋到數據價值流轉的各個環節。 另一方面,數據安全技術應用是
120、保障企業數據安全的重要支撐。在完善制度體系的基礎之上, 建立完整可靠的數據安全技術體系更是抵御內外部數據安全風險的關鍵。在傳統信息安全涉及的網絡安全、主機安全和應用安全的基礎之上,覆蓋數據采集、存儲、挖掘到銷毀等全生命周期的技術安全保障更為重要。 以聯通為例, 聯通大數據在企業數據安全治理實踐中建立了完整的技術保障體系。在數據采集環節進行數據分類分級、身份認證、數據加密;在數據存儲環節進行數據脫敏、細粒度權限與訪問控制、多副本多節點備份;在數據挖掘環節對數據使用行為進行監測;在數據發布環節進行內容審計、數據溯源與合規管控;在銷毀環節進行定期銷毀。此外,聯通通過開發數據資產地圖、數據安全網關、全
121、息審計大數據白皮書(2020 年) 54 平臺等配套產品保障了企業內部數據安全治理實踐的技術應用。 除此之外,多方安全計算、可信執行環境等“數據可用不可見”的隱私計算技術也在企業間數據流通環節中發揮了重要作用, 幫助企業數據安全治理構建了有效的數據閉環。 大數據白皮書(2020 年) 55 六、大數據法制 大數據產業在發揮資源稟賦效應的同時,也催生出諸多隱患,如侵犯個人信息和隱私,泄露國家秘密,數據被截獲、篡改和偽造,數據權屬不明,數據壟斷以及不正當競爭等15。近年來我國數據立法進程不斷加快。2020 年 7 月, 中華人民共和國數據安全法(草案)面向公眾公開征求意見。作為數據安全領域的上位法
122、, 數據安全法(草案)在數據分級分類、監測預警和應急處置等數據安全相關的各項管理制度和數據安全責任體系構建等方面提出要求。 但從目前的條款設置來看,可實際操作落地的具體化規定仍然不足,在如何劃分重要數據的權屬邊界、數據交易如何進行等問題還有待進一步落實。 推進大數據產業的創新發展,必須加強領域內的法律建設,構建公平、自由、有序的市場競爭環境。本章將重點對近年來我國數據立法的主要著眼點進行梳理。 (一)強化個人權益,個人信息保護立法加快(一)強化個人權益,個人信息保護立法加快 數據立法缺失反映最為突出的問題是非法獲取、 分享和交易導致的個人信息泄露與濫用。騷擾電話、短信、郵件泛濫,個人財產損失和
123、名譽損害事件屢見不鮮。 下表列舉了我國近年來涉及個人信息保護的主要規范。 表 5 個人信息保護相關的主要規范 生效時間生效時間 文件名稱文件名稱 發布部門發布部門 2012 關于加強網絡信息保護的決定 全國人大常委會 2013 消費者權益保護法 全國人大常委會 15 詹馥靜,王先林:反壟斷視角的大數據問題初探,載價格理論與實踐2018 年第九期,第 37頁。 大數據白皮書(2020 年) 56 2013 電信和互聯網用戶個人信息保護規定 工業和信息化部 2014 網絡交易管理辦法 國家工商行政管理總局 2015 中華人民共和國刑法修正案(七) 全國人大常委會 2017 中華人民共和國網絡安全法
124、 全國人大常委會 2017 關于辦理侵犯公民個人信息刑事案件適用法律若干問題的解釋 最高人民法院 最高人民檢察院 2019 App 違法違規收集使用個人信息行為認定方法 國家互聯網信息辦公室、工業和信息化部辦公廳、公安部辦公廳、國家市場監督管理總局辦公廳 2019 兒童個人信息網絡保護規定 國家互聯網信息辦公室 2019 國務院關于在線政務服務的若干規定 國務院 2019 中華人民共和國電子商務法 全國人大常委會 2021 民法典 全國人民代表大會 來源:根據公開資料整理,中國信息通信研究院 2020 年 10 月, 中華人民共和國個人信息保護法(草案) 公布,草案確立了個人信息處理應遵循的原
125、則, 即強調處理個人信息應當采用合法、正當的方式,具有明確、合理的目的,處理信息應當遵循公開、透明的原則。草案在個人信息處理規則的章節明確了個人信息處理的主要合法性基礎,包括:(一)取得個人的同意;(二)為訂立或者履行個人作為一方當事人的合同所必需; (三) 為履行法定職責或者法定義務所必需;(四)為應對突發公共衛生事件,或者緊急情況下為保護自然人的生命健康和財產安全所必需等; 這些合法情景結合了實踐中數據處理的多種場景,例如:此次疫情中政府提供的“健康碼”服務,其數據處理的合法性可以滿足第四項要求;此外,這一章節還從共同處理、委托處理、合并分立、與第三方合作處理等多個角度規定了個人信息處理的
126、具體規則。 草案 首次將國家機關全面納入到個人信息保護法規制范圍內,是目前草稿最大的亮點。專門增加一節規定:國家機關處理個人信息大數據白皮書(2020 年) 57 的,應當具有法定職權,并按照法定權限、程序進行。這將有助于整體社會的個人信息保護水平, 并推動國際社會對中國個人信息保護制度的認可,為后續推進跨境數據流動機制提供了積極條件。 此外, 草案還對各界普遍關注的敏感個人信息進行了特殊保護,即要求在具有特定目的和充分必要性的前提下,獲得個人的單獨或書面同意, 另外還應當告知處理個人敏感信息的必要性及對個人的影響。 (二)堅持多邊合作,數據跨境流動立法加強(二)堅持多邊合作,數據跨境流動立法
127、加強 在數字經濟發展的今天, 數據只有實現在更大范圍內的流動共享,才能更好地發揮對經濟增長、 社會發展、 全球化進程的支撐推動作用。隨著經濟全球化發展進程的加快,數據的跨境流動需求日益增強,必須在法規制度、責任體系、安全風險防范等方面上做好保障。 當前, 世界多國通過國內立法或國際協定等方式快速推進數據跨境流動規則制定。例如,2019 年 9 月,日本與美國簽署的貿易協定提到,“確保各領域數據無障礙跨境傳輸”以及“禁止對金融業在內的機構提出數據本地化要求” , 希望制定旨在促進數據自由流動的規則。特別是在新冠疫情背景下, 各國在數據跨境流動領域頻繁發力16。 2020年 3 月,基于合法使用境
128、外數據明確法,澳大利亞聯邦政府修訂電信(攔截和接入)法案,允許協議國在出于執法目的時,互相跨境訪問通信數據。2020 年 6 月,英國宣布脫歐后的未來科技貿易戰略,允許英國和某些亞太國家間的數據自由流動,并希望與日本等國達成比其作為歐盟成員國時期更進一步的數據協議。 歐盟最高法院 16姜穎:全球數據跨境流動發展態勢及建議,中國信息通信研究院政策與經濟研究所。 大數據白皮書(2020 年) 58 出于對歐盟公民數據隱私安全的考慮,于 2020 年 7 月宣布廢除隱私盾(Privacy Shield)跨大西洋數據保護協議。 近年來,我國加強了數據跨境流動領域決策部署,以網絡安全法為基礎,進一步進行
129、了制度探索,有關情況如下表所示: 表 6 我國數據跨境流動的相關政策法規及標準情況 名稱名稱 發布時間發布時間 發布部門發布部門 相關條文相關條文 數據安全法 (草案) 2020.07.03 全國人大常委會 第十條 國家積極開展數據領域國際交流與合作,參與數據安全相關國際規則和標準的制定,促進數據跨境安全、自由流動。 海南自由貿易港建設總體方案 2020.06.01 中共中央國務院 11.便利數據流動。在國家數據跨境傳輸安全管理制度框架下,開展數據跨境傳輸安全管理試點,探索形成既能便利數據流動又能保障安全的機制。 信息安全技術 個人信息安全規范 (GB/T 352732020) 2020.03
130、.06 中華人民共和國國家質量監督檢驗檢疫總局 中國國家標準化管理委員會 9.8 個人信息跨境傳輸 在中華人民共和國境內運營中收集和產生的個人信息向境外提供的,個人信息控制者應遵循國家相關規定和相關標準的要求。 中國 (上海) 自由貿易試驗區臨港新片區總體方案 2019.07.27 國務院 (九)實施國際互聯網數據跨境安全有序流動。試點開展數據跨境流動的安全評估,建立數據保護能力認證、數據流通備份審查、跨境數據流通和交易風險評估等數據安全管理機制。 個人信息出境安全評估辦法 2019.06.13 國家互聯網信息辦公室 全文 數據安全管理辦法(征求意見稿) 2019.05.28 國家互聯網信息辦
131、公室 第二十八條 向境外提供個人信息按有關規定執行。 第二十九條 境內用戶訪問境內互聯網的, 其流量不得被路由到境外。 信息安全技術 數據出境安全評估指南 (征求意見稿) 2017.08.30 全國信息安全標準化技術委員會 全文 個人信息和重要數2017.04.11 國家互聯網信息全文 大數據白皮書(2020 年) 59 據出境安全評估辦法(征求意見稿) 辦公室 網絡安全法 (中華人民共和國主席令第 53 號) 2016.11.07 全國人大常委會 第十二條 國家保護公民、 法人和其他組織依法使用網絡的權利,促進網絡接入普及,提升網絡服務水平,為社會提供安全、便利的網絡服務, 保障網絡信息依法
132、有序自由流動。 第三十七條 關鍵信息基礎設施的運營者在中華人民共和國境內運營中收集和產生的個人信息和重要數據應當在境內存儲。因業務需要,確需向境外提供的,應當按照國家網信部門會同國務院有關部門制定的辦法進行安全評估;法律、行政法規另有規定的,依照其規定。 來源:根據公開資料整理,中國信息通信研究院 在網絡安全法出臺之前,我國未對跨境數據流動作出系統性規范。 網絡安全法第三十七條原則上禁止我國境內關鍵基礎設施運營者向境外提供在中國境內收集和產生的個人信息或重要數據, 可見我國目前對于關鍵領域數據保護采取了傾向數據本地化存儲的態度。但我國并非完全禁止跨境數據流動,網絡安全法第三十七條對向境外提供個
133、人信息和重要數據的活動設置了安全評估的前提性要求,把安全評估辦法的制定權力賦予國家網信部門,其可會同國家有關部門對安全評估制定具體的操作制度。 我國在加強數據跨境流動法律建設的同時也在推動試點以探索合理的跨境流動方式。2020 年 6 月 1 日,中共中央、國務院印發海南自由貿易港建設總體方案,標志著海南自由貿易港的建設進入全面實施階段。方案指出要建立健全數據出境安全管理制度體系、健全數據流動風險管控措施。 國務院于 2019 年 8 月 6 日發布的 中國 (上海)自由貿易試驗區臨港新片區總體方案也指出,試點要開展數據大數據白皮書(2020 年) 60 跨境流動的安全評估,建立數據保護能力認
134、證、跨境數據流動和交易風險評估等數據安全管理機制。 (三)明確權利屬性,數據權屬立法探索初現(三)明確權利屬性,數據權屬立法探索初現 大數據創造了財富, 但現在面臨著數據權屬不清楚因而收益分配不清楚的現實問題, 這反映了加快數據所有權研究和立法的緊迫性和必要性。 深圳經濟特區數據條例首次規定了數據權,并被納入 2020年擬新提交審議項目(以下簡稱條例)。條例在數據確權、組織機構、 公共數據開放利用等方面進行了大膽的創新和嘗試。 然而,條例存在超權立法的可能性。根據立法法第八條,涉及民事基本制度和基本經濟制度,以及對非國有財產的征收、征用的事項,只能通過制定法律給予規制。但條例第一百零一條規定,
135、個人數據包括個人信息數據和隱私數據, 直接將個人數據權屬賦予了人格權屬性,涉及我國民事基本制度。第四條規定,數據權包括權利人對數據的處分、收益、損害賠償權力,給數據權賦予了財產權力的屬性,涉及基本經濟制度。 “數據權屬”問題是一直影響數據資產化、 數據交易的老大難問題,這主要是因為數據有著不同于土地、 資本等傳統生產要素的特點數據不僅是生產要素,也附著了社會關系,各方主體對數據的權益都有所投射,在數據處理周期中,難以將權屬歸于單一的主體。 需要看到的是,“數據權屬”雖沒有明確定論,但并不會構成對數據開放利用的阻礙;相反,數據價值開發在根本上并不取決于傳統的所有權定性,而是通過多方的市場參與,達
136、成數據共享利用、促進價大數據白皮書(2020 年) 61 值生成的市場共識規則。因此,可以通過吸收市場實踐共識,來逐步確定相關權屬分配和競爭規則,建立數據市場基本秩序。例如在近年來的司法實踐中,逐步建立了 “用戶授權”+“平臺授權”+“用戶授權”的三重授權原則來解決權屬問題。這些司法認定與規則,與今年四月中央關于構建更加完善的要素市場化配置體制機制的意見中指出的“研究根據數據性質完善產權性質”這一基本精神相符, 在一定程度上,可以為未來數據權屬的相關立法提供參考支撐。 大數據白皮書(2020 年) 62 七、展望與建議 黨的十九屆五中全會指出, 要堅持創新在我國現代化建設全局中的核心地位,把科
137、技自立自強作為國家發展的戰略支撐,堅定不移建設制造強國、質量強國、網絡強國、數字中國。在中共中央關于制定國民經濟和社會發展第十四個五年規劃和二三五年遠景目標的建議中,明確提出要建立數據資源產權、交易流通、跨境傳輸和安全保護等基礎制度和標準規范,推動數據資源開發利用,擴大基礎公共信息數據有序開放,建設國家數據統一共享開放平臺,保障國家數據安全,加強個人信息保護等。這對我國大數據的發展提出了更高、更深刻的要求。 作為生產要素,數據在國民經濟運行中變得越來越重要,數據對經濟發展、社會生活和國家治理已經在產生著根本性、全局性、革命性的影響。 回望“十三五”時期, 我國大數據發展依然面臨著諸多問題。展望
138、未來,我們期待大數據發展可以在下一個五年內繼續突破。 一是進一步推動技術向更加貼近應用需求的方向發展。 優化和提升基礎類技術產品的架構和能力以降低應用成本;加強在自動化、智能化數據管理工具方面的研發投入; 探索挖掘圖分析技術的更多落地場景;扎實推進隱私計算的技術研發,在保障技術安全性的同時著力提升產品性能。 二是進一步提升數據應用的智能化、平民化。增強企業、政府、社會與個人的數據應用意識,打造數據驅動的社會文化模式;加強人才隊伍建設,培養更多數據與業務雙向精通的復合型人才,逐步促進大數據技術融合到日常業務和個人生活的各個環節。 大數據白皮書(2020 年) 63 三是進一步構建更加完善的數據治
139、理體系。加速推進 DCMM 的貫標評估工作,在微觀層面上增強組織內部的數據管理意識;優化數據共享、交易、流通相關的制度規則,打造可信數據服務體系,從宏觀層面上構建自由有序的數據流通環境;同時,強化數據安全監管,開展企業級的數據安全治理評估工作, 全面推進各行業各領域的數據安全治理能力建設。 四是進一步加強數據法律制度體系建設。在強化個人信息保護、數據跨境流動、數據權屬等方面立法的同時,加強反壟斷、反不正當競爭立法執法,通過考察市場的發展趨向、加強相關立法執法的國際合作與交流、 提升執法團隊的專業化水平等改善現行立法制度供給不足的現狀,維護大數據行業發展秩序。 “明者見于無形,智者慮于未萌?!蔽?/p>
140、國提出國家大數據戰略,是緊跟時代步伐順應歷史規律的發展要求,是著眼全球提升國際綜合競爭力的客觀要求,是立足國情推動新舊動能接續轉換的內在要求。以信息化培育新動能,用新動能推動新發展,以新發展創造新輝煌。 我們相信,以大數據為代表的新一代信息技術和產業的發展對于數字中國建設,乃至對于全面建設社會主義現代化國家的征程都將起到至關重要的推動作用。 大數據白皮書(2020 年) 64 參考文獻 1 關于構建更加完善的要素市場化配置體制機制的意見Z. 中共中央, 國務院, 2020. 2 關于新時代加快完善社會主義市場經濟體制的意見Z. 中共中央,國務院, 2020. 3 Digital Economy
141、 Compass 2020R. Statista.2020. 4 數據新視界R.希捷,2020. 5 周濤, 程學旗, 陳寶權. CCF 大專委 2020 年大數據發展趨勢預測. 大數據J, 2020, 6(1): 119-123 6 Top 10 Trends in Data and Analytics, 2020R. Gartner.2020. 7 2019 年軟件和信息技術服務業統計年報R. 工信部運行局,2020. 8 李橋興, 胡雨晴. 大數據產業的屬性與分類界定及其模糊識別研究J. 科技管理研究, 2020, 040(003):163-173. 9 中國大數據產業生態地圖暨中國大數
142、據產業發展白皮書R. 大數據產業生態聯盟,2020. 10 中國智能風控市場調研報告R. 億歐智庫,2018 11 2018-2019 年度金融科技安全分析報告R. 普華永道, 中國信息通信研究院,平安金融安全研究院 12 李偉. 做好數據治理推動數字化轉型J. 中國金融, 2020, No.919(01):42-44. 13 GB/T 36073-2018,數據管理能力成熟度評估模型S. 14 2019-2020 年中國金融行業數據治理調研報告R. 中國計算機用戶協會,2020. 15 工業企業數據資產管理現狀調查報告R. 中國信息通信研究院,2018 16 2020 聯合國電子政務調查報告
143、R. 聯合國,2020. 17 2020 中國地方政府數據開放報告R. 復旦大學聯合國家信息中心數字中國研究院,2020. 18 陳煬. 我國大數據交易的風險問題及規則的構建J. 商情,2020,(2):198. 19 北京國際大數據交易所設立工作實施方案Z. 北京市地方金融監督管理局, 北京市經濟和信息化局,2020. 20 深圳建設中國特色社會主義先行示范區綜合改革試點實施方案(2020-2025年)Z. 中共中央辦公廳,國務院辦公廳, 2020. 21 GB/T 37988-2019, 信息安全技術 數據安全能力成熟度模型S. 22 自治區廳局數據治理試點協同推進工作方案Z. 廣西壯族自治區大數據發展局,2020. 23 郭小偉, 孔碩. 個人信息權的規范構造兼評三部個人信息保護法(專大數據白皮書(2020 年) 65 家建議稿)J. 中國集體經濟, 2020(26). 24 安寶雙. 跨境數據流動:法律規制與中國方案J. 信息安全與技術, 2020, 011(003):1-6. 25 姜穎. 全球數據跨境流動發展態勢及建議, 中國信息通信研究院政策與經濟研究所,2020。 26 詹馥靜,王先林. 反壟斷視角的大數據問題初探J. 價格理論與實踐,2018,(9): 37.