《華為:2024年先進數據存力白皮書加速智能經濟涌現的高性能引擎(93頁).pdf》由會員分享,可在線閱讀,更多相關《華為:2024年先進數據存力白皮書加速智能經濟涌現的高性能引擎(93頁).pdf(93頁珍藏版)》請在三個皮匠報告上搜索。
1、 先進數據先進數據存力:存力:加速智能經濟涌現的“高性能引擎”加速智能經濟涌現的“高性能引擎”執行摘要執行摘要 展望未來,人類文明正加速從數字展望未來,人類文明正加速從數字化化邁向智能邁向智能化化。以大模型為代表的原生 AI 應用從走向千行百業,以其涌現的智能為帶來組織生產力躍遷、使能產業升級、提升社會福祉,乃至強化各國競爭力。智能時代智能時代具備具備三三大大核心特征核心特征。一是數據、能源與技術的重要性提升,升級為智能時代三大核心生產要素,促進通用智能“涌現”,二是智能的涌現將端到端重塑企業數據治理范式、加速數據要素市場規?;l展,三是“通用 AI 智能體”將出現,并成為千行百業實現生產力躍
2、遷的核心驅動力、使能人類文明精神世界的極大豐富。數據存儲數據存儲產業產業自數字時代起就作為自數字時代起就作為 ICT 核心使能技術之一,核心使能技術之一,持續持續賦能產業與社會經濟發賦能產業與社會經濟發展。展。在如今的智能時代,為應對全球數據量快速增長、數據要素市場蓬勃發展、原生 AI 應用智能涌現、網絡安全環境日趨復雜、數據產業的低碳綠色發展需求深化等關鍵產業趨勢,數據存儲產業應從“存力”邁向“先進數據存力”數據存儲產業應從“存力”邁向“先進數據存力”。先進數據存力是先進數據存力是智能時代智能時代的重要組成部分的重要組成部分與核心使能技術與核心使能技術,我們認為我們認為先進數據存力在智能先進
3、數據存力在智能經經濟濟中中將持續扮演“高性能引擎”將持續扮演“高性能引擎”的的角色角色,可有力驅動數據要素規?;l展、使能社會經濟智能化。為落實落實自身在智能經濟中的定位定位、良好地適配智能經濟適配智能經濟的產業環境,我們認為先進數據存力的核心發展目標有三。一是集約化匯聚全域異構數據集約化匯聚全域異構數據,二是高效高效安全可靠的數據存安全可靠的數據存儲儲,三是高效使能多元化應用生態高效使能多元化應用生態。從價值和影響力看,從價值和影響力看,1 GB 先進數據存力投入預計能帶來先進數據存力投入預計能帶來 60 元元 GDP 的增長的增長,其,其在賦能產在賦能產業升級、提升社會民生福祉與強化區域競
4、爭力三大領域可產生顯著價值業升級、提升社會民生福祉與強化區域競爭力三大領域可產生顯著價值。賦能產業升級方面賦能產業升級方面,到 2030 年先進數據存力自身自身有潛力成長為成為千億級美金產業千億級美金產業;此外還將直接帶動全球數據要素市場帶動全球數據要素市場規?;l展,有望在 2030 年達至少 3000 億億級美金;還可作為數智化解決方案的組成部分,使能使能 10 萬億美金萬億美金級智能經濟的發展 2 提升社會福祉方面提升社會福祉方面,先進數據存力的應用有潛力帶動全球及中國數據中心降碳 16%與24%,并作為以數智化解決方案的重要組成部分持續賦能政府治理與民生福祉水平的提升,到 2030 年
5、預計為全球及中國社會分別帶來 3 萬億美金萬億美金及 1 萬億美金萬億美金的經濟效益 強化區域競爭力強化區域競爭力方面,方面,先進數據存力賦能新質生產力的發展。AIGC、元宇宙、腦機接口、量子信息、人形機器人、生物制造、未來顯示、未來網絡與新型儲能等 9 大未來大未來產產業業均需先進數據存力均需先進數據存力的使能、方可充分發揮其價值的使能、方可充分發揮其價值 雖然先進數據存力可有效賦能千行百業加速數智化轉型,但不同行業企業所面臨的情景與業務需求不盡相同。因此,全球各區域與企業應體系化規劃并推進先進數據存力的建設全球各區域與企業應體系化規劃并推進先進數據存力的建設、以正確且全面的認知對先進數據存
6、力進行適度超前的持續投資、以應對智能經濟時代的業務挑戰。具體而言,我們建議企業從從 6 大維度出發綜合考量先進數據存力的建設大維度出發綜合考量先進數據存力的建設:容量規劃、資源利用率、性能要求、安全可靠防勒索、方案級 TCO 與原生 AI 應用賦能。為使能全球各區域與各行業企業科學客觀地評估自身在先進數據存力建設現狀,評估未來建設先進數據存力的具體策略,我們于本白皮書發布了“先進數據存力指標體系“先進數據存力指標體系”,并對全球并對全球主要經濟體進行了主要經濟體進行了梳理分析梳理分析,并將全球各區域細分為“普惠閃存型”、“充足傳統型”、“精益聚焦型”與“后發漸進型”4 大大類類 “普惠閃存型普
7、惠閃存型”國家存力充足性以及閃存化率均較高,通過定位全球存儲產業地位、出臺激勵與規范政策、推動聯合創新以及鼓勵頭部企業采納先進方案,全面發展國家先進數據存力產業,這些國家未來將繼續強化在存儲技術創新、數據安全與可持續性方面的投入,鞏固其全球領導地位 “充足傳統型充足傳統型”國家存力充足性處于世界領先地位,但閃存化率低于全球平均。這些國家通常已有較好的存力容量,但閃存化進程緩慢,未來可考慮通過政策支持加速全閃化方案在數據中心場景的替換 “精益聚焦型精益聚焦型”國家閃存滲透率高,但存力充足性較低。這些國家未來需加強對新興產業的支持,并通過普及先進數據存力技術,使更多中小企業和個人受益 “后發漸進型
8、后發漸進型”國家存力充足性和閃存化率均較低,發展較緩慢,但擁有“彎道超車”的潛力,這些國家可以通過直接投資全閃化方案,跳過傳統存力技術階段,實現快速發展 對有志于發展先進數據存力產業的國家對有志于發展先進數據存力產業的國家,我們我們有三點核心有三點核心建議建議。首先首先,一個國家需明確認知自身在全球產業格局中的位置,為自身在全球存儲全棧產業生態中進行“戰略定位”(如需全?;l展、還是僅核心零部件的突破)。其次其次,基于產業的“戰略定位”制定發展目標發展目標、提供提供政策支持政策支持、鼓勵技術創新鼓勵技術創新。尤其對中國這種旨在成為全球先進數據存力全棧技術創新引領者的國家而言,以政策支持與產學研
9、協同等機制鼓勵全棧技術創新十分重要。最后最后,各國在市場應用上應在公共部門(如政府及銀行等國有部門)積極開展先進數據存力方案試點,推動先進數據存力應用的落地與規?;l展落地與規?;l展。4 目錄 先進數據存力:加速智能經濟涌現的先進數據存力:加速智能經濟涌現的“高性能引擎高性能引擎”.1 執行摘要執行摘要.1 先進數據存力定位:邁向智能經濟的先進數據存力定位:邁向智能經濟的“高性能引擎高性能引擎”.6 1.1 先進數據存力藍圖.7 1.1.1 智能時代遠景展望.7 1.1.2 先進數據存力藍圖.13 1.2 先進數據存力定位.14 1.2.1“先進數據存力 x 數據要素市場”:數據有序流通的“
10、加速器”.15 1.2.2“社會經濟轉型 x 先進數據存力”:通用智能涌現的“催化劑”.18 1.3 先進數據存力核心目標.20 1.3.1 集約化匯聚全域異構數據.21 1.3.2 安全可靠綠色的數據存儲.23 1.3.3 高效使能多元化應用生態.27 1.4 先進數據存力八大特性.29 1.5 先進數據存力的核心價值及影響力.33 1.5.1 產業發展升級:先進數據存力以“核心 ICT 使能產業 數據要素全產業 產業數字化賦能”三層使能機制,帶動海量產業經濟發展.34 1.5.2 提升社會福祉:先進數據存力使能綠色發展、良政善治與民生體驗優化.36 1.5.3 強化區域競爭力:先進數據存力
11、賦能新質生產力生態發展.39 先進數據存力指標評測:建設指標體系保障先進數據存力高質量發展先進數據存力指標評測:建設指標體系保障先進數據存力高質量發展.45 2.1 發展先進數據存力的六大核心考量因素.46 2.1.1 容量規劃.46 2.1.2 資源利用率.47 2.1.3 性能要求.48 2.1.4 安全可靠防勒索.50 2.1.5 方案級 TCO.51 2.1.6 原生 AI 應用賦能.52 2.2 先進數據存力衡量指標體系.53 2.2.1 區域發展級.54 2.2.2 數據中心級.55 2.2.3 存儲產品級.57 2.3 全球各國先進數據存力發展程度對比.58 2.3.1 體量衡量
12、:充足供應與持續增長支撐經濟社會的可持續增長.58 指標 1 單位 GDP 存儲容量.58 指標 2 數據存力充足性.59 指標 3 數據存留率.60 指標 4 存力投資增長率.64 2.3.2 效率衡量:10 倍性能提升與內生智能特性加速數字經濟規?;鲩L.65 指標 5 通用計算存算比.65 指標 6 閃存占比.67 2.3.3 基本保障:滿足安全穩定的基本發展要求.68 指標 7 災備覆蓋率.68 2.3.4 前沿創新:綠色先進實現可持續發展需求.70 指標 8 單位存儲容量能耗.70 指標 9 數據存力專利占比.71 2.4 全球各區域發展存力的高階發展建議.73 2.4.1 全球各區
13、域存力發展現狀.73 2.4.2 典型國家建設先進數據存力的核心啟示.75 行動倡議:發展先進數據存力是實現新質生產力行動倡議:發展先進數據存力是實現新質生產力.84 3.1 先進數據存力產業發展目標建議.85 3.1.1 將數據存儲作為 ICT 產業的重要獨立門類單獨管理.85 3.1.2 確保先進數據存力產業全棧自主可控高效協同,強化先進 SSD 顆粒的國際定價權獲取 85 3.1.3 推進以全閃化為核心的先進數據存力方案在千行百業的廣泛應用.86 3.2 建設先進數據存力發展高階行動建議.87 3.2.1“定目標”:將區域級先進數據存力指標體系納入政府產業發展目標.87 3.2.2“巧引
14、導”:圍繞先進數據存力產業發展目標,制定監管與鼓勵性政策.87 3.2.3“促應用”:積極推動先進數據存力方案的在金融、政務、電信等關鍵行業的應用,鼓勵國產開源數據庫等開源軟件生態發展.88 3.2.4“強創新”:資助并以產學研聯合實驗室為核心載體,提前布局超算存儲等 N+1 代先進數據存力解決方案.89 附錄附錄 1:參考文獻:參考文獻.91 6 先進數據先進數據存力存力定位定位:邁向智能經濟的“高性能引擎”邁向智能經濟的“高性能引擎”先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 1.1 先進數據存力藍圖先進數據存力藍圖 1.1.1 智能智能時代時代遠景展望遠景展望
15、回顧歷史回顧歷史,三,三次工業革命為人類帶來了深遠的變革次工業革命為人類帶來了深遠的變革。第一次蒸汽時代通過機械化生產提升了生產力,第二次電氣時代通過電力驅動的廣泛應用顯著提升了生產力,前兩次以硬件創新為核心,帶來了物理世界的生產力躍遷。第三次信息革命則構建了一個數字化的世界,輔助并豐富了物理世界。展望未來,人類文明將從數字化時代邁入智能化時代,展望未來,人類文明將從數字化時代邁入智能化時代,數字世界與物理世界深度融合,由點及面地增強了由點及面地增強了“數實融合數實融合”進程進程,使能數字技術與實體經濟深度結合,數字智能孿生世界將應運而生。展望展望未來未來,人類,人類文明文明將將從數字從數字化
16、時代化時代邁入智能邁入智能化時代化時代,數字經濟的新階段數字經濟的新階段 智能經濟智能經濟也也應運應運而生。而生。智能經濟在吸取數字經濟發展優秀經驗的同時,還將兼顧到更多的社會發展需求。智能經濟在吸取數字經濟發展優秀經驗的同時,還將兼顧到更多的社會發展需求。6G、AIGC 等下一代技術的無縫融合,將驅動孤立、分散運作的單點智能模式向多智能系統聯動的新模式發展,從而使能智能經濟通過創新型的智能解決方案來提高生產力、提升社會福利和改善環境效益,促進虛實產業的融合發展,帶動新一輪的經濟高速增長。圖 1-1 智能時代遠景展望 8 具體而言,我們認為智能經濟有“三新”具體而言,我們認為智能經濟有“三新”
17、。一是數據、能源與技術的重要性提升,升級為智能時代三大核心生產要素,促進通用智能“涌現”,二是通用智能體的涌現將端到端重塑企業數據治理范式、加速數據要素市場規?;l展,三是“通用 AI 智能體”將出現,成為智能時代千行百業實現生產力躍遷的核心驅動力,豐富人類精神文明。展望一:數據、能源與技術展望一:數據、能源與技術的重要性提升,的重要性提升,升級為升級為智能時代智能時代三大三大核心核心生產要生產要素,促進通用智能“涌現”素,促進通用智能“涌現”首先,智能經濟時的數據量與數據形態復雜度都在持續提升,非結構化數據體量的快速增長首先,智能經濟時的數據量與數據形態復雜度都在持續提升,非結構化數據體量的
18、快速增長與多模態化技術帶來的數據張量化與多模態化技術帶來的數據張量化(Tensor)成為重要趨勢。成為重要趨勢。一方面,數據量正在快速增長數據量正在快速增長,我們預計到 2030 年,全球產生的數據將達到 YB 級,且數據的產生場景將“云邊端泛在化”。在邊側,城市治理的視頻監控、工廠內高清質檢攝像頭產生的圖片、視頻等數據每年有望達到 ZB 級;在端側,手機、PC 與智能網聯電動汽車等千億級智能終端,源源不斷地收集并上傳語音、文字、視頻、圖片等用戶交互及路況導航數據;多行業、多類型的云協同發展、顯著增強數據流動性,使得更多的數據被高效利用。另一方面,數據語義、知識圖譜等技術數據語義、知識圖譜等技
19、術的革新與成熟將牽引海量多模態數據加速整合與普及,將使組織能夠更輕松地收集和處理不同類型的數據(如圖像、語音、文本、傳感器數據等)整合在一起,形成張量化數據集群。正如 AMD Zen 架構設計者、前特斯拉自動駕駛硬件副總裁吉米凱勒預測,“在未來,軟件和硬件將協同進化,向量計算轉向張量計算,推動AI 技術的進一步發展”。海量多模態數據將成為組織在智能經濟時代賦能自身提質降本增海量多模態數據將成為組織在智能經濟時代賦能自身提質降本增效的核心生產要素效的核心生產要素。其次,實現智能涌現將需要以太瓦時其次,實現智能涌現將需要以太瓦時(TWh)為單位的海量能源為基礎,使能大模型等原生為單位的海量能源為基
20、礎,使能大模型等原生AI 應用。應用。根據美國能源資訊署數據,2023 年谷歌和微軟當年各消耗的電力均達 24 TWh,相當于人口 1024 萬阿塞拜疆一整年的用電量,也超過了全球 100 多個國家,如冰島、加先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 納、突尼斯等。在可見的未來,AI 所帶來的電力消耗也會呈現持續上升的趨勢。展望智能經濟時代,承擔 Twh 量級能耗將成為實現智能經濟的基礎。最后,以最后,以 ICT 基礎設施基礎設施(6G、先進數據存力等、先進數據存力等)為核心的數字使能技術,也將有效加速多元為核心的數字使能技術,也將有效加速多元異構數據的規整匯聚,加
21、速“智能涌現”。異構數據的規整匯聚,加速“智能涌現”。無論數據以向量(Vector)還是張量(Tensor)的形式存在、也無論未來數據體量有多龐大,海量的數據都需要被集中匯聚、高效計算、安全可靠存儲與有序流通,才有可能出現智能涌現。展望展望二二:通用智能:通用智能體體的涌現將端到端重塑企業數據治理范式、加速數據要素市的涌現將端到端重塑企業數據治理范式、加速數據要素市場規?;l展場規?;l展 首先,通用首先,通用 AI 智能體會在組織內端到端重塑當前“采集智能體會在組織內端到端重塑當前“采集 匯聚匯聚 治理治理 分發分發 保障”的數保障”的數據治理范式。據治理范式。第一,數據的采集將不僅僅基于既
22、定規則,通用第一,數據的采集將不僅僅基于既定規則,通用 AI 智能體會主動要求新數據點的采集與形智能體會主動要求新數據點的采集與形成以供自身主動學習成以供自身主動學習。智能體從網頁、邊緣、終端等場景采集多元化的數據海量多模態大數據也將作為“養料”,持續提升智能體能力的通用性。第二,源自不同種類、形式、產生場景的海量高價值多模態數據將“奔騰入?!?,最終匯聚第二,源自不同種類、形式、產生場景的海量高價值多模態數據將“奔騰入?!?,最終匯聚于數據中心并加速智能涌現于數據中心并加速智能涌現。根據 IDC 2023 年報告,當前全球產生的數據量中,源自數據中心的占比已超 38%,預計到 2030 年達 5
23、0%以上。第三,在數據治理環節,隨著海量的數據使能數據編織第三,在數據治理環節,隨著海量的數據使能數據編織(Data Fabric)等創新型數據管理范等創新型數據管理范式在千行百業的成熟與普及,而通用式在千行百業的成熟與普及,而通用 AI 智能體將成為數據編織技術的重要參與者。智能體將成為數據編織技術的重要參與者。除了能夠自動完成數據清洗、校驗、確保數據質量與一致性外,智能體還可以根據業務對數據的需求、安全敏感性等因素,對數據生命周期管理與熱溫冷數據分級等數據治理策略類問題數據治理策略類問題,提供實時洞察與建議,確保企業對數據的高效治理、以“硅基智能”使能“碳基決策”以“硅基智能”使能“碳基決
24、策”。userid:529794,docid:175173,date:2024-09-20, 10 第四,通用第四,通用 AI 智能體將深化對數據要素的挖掘,組織內的大部分數據會被更頻繁地反復訪智能體將深化對數據要素的挖掘,組織內的大部分數據會被更頻繁地反復訪問問/復制,更多的數據將被“消費”。復制,更多的數據將被“消費”。當前,在全球所有“產生數據”(Data Generated)中,90%以上的產生的數據是將組織內現有數據復制/備份產生的數據(Data Replicated),而非新發生并被收集的“被創造數據”(Data Created)。隨著通用 AI 智能體對數據要素價值的持續挖掘,其
25、將在組織數據全局可視可管的基礎上,主動為用戶推送數據、提升數據分析效率與數據分析的智能化程度,實現從“人找數據”“人找數據”到“數據找人”“數據找人”的轉變,進而帶動組織組織內熱數據與溫數據的占比將持續提升內熱數據與溫數據的占比將持續提升。最后,硅基智能體的蓬勃發展與組織間通用最后,硅基智能體的蓬勃發展與組織間通用 AI 智能體的交互,以組織間數據交換及數據服智能體的交互,以組織間數據交換及數據服務為核心的數據要素產業將加速發展。務為核心的數據要素產業將加速發展。早在 2016 年,19 歲的美籍華裔天才少年 Alexandar Wang 與 MIT 同窗 Lucy Guo 創辦 Scale
26、AI,專注于利用人工智能和機器學習提供高質量的數據標注服務,幫助企業加速其 AI 和機器學習模型的開發、訓練和部署。在短短 8 年的時間內,Scale AI 就成長為硅谷的“明日之星”、估值達 138 億美元,包括 Meta、Uber、摩根大通等多個行業的巨頭均為其客戶。在中國,政府是數據要素產業化發展的重要推動者。在中國,政府是數據要素產業化發展的重要推動者。2019 年是數據要素市場在國家政策層年是數據要素市場在國家政策層面初次被提及的時間,數據被正式確立為與土地、勞動力、資本、技術等并列的生產要素。面初次被提及的時間,數據被正式確立為與土地、勞動力、資本、技術等并列的生產要素。為了充分發
27、揮數據作為新型生產要素的價值,加速數據在不同企業與組織間的流轉,進而推動經濟社會的高質量發展和創新,中國政府采取了舉措。例如,國家數據局國家數據局于 2023 年 10月 25 日正式揭牌,旨在統籌推進數字中國、數字經濟、數字社會規劃和建設,協調推進數據基礎制度建設(包括數據確權、流通、分配和治理等方面的制度建設),統籌數據資源整合共享和開發利用。此外,如雨后春筍般出現并快速成長的數據交易所也是中國數據要素市場的重要組成部分,此外,如雨后春筍般出現并快速成長的數據交易所也是中國數據要素市場的重要組成部分,據截止 24 年 3 月,全國已有近近 50 個個數據交易中心。通過建立場內交易機制壓縮場
28、外交易通過建立場內交易機制壓縮場外交易(Over-the-Counter)空間,確保數據要素的合規、有效流通??臻g,確保數據要素的合規、有效流通。據測算,到 2022 年中國數據先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 要素市場規模已達近 2000 億元,數據資產市場總規模達 8.6 萬億,帶動相關產業數字化潛在受益 34.4 萬億。如果疊加數據資產衍生市場,其潛在總規??赡艹^ 60 萬億。展望展望三三:“通用:“通用 AI 智能體”將出現,成為智能時代千行百業實現生產力躍遷智能體”將出現,成為智能時代千行百業實現生產力躍遷的核心驅動力,豐富人類精神文明的核心驅動
29、力,豐富人類精神文明 數字經濟時代的人工智能應用,更多是基于既定業務規則的算法,這需要開發者進行規則編寫以實現智能,即所謂“在代碼層面上,有多少人工,就有多大智能”,即使組織可以通過Devops 等管理方法實現敏捷研發、借助開源社區的“群策群力”快速構建軟件版本,一個特定用例的智能化程度通常也存在上限。尤其在定制化需求和小規模數據集的人工智能解決方案中,人力資源投入與智能化程度基本近似于線性關系。即使對于中小型卷積神經網絡(CNN)等創新型 AI 應用,也常因數據體量與質量的不足而無法實現“智能涌現”,致使這些應用更多聚集于特定行業、特定場景的特定動作,如診療圖片識別。展望未來,“通用展望未來
30、,“通用 AI 智能體”(智能涌現的超級智能體”(智能涌現的超級 AI 應用)的到來將徹底改變這一現狀。首應用)的到來將徹底改變這一現狀。首先,通用先,通用 AI 智能體超強的技術集成能力、將自身打造為“全能型選手”。智能體超強的技術集成能力、將自身打造為“全能型選手”。例如,通用 AI 智能體能通過集成外掛行業知識庫 RAG 等工具,主動理解行業最新動態、為用戶提供最精準確切的行業信息。其次,通用其次,通用 AI 智能體具備自適應發展特性、確?!爸灰粩嚯娋统掷m學習”智能體具備自適應發展特性、確?!爸灰粩嚯娋统掷m學習”。通用 AI 智能體的智能水平不會隨著人力資源投入的減少而收斂,反而能夠
31、隨著環境和需求的變化自我調整優化,以持續提升智能水平,乃至主動采集和利用新的數據,以豐富訓練數據集和加深對環境的理解。例如,在未來智能 AI 客服有望能根據與客戶的互動,自主學習和改進自己的應答方式,通過分析客戶的反饋和情緒狀態,不斷調整話術和響應策略,從而提供更個性化和有效的服務,而非僅簡單基于規則進行交互。12 此外,通用此外,通用 AI 智能體將具備“基于自然交互的精確執行”能力智能體將具備“基于自然交互的精確執行”能力,這使得它能勝任諸多復雜且需涉及多個操作環節的工作(如客戶服務、運營商網絡運維等),使其成為組織內可媲美諸多“碳基員工”的“硅基專家”,有能力勝任多個崗位的工作、帶來組織
32、的生產力躍遷。我們可以敏捷研發場景為例進行展望,對通用我們可以敏捷研發場景為例進行展望,對通用 AI 智能體對組織效能的提升進行管窺蠡測。智能體對組織效能的提升進行管窺蠡測。首先,通過海量集成 NPL、靜態代碼分析工具、自動化測試工具、可視化等技術,通用 AI智能體可以通過閱讀產品開發文檔(Product Requirement Document)充分理解產品架構的設計。隨后,智能體將自動按照項目開發計劃甘特圖,根據項目的當前進度,在 Backlog 中尋找相應開發任務,并相對獨立地完成軟件特性開發。在編碼過程中,智能體會主動學習過去未能提交到主干(Main Branch)的錯誤代碼以強化自適
33、應糾錯能力、使生成的代碼符合公司編碼規范,并在編寫特性的白盒乃至黑盒類測試不通過時,自動 debug 尋找原因并報錯、形成 Lessons Learnt 并提交質量管理系統備份。通過多次開發任務的執行與持續迭代優化,通用 AI 智能體的編碼表現將遠超大多數碳基員工,并成為實現新一代敏捷開發、與時俱進革新 Devops 內涵的核心驅動力。最后,通用最后,通用 AI 智能體將憑借不斷學習與進化的能力變得更為泛在,從“一個應用程序”走智能體將憑借不斷學習與進化的能力變得更為泛在,從“一個應用程序”走向能與用戶實時主動交互,成為組織打造自身品牌、優化用戶體驗的核心抓手。向能與用戶實時主動交互,成為組織
34、打造自身品牌、優化用戶體驗的核心抓手。正如 Open AI 的董事局主席、Meta 前 CTO 布萊特泰勒所預測,“在未來幾年內,我將不會在各個保險公司的網頁與 APP 間反復切換,與是選擇與 AI 智能體直接對話來為家人添加保費。隨著大語言模型的出現,我認為與軟件直接交流可能是最符合人體工學的軟件交互方式,用戶不再需要反復閱讀產品使用說明書,這種交互范式將重塑品牌的數字體驗?!笨偟膩碚f,通用 AI 智能體將憑借自身技術高度集成化技術高度集成化、自適應發展自適應發展及基于自然交互的精確基于自然交互的精確執行執行這三大特性,對千行百業各個形態的組織進行端到端地重塑,進而大幅度提升產品創新、客戶服
35、務與關鍵業務運作效率,實現生產力的躍遷。先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 此外,通用此外,通用 AI 智能體還可極大地豐富人類的精神文明。智能體還可極大地豐富人類的精神文明。以 AI 賦能的元宇宙為例,它不僅是虛擬活動的延展,更是數字空間與現實世界深度融合的領域。在這個世界中,數據的積累和運用成為推動文明進步的關鍵。隨著數據量的增長,“數實融合”將更加徹底,元宇宙中的虛實交互也會更加精準,個性化體驗隨之提升,增強人們的沉浸感。這不僅顛覆了娛樂、學習和工作的方式,也帶來了文明形態的深刻變革。未來,數據將成為文化和精神傳承的重要載體,推動人類文明朝著虛實融合的更
36、高層次邁進。1.1.2 先進數據存力藍圖先進數據存力藍圖 從定位從定位上看,上看,先進數據存力是先進數據存力是智能時代智能時代的重要組成部分的重要組成部分與核心使能技術,將持續扮演“高性與核心使能技術,將持續扮演“高性能引擎”的角色能引擎”的角色,可有力驅動數據要素規?;l展、使能社會經濟智能化轉型升級。圖 1-2 先進數據存力在智能化時代的重要性 為落實自身定位,我們認為先進數據存力有三大演進方向。為落實自身定位,我們認為先進數據存力有三大演進方向。一是實現異構數據全域采集,二是確保安全可靠降本的數據存儲,三是作為高效使能多元化應用生態。更新一步,基于三大基于三大演進方向演進方向,我們認為先
37、進數據存力具備具備全域泛在、性能躍遷、原生智能、集約架構、多級可靠、主動安全、綠色低碳與開放生態八大特征八大特征。14 從使能場景看,先進數據存力有三大核心價值。從使能場景看,先進數據存力有三大核心價值。一是牽引產業升級,不僅帶動數據存儲產業鏈的發展,還在加速數據要素全產業鏈發展與產業數字化賦能上起到關鍵作用;二是提升民生福祉、帶來良政善治、環境增益與衣食住行等基本民生體驗優化,三是賦能 AI 等新質生產力產業生態的發展、提升區域/國家競爭力。最后,為更好賦能各區域國家與各行業企業評估自身在先進數據存力建設上所處的發展階段、為國家及企業建設先進數據存力的規劃提供參考,本白皮書發布了先進數據存力
38、指標體本白皮書發布了先進數據存力指標體系系,以協助全球各區域政策制定者與企業管理層體系化評估自身在先進數據存力領域的建設現狀,并為適配智能經濟的到來提供先進數據存力的適配智能經濟的到來提供先進數據存力的發展策略發展策略。圖 1-3 先進數據存力藍圖體系 1.2 先進數據存力定位先進數據存力定位 先進數據存力是先進數據存力是智能時代智能時代的重要組成部分的重要組成部分與核心使能技術,我們認為與核心使能技術,我們認為先進數據存力在智能先進數據存力在智能經經濟濟中中將持續扮演“高性能引擎”的角色將持續扮演“高性能引擎”的角色,可有力驅動數據要素規?;l展、使能社會經濟智能化轉型升級。先進數據存力:新
39、質生產力的必由之路先進數據存力:新質生產力的必由之路 一方面,先進數據存力是數據數據要素市場要素市場的的“加速器加速器”,“海納百川”地匯聚多元異構(圖片、語音、視頻、乃至多模型向量)數據、對數據要素進行高效安全存儲、使能高價值數據跨組織有序流轉。另一方面,先進數據存力是使能使能通用智能涌現以實現通用智能涌現以實現社會經濟轉型社會經濟轉型的的“催化劑催化劑”。先進數據存力可有效強化大模型等原生 AI 應用的推理精度、顯著降低推理成本,進而成為實現通用智能涌現的“溫床”,加速千行百業應用邁向智能化。首先,以外掛行業知識庫(RAG)給大模型實時推送最新、最全面的信息,使能大模型大模型等等原生原生
40、AI 應用應用“博聞博聞”;其次,KV-Cache 技術多級緩存構建“HBM DDR SSD”三級緩存機制,實現大容量 SSD 可長期長期保留保留長序列與多輪對話長序列與多輪對話,解決記憶記憶缺失缺失導致交互不連貫導致交互不連貫等問題,實現實現大模型的大模型的“強記”“強記”。1.2.1“先進數據存力先進數據存力 x 數據要素市場數據要素市場”:數據數據有序有序流通流通的“加速器”的“加速器”總的來說,我們認為先進數據存力是數據要素總的來說,我們認為先進數據存力是數據要素市場規?;l展市場規?;l展的“的“加速器加速器”?!?。一方面,數據存儲是數據要素市場的重要組成部分、也是數據要素的核心載體
41、;另一方面,先進數據存力將憑借自身高效匯聚海量數據高效匯聚海量數據、安全可靠綠色安全可靠綠色存儲存儲與高效使能北向應用高效使能北向應用三大核心能力,協助數據產業的規?;l展,保障并牽引數據要素的有效流動。首先,首先,數據存儲本身數據存儲本身就就是數據要素市場的重要一是數據要素市場的重要一環環、也是發展數據要素市場的、也是發展數據要素市場的基礎基礎。從數據存儲的功能定位看,其是數據要素流通的先導環節,也是確保數據要素市場安全規?;l展的底座底座。以中國數據要素市場為例,以中國數據要素市場為例,2023 年市場規模達年市場規模達 1200 億元,其中數據存儲環節占億元,其中數據存儲環節占20%左右
42、,是數據要素市場最大的細分領域之一左右,是數據要素市場最大的細分領域之一。其次,先進數據存力將憑借自身多元異構數據高效匯聚、全鏈路各環節高效備份與使能數據其次,先進數據存力將憑借自身多元異構數據高效匯聚、全鏈路各環節高效備份與使能數據安全可靠流轉等核心能力,成為智能經濟時代數據要素的“安全可靠流轉等核心能力,成為智能經濟時代數據要素的“加速器加速器”,進而使能數據分析、數據加工、數據交易、數據服務、生態保障及數據采集等多個相關環節穩健發展。16 一是在一是在數據采集數據采集環節,環節,先進數據存力以多協議兼容降低采集難度、加速數據要素化進程。先進數據存力以多協議兼容降低采集難度、加速數據要素化
43、進程。多元異構的數據來源將成為千行百業的數據要素化所帶來的必然特征,而由于數據格式與數據類型的差異性,這些來自“千江萬河”的數據往往被存儲在不同的存儲設備中、為數據的流通與匯聚管理造成了極大的挑戰,對數據要素化的進程造成影響。面臨該挑戰,多協議兼容、集約化部署的先進數據存力方案,將極大加速工業數據要素化進程,使得多元異構的源數據真正實現“千江萬河匯聚入?!?,加速工業數據資產化進程、改善制造企業資產負債表。二是數據資產在流通環節的脆弱性,每個在數據要素市場的各個環節,都需要先進數據存力二是數據資產在流通環節的脆弱性,每個在數據要素市場的各個環節,都需要先進數據存力提供高效可靠的備份,使能數據資產
44、的全場景安全存儲。提供高效可靠的備份,使能數據資產的全場景安全存儲。以數據加工環節為例,目前千行百業對高質量數據的需求,為數據加工產業的發展帶來了“源動力”,規?;l展數據加工產業所帶來的就業創造等就業創造等外部性效應外部性效應也被各國政府所重視。例如,Scale AI 專門下設負責招募數據標注員(Data Annotator)的子公司 Remotasks,在全世界范圍內廣泛吸納數據加工工人,用于為客戶提供高質量數據集,給非洲、東南亞等地區帶來了數以百萬計的就業崗位。隨著全球數據要素市場的發展與數據交易所等中介的普及化,我們認為數據在流轉過程中需隨著全球數據要素市場的發展與數據交易所等中介的普
45、及化,我們認為數據在流轉過程中需經過至少經過至少 10 次備份,方可確保次備份,方可確保端到端端到端安全可靠。安全可靠。首先,數據賣方數據賣方需要進行原始數據的初次備份與交易前的完整備份;對于非數據加工或僅提供數據服務的公司,在原始數據的初次備份與交易前的完整備份之間,通常還有若干次組織內的存儲與備份,供組織內部“消費”。其次,數據交易所數據交易所等中介一般有高標準的安全要求,會配置嚴密的備份和恢復方案,以應對各種潛在的風險和威脅,在未來可能至少有 4 個剛性備份場景個剛性備份場景,分別為數據上傳到交易所時的初次備份、交易所的冗余備份、交易過程中的版本備份與交易完成后的安全備份。最后,數據買方
46、有至少數據買方有至少 4 個備份場景個備份場景,分別為獲得數據后的初次備份、買方的冗余備份、定期的內部備份與災難恢復備份。圖 1-4 數據要素市場數據備份鏈路圖 先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 三是先進數據存力可有效使能數據資產的安全流轉三是先進數據存力可有效使能數據資產的安全流轉與與分發分發。在數據分析數據分析環節環節,先進數據存力賦能數據編織,實現全局可視可管,為數據服務提供安全底座,進而主動為用戶送數據、提升數據分析效率與智能化程度;在數據數據交易環節交易環節,先進數據存力與區塊鏈等前沿存儲技術協同,保障賦能,先進數據存力以全??煽糠桨?,確保數據交易
47、可信可控;在數據服務數據服務環節環節,在數據服務商的產業模式下,擁有極致安全的數據存儲系統,可確保安全交易服務、成為賦能數商產業發展的重要基石;在生態保障生態保障環節環節,先進數據存力在存儲層具備的數據加密與隱私保護等特性,為數據要素市場的可持續規?;l展保駕護航。圖 1-5 先進數據存力對數據要素市場的使能 18 事實上,為使能數據要素的高效匯聚、可靠備份、安全存儲與有序流轉,打造專業的數據存事實上,為使能數據要素的高效匯聚、可靠備份、安全存儲與有序流轉,打造專業的數據存儲基礎設施集群已成為智能經濟時代的大勢所趨。儲基礎設施集群已成為智能經濟時代的大勢所趨。例如,中國政府及產業界聯合打造存力
48、中心,積極數據基礎底座,賦能新質生產力,就是以存力加速數據要素發展的業界領先實踐。存力中心推動數實融合,打造端到端數據管理服務中心。存力中心推動數實融合,打造端到端數據管理服務中心。首先,其以區塊鏈技術賦能數據交易、確保數據交易安全可靠、全網共知;其次,支持多源異構數據的存儲協議,如塊存儲、文件存儲、對象存儲等均可支持。以對海量異構數據高效的匯聚能力,有效推動數據對海量異構數據高效的匯聚能力,有效推動數據加工加工的的發展發展,使數據要素從無序低價值到有序高價值;最后,存力中心通過端到端數據要素治理,打造多元化數據服務賦能千行百業、強化社會福祉。例如,存力中心在政務領域打造快速企業資質快速獲取能
49、力并應用于成都等城市,以前需要跑 8-9 個單位才能獲得資質,如今可大幅精簡資質審批流程,實現“上一張網,辦所有事,最多跑一次,一次能辦成”,資質獲取時間縮短至 15-20 天。1.2.2“社會經濟轉型社會經濟轉型 x 先進數據存力先進數據存力”:通用通用智能智能涌現涌現的“的“催化劑催化劑”首先,先進數據存力可有效強化大模型等原生首先,先進數據存力可有效強化大模型等原生 AI 應用的推理表現、應用的推理表現、10 倍以上地降低單倍以上地降低單Token 的推理成本,進而加速“智能涌現”。的推理成本,進而加速“智能涌現”。先進數據存力不是靜態的“倉庫”,而是動態且高度智能的“催化劑”,以優異的
50、讀寫性能與軟件算法等技術,催化通用智能涌現。第一,先進數據存力的“以存強算、以存代算”特性,可有效強化大模型等原生第一,先進數據存力的“以存強算、以存代算”特性,可有效強化大模型等原生 AI 應用的應用的推理表現。推理表現?!耙源鎻娝恪碧匦酝ㄟ^外掛行業知識庫有效提升了推理精度、增強了 AI 在處理長文本和復雜對話中的準確性和連續性,使得大模型在與用戶交互時有能力進行“超長上下文”對話,而不會突然“斷片”;“以存代算”特性則使大模型具備“記憶”能力,通過記錄用戶與模型的交互記住常見問題的答案,并在類似問題出現時,直接調取存儲系統中“現成記憶”,以確保用戶快速得到準確回答快速得到準確回答、避免再次
51、用顯卡推理。先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 第二,第二,10 倍以上地降低單倍以上地降低單 Token 的推理成本,降低大模型訓練門檻。的推理成本,降低大模型訓練門檻。我們以萬卡智算場景為例,經測算當前運營一座能用于大模型訓練與推理的萬卡規模智算中心需要每年投入高可達 10 億人民幣,如果其中 10%的 Token 通過“以存代算”的模式推理出,那么綜合推理綜合推理成本的節降空間在未來可達億元級成本的節降空間在未來可達億元級。事實上,諸多熱門應用場景的 Token 重復率遠超10%,如客戶服務中心大約 60%-80%的查詢是重復性問題,在企業的在線自助服務
52、平臺和用戶論壇中 75%-85%的問題可能是重復性查詢。這意味著“以存強算、以存代算”有著廣闊的應用前景、也將成為“智能涌現”的有效助推器。其次,智能經濟相較數字經濟,還伴隨組織、流程與管理機制的全面革新,而先進數據存力其次,智能經濟相較數字經濟,還伴隨組織、流程與管理機制的全面革新,而先進數據存力在其中將有效加速組織流程與管理機制的創新。在其中將有效加速組織流程與管理機制的創新。例如,在過去幾年中隨著數據量的激增,全球有越來越多的組織強化“首席數據官”“首席數據官”崗位的設置,以強化組織對數據價值的挖掘與安全合規管理。據某全球性企業調研顯示,任命了首席數據官的企業從 2011 年至 2022
53、 年月躍遷了 28.5%,其中北美地區滲透率達到 38.5%,亞太地區也提升至 10.2%。然而,積極以組織變革擁抱數據要素價值的企業在數據管理上面臨著諸多挑戰然而,積極以組織變革擁抱數據要素價值的企業在數據管理上面臨著諸多挑戰。一是各部門可能由于數據標準不統一數據標準不統一,導致數據的轉換與治理的成本隨數據量的提升而快速增長。例如,不同的事業部在如何將管理成本分攤到各產品的問題上可能采取不同的會計處理辦法,使得將這些數據統一并提供給數據需求方時,需要投入額外的成本;二是數據服務的自助化數據服務的自助化與智能化程度有進一步提升空間與智能化程度有進一步提升空間,限制了業務部門對數據的挖掘潛力。例
54、如,諸多部門可能有高頻讀取數據的需求,而這些需求可能因數據提供方是“碳基員工”而無法實現“24 小時自助式數據服務”。面臨種種數據治理與組織管理上的問題,先進數據存力可作為核心使能技術,牽引組織管理面臨種種數據治理與組織管理上的問題,先進數據存力可作為核心使能技術,牽引組織管理與流程體系的創新。與流程體系的創新。例如,該企業可以將公司內部所有系統的數據都匯聚在集約化存儲資源集約化存儲資源池中,以湖倉一體等創新解決方案為載體,對財務職能可能需要用到的所有數據進行統一管理與及時更新;二是建立所有業務職能均可統一訪問交互的 AI 智能體智能體,實現數據服務的 20“自助化”;三是由財務職能確立統一的
55、會計處理準則并輸入智能體,使其能夠理解這些會計處理準則(如成本均攤規則),如有更新需求可統一輸入至大模型,確保無論誰來“取數”結果都一樣,財務職能僅需按需更新維護會計處理準則即可??偟膩碚f,數據治理與構建良性的數據服務,無論對什么行業的組織來說,都是一個“長坡厚雪”的系統工程、需持續投入方有成效。而先進數據存力,為組織管理范式與流程機制的變革提供了新的可能性。先進數據存力,為組織管理范式與流程機制的變革提供了新的可能性。最后,先進數據存力還可在智能經濟時代促進社會的可持續與良性發展、強化各國在未來關最后,先進數據存力還可在智能經濟時代促進社會的可持續與良性發展、強化各國在未來關鍵產業中的競爭力
56、。鍵產業中的競爭力。一方面,智能經濟相較數字經濟更為普惠,除賦能千行百業提質增效外,還可促進綠色發展、良政善治與民生福祉。如將這些成效換算成經濟效益,由先進數據存力牽引的正向社會經濟效益可達萬億級。另一方面,先進數據存力也與諸多中長期應用前景廣闊的產業聯系緊密,布局先進數據存力另一方面,先進數據存力也與諸多中長期應用前景廣闊的產業聯系緊密,布局先進數據存力就有助于強化各國在未來關鍵產業中的競爭力。就有助于強化各國在未來關鍵產業中的競爭力。以中國政府近年提出的“新質生產力”中的9 大未來產業中的量子信息為例,通過先進的數據存儲技術,量子通信網絡能夠更有效地存儲與管理大量的量子密鑰和糾纏態信息,確
57、保這些數據在需要時能夠快速、準確地訪問和使用。例如,當銀行在全球范圍內進行跨國金融交易時,量子存儲器可以安全地存儲和傳輸加密密鑰,確保交易過程中不受黑客攻擊和數據泄露的威脅。1.3 先進數據存力先進數據存力核心核心目標目標 全面審視先進數據存力行業的變化趨勢,我們發現全球數據產業呈現 8 大趨勢大趨勢,對數據存儲行業提出了新的要求?;谌驍祿a業的趨勢與先進數據存力在智能經濟中的定位,我們認為先進數據存力的目標有三。一是集約化匯聚全域異構數據集約化匯聚全域異構數據,對多種類型的數據“海納百川”;二是安全可靠安全可靠綠色綠色的數據存儲的數據存儲、確保數據要素在組織內與跨組織流轉時的安全可靠與先
58、進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 綠色低碳;三是高效使能多元化應用生態高效使能多元化應用生態,先進數據存力以優異的性能,為組織核心系統及二級系統等多元化北向應用(如 AI 大模型)的高質量運行提供有力支撐。圖 1-6 先進數據存力三大發展目標 1.3.1 集約化匯聚全域異構數據集約化匯聚全域異構數據 趨勢一:從區域分布看,全球數據產生量井噴,如何高效利用存儲數據成共性問題趨勢一:從區域分布看,全球數據產生量井噴,如何高效利用存儲數據成共性問題 參考參考 IDC 報告報告,雖然 21-23 年全球各區域增量保持 10%以上以上增長,但與此同時中美集中度進一步提升
59、(兩國占比從 20 年僅左右 50%到 23 年接近 60%)。以美國、中國為代表的大以美國、中國為代表的大國存儲方案與產業發展范式國存儲方案與產業發展范式,將不僅僅與本國存儲產業的發展相關,也將有條件引領全球數據存儲產業發展范式、為其他區域提供“范例”。圖 1-7 全球數據產生量 22 趨勢二:從產生場景看,邊緣場景成數據增速最快的新興場景,但圍繞邊緣的專業存儲方案趨勢二:從產生場景看,邊緣場景成數據增速最快的新興場景,但圍繞邊緣的專業存儲方案當前的應用規模仍有待提升當前的應用規模仍有待提升 根據 IDC 數據圈報告數據圈報告,在“端”(Endpoint)、“核”(Core)、“邊”(Edg
60、e)三側的數據增長中,邊邊側數據以側數據以 30%以上速度快增、超過以上速度快增、超過“核核”(數據中心)與(數據中心)與“端端”,以邊緣為核心場景的數據存儲需求與重要性正快速提升。圖 1-8 全球數據產生場景 先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 趨勢三:從數據產生類型看,非結構數據成為數據增量的主流,異構化存儲勢在必行趨勢三:從數據產生類型看,非結構數據成為數據增量的主流,異構化存儲勢在必行 根據 IDC 數據圈報告數據圈報告,23 年全球數據增量中 80%以上增量來自圖片、視頻等非結構化數以上增量來自圖片、視頻等非結構化數據據,存儲的場景。如何高質效地存好
61、、用好這些非結構性數據如何高質效地存好、用好這些非結構性數據,成為企業與公共部門等數據要素所有方在數據要素加速發展的產業背景下,一個必須回答的問題 圖 1-9 全球數據產生類型 1.3.2 安全可靠安全可靠綠色綠色的的數據存儲數據存儲 趨勢四:從數據安全看,數據勒索事件的發生頻次、損失金額均在迅速提升,攻擊形式也在趨勢四:從數據安全看,數據勒索事件的發生頻次、損失金額均在迅速提升,攻擊形式也在不斷多元化,全棧安全勢在必行不斷多元化,全棧安全勢在必行 當前數據安全形勢正變得更加嚴峻,每年數據勒索事件的發生頻次、損失金額都在快速提升。以美國 FBI 的 IC3 年度報告為例,在 2023 年一年中
62、,美國就遭遇了多達 2825 次錯誤錯誤!未找未找到引用源。到引用源。數據勒索軟件攻擊,直接損失高達 5 千 9 百萬美元,與 2022 年相比,勒索攻擊次數與損失金額分別上升了 18%和 74%。在 2825 次的勒索攻擊中,有 42%的事件都是針對美國的關鍵行業,其中公共醫療、關鍵制造業、政府機關、科技行業和金融服務業分列第一至 24 五位。例如,金融服務行業在 2023 的年度累計統計下平均每起攻擊事件損失 9 百萬美元(含業務中斷和停工損失、數據恢復和修復成本損失、品牌名譽損害以及律師費等)。除更加頻繁的勒索頻次外,損失金額也在不斷提升。除更加頻繁的勒索頻次外,損失金額也在不斷提升。S
63、ophos 的 表明,如不單單考慮贖金支付的損失,平均總成本則達到了支付贖金的支付贖金的 9倍,而在僅僅兩年之后,平均恢復總成本則達到了倍,而在僅僅兩年之后,平均恢復總成本則達到了 15 倍倍2。以中國為例,2023 年,采用雙重/多重勒索模式的勒索組織相比 2022 年新增了 36 個,勒索組織在要求更多贖金的同時,還會竊取企業數據以數據泄露風險威脅企業以及企業合作伙伴,在 2750 起事件中,有超兩成案例竊取了超 500 GB 以上的企業及個人數據。圖 1-10 全球部分區域內的企業受勒索軟件攻擊影響占比 此外此外,網絡攻擊方式與技術也變得更為多元,僅憑傳統的網絡層防護(防火墻等)已不足以
64、網絡攻擊方式與技術也變得更為多元,僅憑傳統的網絡層防護(防火墻等)已不足以應對當前的攻擊形式。應對當前的攻擊形式。例如,數據勒索組織開始更多采用如 BYOVD 技術和離地攻擊技術(LOTL)復雜尖端技術進行勒索攻擊3。攻擊者利用這兩項技術可以利用已知的漏洞驅動程序和合法系統工具繞過系統防火墻,“合理”地收集信息、執行代碼,且黑客可以在不引起警報的情況下惡意篡改、刪除以及竊取數據。先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 在此背景下,企業亟待端到端強化自身安全防護能力,構建“網絡網絡 主機主機 應用應用 存儲存儲”四級安全防護體系勢在必行。而在四級安全防護體系中在四級
65、安全防護體系中,存儲防護是數據安全的“最后一道防最后一道防線線”,其重要性其重要性不容忽視不容忽視。圖 1-11 四級安全防護體系 趨勢五:數據容災備份的投入趨勢五:數據容災備份的投入穩步穩步增長,企業對全閃化備份的投入將進一步提升增長,企業對全閃化備份的投入將進一步提升 Gartner 報告顯示,全球企業對容災備份(Backup&Recovery)的投入穩步增長。例如新加坡、美國、德國在 2023 年的容災備份率相較于 2020 年已增長 7%、5%、9%4。全球的數據要素正在資產化,而且網絡環境越來越復雜,正如趨勢四內容所涉及的數據安全內容,企業對備份產品的安全特性的重視程度也在進一步提升
66、,高效強勁的備份產品也可以極大程度上保證企業的數據安全或挽救企業的損失。以中國金融行業為例,數據要素的快速發展帶來了海量機遇,但也帶來了潛在數據安全風險。盡管銀行等金融機構當前可以通過身份鑒權、報文加密、沙箱檢驗等技術提升數據安全度,乃至建設專線對接政府客戶進行數據交換,但數據安全風險仍然存在。因此因此,部分中國,部分中國國有銀行正在考慮在隔離域國有銀行正在考慮在隔離域 (Airgap)增設增設專為專為跨組織跨組織數據交易數據交易使用的使用的先進先進數據數據備份設備備份設備,以以從根本上從根本上解決解決潛在的潛在的數據數據安全安全隱患隱患。圖 1-12 全球主要區域容災備份增長 26 趨勢趨勢
67、六六:綠色發展成全球多數區域建設數據中心的共識,但如何規?;铱沙掷m低碳發展仍:綠色發展成全球多數區域建設數據中心的共識,但如何規?;铱沙掷m低碳發展仍是一個挑戰是一個挑戰 一方面,一方面,隨著隨著全球主要國家數據中心全球主要國家數據中心 PUE 數據在持續下降,數據在持續下降,IT 設備本身的能耗節設備本身的能耗節降成為重降成為重要要的綠色化發展趨勢的綠色化發展趨勢。例如,美國 PUE 預計從 2019 年的 1.67 降低至 23 年 1.43,中國PUE 從 19 年的 1.46 降低至 22 年 1.25,德國 PUE 從 21 年 1.31 降低至 23 年 1.295。另一方面,俄
68、烏戰爭帶來能源成本上升,使得歐洲區域與中亞等相關對數據中心節能與集約另一方面,俄烏戰爭帶來能源成本上升,使得歐洲區域與中亞等相關對數據中心節能與集約化部署訴求進一步提升,綠色低碳化發展成為更加剛性的需求化部署訴求進一步提升,綠色低碳化發展成為更加剛性的需求,例如歐盟的歐盟能源效率指令、德國的能源效率法和德國數字化戰略都對數據中心綠色化發展有要求,對全球其他國家降低數據中心能耗的指標與規范設定有借鑒意義。圖 1-13 全球部分國家數據中心 PUE 先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 1.3.3 高效高效使能使能多元化多元化應用生態應用生態 趨勢趨勢七七:從應用創
69、新看,以大模型為代表的:從應用創新看,以大模型為代表的 AI 原生應用在訓練與運行時的數據量井噴,也原生應用在訓練與運行時的數據量井噴,也使得數據存儲將在使得數據存儲將在“萬億參數萬億參數”時代發揮關鍵作用時代發揮關鍵作用 隨著參數從千億級千億級向萬億級萬億級、乃至十萬億級十萬億級躍遷,加上數據膨脹倍數帶來的數據體量躍遷,針對大模型的數據存儲方案也面臨革新,更高性能的讀寫帶寬、更快地更高性能的讀寫帶寬、更快地 IOPS、外掛型知識、外掛型知識庫庫等創新性數據存儲方案,將深度賦能大模型訓練。2021 年至 2023 年間,在全球外置數據存儲設備市場,一級系統容量已經提升了 13.82%,一級存儲
70、系統容量從 22082 PB 增長至 25622 PB;同時中國在 AI 大模型成為發展數字經濟的重要節點也在提升一級存儲系統的容量與投資,投資額從 2021 年 24 億美元增至 2023 年29 億美元,而容量也從 4477 PB 增長至 5209 PB,與全球趨勢相同。盡管中國增長喜人,與數據強國美國相比,依然差距明顯,2023 年的中國一級系統容量依然不及美國的一半,但通過統計預測結果,中國的一級存儲系統將在未來保持穩定提升的態勢。圖 1-14 全球部分國家核心系統存儲容量 28 趨勢趨勢八八:隨著企業數據產生量的快速提升,:隨著企業數據產生量的快速提升,二級二級系統的全閃存化趨勢將持
71、續深化系統的全閃存化趨勢將持續深化 根據 Gartner 最新報告,全球二級系統的閃存占比在逐年提升,對外置數據存儲設備市場而言,全球二級系統的閃存投資占比將從 2022 年 14.1%提升至 2027 年 15.4%。整體而言,整體而言,我們認為我們認為全球二級系統的全閃化趨勢全球二級系統的全閃化趨勢將持續深化,將持續深化,其中核心原因有三。其中核心原因有三。首先,隨著企業數據量的持續提升,企業越來越難以滿足在規定的備份時間窗內完成備份,及 RTO 與 RPO 等系統可靠性指標要求的難度在持續提升,使得選型 SSD 的全閃化方案形成一種趨勢。其次,隨著大數據智能分析、湖倉一體等創新性應用的逐
72、漸豐富,也使得企業企業二級系統內的二級系統內的“熱溫熱溫”數據的比重數據的比重持續持續提升提升,這也為性能更為優異的 SSD 方案逐漸將在二級存儲中成為“趨勢性趨勢性剛需剛需”。例如在今年中國“618”打折促銷期間,中國某頭部運營商在連續三天內產生的移動數據所需要的備份時間每天均超過尋常預留備份窗口時間內 HDD 方案備份上限的 10%,因此傳統HDD 方案已明顯不能滿足需求。數據備份設備的全閃化對該運營商而言勢在必行。圖 1-15 全球部分國家二級系統閃存投資對比 先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 1.4 先進數據存力先進數據存力八大特性八大特性 為更好地
73、應對行業發展趨勢,數據存儲產業應從“存力”邁向“先進數據存力”。我們認為,先進數據存力應具備全域泛在、性能躍遷、原生智能、集約架構、多級可靠、主動安全、綠色低碳與開放生態八大核心使能特性。全域泛在:從聚焦數據中心,到多場景泛在化全域泛在:從聚焦數據中心,到多場景泛在化 邊緣數據呈現高度異構化、流通體量大、對集約化要求程度較高等特征,專用化邊緣存儲方案勢在必行。例如,某汽車電子 EMS 工廠每日工廠產線數據在 TB 級,其中質量檢測產生的圖片數據為重要來源,如何有效管理這些數據對該廠是一個挑戰。如果將數據全部上云并非優選;但倘若沒有有效的數據存儲與管理機制,也會使得這些數據難以價值化。此時,邊此
74、時,邊緣存儲成為了一個很好的解決方案緣存儲成為了一個很好的解決方案:通過將主要的數據存儲在邊緣場景,僅將重要數據上云(如 IPQC 質檢過程中的不合格件),該廠極大緩釋了邊緣數據體量膨脹帶來的管理難題,同時也有效利用了這些數據。性能躍遷:從傳統機械硬盤,到端到端全閃化性能躍遷:從傳統機械硬盤,到端到端全閃化 30 大模型等 AI 原生應用的普及對存儲產品帶來性能躍遷需求,千億級大模型在 10 倍數據膨脹后,對存儲系統提出了更高的性能要求,使得全閃化勢在必行,進而帶來從 GB 級到百 GB級帶寬、從百萬級到千萬級 IOPS 的性能躍遷,有效賦能 AI 時代業務需求。此外,端到端全閃化也意味著 S
75、SD 從聚焦核心系統,到向二級系統和容災備份系統從聚焦核心系統,到向二級系統和容災備份系統遷移遷移。隨著 SSD 與HDD 的價格比不斷下行,最終 TCO 與性能更優的 SSD 方案也將成為傳統意義上“非核心系統”的主流方案。原生智能:從基于既定規則,到以存強算代算原生智能:從基于既定規則,到以存強算代算 我們認為先進數據存力的原生智能有三重內含,一是對大模型的訓練加速賦能、實現存力對算力的強化乃至部分替代,二是使能業務處理提效、縮短斷點續訓間隔期,三是具備智能涌現特性的設備運維自治。首先,原生存力智能的核心賦能場景是以首先,原生存力智能的核心賦能場景是以 LLM 大模型為代表的大模型為代表的
76、 AI 原生應用。原生應用。通過外掛行業知識庫、并將最新的行業知識(新聞、圖片、音視頻等)以“向量形式”存在知識庫內,用以強化大模型的預測精度。外掛向量知識庫有效地解決了大模型的時效性問題(如 GPT 4.0 當前仍無法獲得 2024 年之后發生的事件或數據的最新信息),以“向量存儲”為載體、把海量非結構數據處理成多維向量,給大模型輸送最新、最全面的信息,有效強化推理準確度?!耙源娲阋源娲恪币彩窃媪χ悄苁鼓艽竽P偷牧硪惶匦?。也是原生存力智能使能大模型的另一特性。當前的 LLM 大模型的本質是“連續預測”,基于用戶提出的問題,結合上一個字預測下一個字、形成與用戶的持續交互。而以KV-Ca
77、che 技術賦能構建“HBM DDR SSD”三層緩存機制,保存“工作記憶”(如歷史問答記錄),解決多輪對話和長序列“場景記憶”問題(比如用戶就一個較復雜的問題多輪詢問、澄清、再詢問),實現高性能記憶存儲。相比重新計算,直接調取 KV-Cache 緩存中 SSD層數據的成本,相比重新推理一遍的成本降低 10 倍以上倍以上。第二,以先進性能加速業務處理、縮短斷第二,以先進性能加速業務處理、縮短斷點續訓間隔期。點續訓間隔期。隨著數據并行、模型并行和流水線并行成為大模型算力基礎設施部署運行的范式,使得 LLM 的訓練效率得到指數級提升;與先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必
78、由之路 此同時,這種并行架構也使得高性能專業存儲在高性能專業存儲在 AI 架構中的重要性持續提升架構中的重要性持續提升,也對存儲IOPS 與讀寫帶寬等性能提出了更高的性能性能要求要求。第三,智能涌現式的設備運維自治。第三,智能涌現式的設備運維自治。包含基礎設施資源規劃、設備預測性維護、智能故障診斷、全局可視化等特性,成為企業 IT 基礎設施的“智能顧問”,從反應式運維管理到走向智能涌現與“自閉環式”運行。集約架構:從存算分離陣列,到集約化資源池集約架構:從存算分離陣列,到集約化資源池 先進數據存力集約架構先進數據存力集約架構的核心的核心內涵有內涵有二二,分別是分別是存算解耦存算解耦與與以數據為
79、中心以數據為中心。首先,首先,存算存算解耦解耦的的架構架構將服務器本地盤拉遠,構成將服務器本地盤拉遠,構成無硬盤無硬盤服務器和遠端存儲池,實現了真正意義的存算解服務器和遠端存儲池,實現了真正意義的存算解耦,極大提升存儲資源利用率。耦,極大提升存儲資源利用率。在傳統的數據中心架構下,“存力”與“算力”通常作為兩個獨立的陣列,與網絡運力設備組合到一起形成“端到端全棧解決方案”。盡管目前也可以通過存算運三力的各自優化實現一定程度上的集約化部署,但并未對存算獨立的陣列架構進行根本性變革。在先進數據存力時代。而存算分離的創新型架構,極大減少了減少了服務器因折舊周期(通常 35 年)低于部分業務數據生命周
80、期(有時可多達 1015 年)而導致的數據遷移成數據遷移成本本。其次,先進數據存力的架構以數據為中心,以 CXL、RDMA 等技術賦能,構建高通量超融合網絡、避免了用戶數據和控制數據(元數據等)的低效交織,縮短 IO 處理路徑,最終實現高吞吐、低時延的極致性能體驗。先進先進數據數據存力的創新型存力的創新型架構架構將帶來兩大核心影響將帶來兩大核心影響。一一是由存算解耦帶來的北向兼容與開放ICT 基礎設施生態,先進數據存力將能夠兼容多元化北向算力兼容多元化北向算力(X86/ARM 等等),促進更多元化解決方案的形成;二是以集約化部署能力使能存力走向全場景,加速加速先進數據先進數據存力在邊緣存力在邊
81、緣智能等場景的加速普及滲透智能等場景的加速普及滲透,提升存力的泛在性。多級可靠:從結果導向管理,到四級可靠體系多級可靠:從結果導向管理,到四級可靠體系 32 先進的存儲系統解決方案的可靠性應包含先進的存儲系統解決方案的可靠性應包含“數據級可靠數據級可靠 部件級可靠部件級可靠 解決方案級可靠解決方案級可靠 云云級可靠級可靠”四個層級。四個層級。例如,數據層級應以異構算力(如 DPU)等技術手段進行 EC 技術處理,實現對數據的合理冗余保護;再如,部件層面確保 SSD 可靠且業務均衡負載,而非簡單“集成硬盤”;又如,解決方案層面確保極致高韌、即使控制器只剩 1 個也能確保業務連續性、在分布式集群存
82、儲下能夠滿足雙活與業務連續性需求、且在全閃化方案中可以不犧牲快照等增值功能的可靠性;此外,云級場景有效支持對象存儲場景下的文件級顆粒度恢復。主動安全:從被動應對沖擊,到主動全棧防護主動安全:從被動應對沖擊,到主動全棧防護 在網絡環境愈發復雜、勒索成本逐年升高、攻擊方式持續多元化的時代,企業在安全管理上應“被動為主動”,形成“網絡 主機 應用 存儲”全棧數據安全防護體系,而數據存儲的主動安全特性,也將成為先進數據存力的重要組成部分。先進數據存力的主動安全有四大核心先進數據存力的主動安全有四大核心內涵。內涵。一是一是“主動主動”,構建事前、事中、事后端到端防勒索體系,二是二是“高韌高韌”,能夠支持
83、數據快速恢復(如分鐘級 CKPT 數據恢復);三是三是“可視可視”,清晰可視的掌控系統容災業務的運行情況,快速方便的完成數據恢復和測試演練,四是四是“全域自治全域自治”,能夠為多類型存儲設備(全閃存、分布式存儲、安全備份一體機等)提供安全策略統一配置管理、全局偵測分析及主動防御能力,也能在邊緣、中心等多場景提供安全可靠的數據保護。綠色低碳:從政策要求驅動,到先進方案牽引綠色低碳:從政策要求驅動,到先進方案牽引 在全閃化介質與集約化架構的賦能下,先進數據存力從存儲介質、軟件算法與數據處理架構存儲介質、軟件算法與數據處理架構等多方面齊創新,可有效降低數據存儲系統的能耗水平,為數據中心的可持續綠色化
84、發展提供了一個可規?;瘡椭频慕鉀Q方案可規?;瘡椭频慕鉀Q方案。首先,首先,數據數據存儲系統存儲系統大部分大部分能耗來自于存儲介質,而能耗來自于存儲介質,而SSD 的選用與單盤容量的持續提升,將帶來顯著的能耗節降。的選用與單盤容量的持續提升,將帶來顯著的能耗節降。一方面,相同容量下 SSD 相比機械硬盤的能耗降低 70%,空間占用節省 50%;另一方面,SSD 單盤容量持續提升,未來主流 SSD 單盤容量有望達 HDD 的 2 倍以上,使能數據中心先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 節約化部署。除先進介質外,軟件算法與數據處理架構等創新也將進一步使能存儲設備的集除
85、先進介質外,軟件算法與數據處理架構等創新也將進一步使能存儲設備的集約化部署、加速綠色轉型約化部署、加速綠色轉型,如數據壓縮數據壓縮技術使得更小的存儲空間可容量更大體量的數據;近近存計算存計算與專用數據處理器(DPU)帶來的架構創新可有效減少數據搬遷成本;高密盤框高密盤框的設計使得相同空間內可存儲更多的數據,從而減少了每 TB 存儲的能耗和相應的碳排放。開開放生態放生態:從:從數據存取數據存取 ATM,到,到自助數據消費自助數據消費 當前的存儲設備一般提供塊、文件、對象等基礎數據接口,進一步可以提供諸如 Table 格式對接數據庫應用,DataSet 向量接口對接訓練推理型應用,資產類接口對接數
86、據交易型應用等。在未來,數據服務和 API 通過提供更先進的功能、更好的性能和更安全的數據訪問,可以超越傳統的數據源或表界面,通過自主創建更復雜的應用程序對外提供創新的方式來利用數據的力量。例如,在未來數據接口可以與 NLP 技術整合,提供 ChatGPT 型服務接口,使用戶能夠使用自然語言與數據互動。1.5 先進數據存力的先進數據存力的核心核心價值價值及及影響影響力力 海量的數據使能千行百業走向智能經濟、增加智慧化政府治理能力、提升人民生活幸福度。從城市治理、綠色發展,到民生的衣食住行醫療保障,再到企業的數智化升級打造新質生產力,AI 應用將更為普惠且泛在??偟膩碚f,我們認為先進數據存力在賦
87、能產業升級發展、提升社會民生福祉與強化區域競爭力三大價值與影響。據測算,據測算,1 GB 先進數據存力投入預計能帶來先進數據存力投入預計能帶來至少至少 60 元元 GDP 的增長的增長??偟膩碚f,我們認為總的來說,我們認為先進先進數據數據存力技術的廣泛使用能夠提升價值回報原因有三。存力技術的廣泛使用能夠提升價值回報原因有三。一是性能 10 倍提升的同時不丟失可靠性,可有效使能全場景應用;二是存算分離架構的集約化資源池帶來更高的單位容量 34 利用,有潛力將存儲利用率頭繩 30%以上;三是有效使能 AIGC 等具備“智能涌現”特性的新質生產力行業,顯著提升推理精度、10 倍以上降低推理成本,帶來
88、巨大經濟價值。圖 1-16 先進數據存力的核心價值與影響力 1.5.1 產業發展升級:產業發展升級:先進數據存力以先進數據存力以“核心核心 ICT 使能產業使能產業 數據要素全產業數據要素全產業 產業數字化賦能產業數字化賦能”三層使能機制,帶動海量三層使能機制,帶動海量產業產業經濟發展經濟發展 首先,先進數據存力作為智能經濟時代的核心首先,先進數據存力作為智能經濟時代的核心 ICT 使能技術,未來有潛力成長為千億級使能技術,未來有潛力成長為千億級 ICT使能產業。第一使能產業。第一,數據中心的存算網架構將在先進數據存力的牽引下發生結構性變化,專業存儲設備的市場規模將快速提升,并將在數據中心建設
89、成長為一個獨立且核心的模塊將在數據中心建設成長為一個獨立且核心的模塊;第二,先進數據存力將與 AI 大模型等創新型數字化技術深度耦合,共同成為智能經濟時代的“原生智能解決方案”,使得先進數據存力底座成為智能經濟時代的“勢在必行”先進數據存力底座成為智能經濟時代的“勢在必行”;第三,當前全球主流區域的存力與算力配比并不均衡,在多數地區存力的投資增長顯著低于算力,先進數據存力產業的可持續增長潛先進數據存力產業的可持續增長潛力巨大力巨大。據測算,據測算,到到 2030 年全球先進數據存力產業的發展潛力年全球先進數據存力產業的發展潛力可可至少至少達達 2500 億美元。億美元。作為全球算力第二大國,預
90、計中國到 2030 年的算力規模在全球占比將至少達至少達 30%,這意味著屆時中國先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 算力將有望超過 35 ZFlops,如果數據存儲產業在通用計算及智能計算場景下,均按較為理想的存算比進行配置,中國將有條件打造千億千億美元美元級級先進數據存力底座產業(以當前匯率約合 5300 億元)。更進一步,NAND Flash 顆粒等關鍵部件占存儲設備成本達達 6070%,如國將這些零部件的產值納入經濟效益考量,則隨著隨著存儲芯片等存儲芯片等關鍵部件國產化關鍵部件國產化進程的加速,到 2030 年預計中國的先進數據存力端到端全端到端全產業
91、鏈產業鏈規模規模,將將有有潛力達潛力達到到萬億萬億元元級級。其次,先進數據存力產業將與數據要素市場深度耦合,其次,先進數據存力產業將與數據要素市場深度耦合,并并驅動數據要素市場的驅動數據要素市場的規?;幠;l展。發展。到 2030 年,全球數據要素市場規模將達全球數據交易市場規模有望達 3011 億億美元,年均復合增長率超超 15%;中國數據要素市場將達到 5156 億億元,年增長率超超 40%。在數據要素市場發展中,數據存儲環節直接貢獻直接貢獻 20%,并作為“壓艙石”充分使能數據要素的安全流轉、間接貢獻間接貢獻 80%。圖 1-17 先進數據存力的核心價值與影響力 最后,先進數據存力可作
92、為智能經濟時代的核心使能技術,賦能千行百業提質增效、帶來生最后,先進數據存力可作為智能經濟時代的核心使能技術,賦能千行百業提質增效、帶來生產力的提升。產力的提升。據測算,以先進數據存力為代表性技術的數智化解決方案數智化解決方案,到 2030 年對生產力提高所帶來的潛在價值預計可達十萬億美元級十萬億美元級。對中國而言,到 2030 年智能經濟帶來對中國各行業帶來的生產力提升經濟效益可達 1.5 萬億美金萬億美金,其中制造業、貿易、建筑、健康 36 服務業與交通運輸業均將獲得巨大收益。例如,在制造業制造業,通用 AI 智能體可以實時監控和調整生產線的各種參數,通過自我學習和優化進一步提高生產效率。
93、它能夠自主識別和解決瓶頸、協調不同機器的工作速度和任務分配,從而實現生產線的最高效率和最優配置生產線的最高效率和最優配置。1.5.2 提升社會福祉:先進數據存力提升社會福祉:先進數據存力使能綠色發展使能綠色發展、良政善治良政善治與民生體驗優化與民生體驗優化 先進數據存力先進數據存力除使能產業發展除使能產業發展提質增效外,還可提質增效外,還可通過使能綠色發展、通過使能綠色發展、提升政府治理能力與提升政府治理能力與優優化民生體驗化民生體驗,帶來,帶來社會福祉的提升社會福祉的提升。綠色發展方面,先進數據存力可帶來全球數據中心帶來顯著的降耗減排;提升政府治理能力方面,以先進數據存力賦能的數智化系統可在
94、防災護生、預防犯罪、電子政務、環保監測等場景中可展現顯著的價值;優化民生體驗方面,先進數據存力憑借其廣域泛在的特性,在衣、食、住、行、醫療、教育、養老等各個方面作為“使能底座”,提升人民生活幸福度。1)綠色發展:量化存力產業端到端降耗節能效應綠色發展:量化存力產業端到端降耗節能效應 雖然雖然大模型大模型等等 AI 原生應用原生應用持續持續快速快速增長增長,數據中心數據中心的能耗的能耗于近年快速于近年快速提升提升、并、并逐漸逐漸成為成為全全球球的的“能耗大戶”“能耗大戶”,而先進數據存力可有效,而先進數據存力可有效確保確保數據中心的數據中心的有效有效降碳降碳。經測算,先進數據存力方案從 OEM
95、制造到在數據中心投入使用的生命周期能帶來可觀的能耗節降,可為全球與中國的數據中心節降 16%與 24%能耗。首先,應用先進數據存力(SSD 替換 HDD)可直接為全球及中國數據中心能耗降低碳排放;其次,先進數據存力的應用可有效賦能集約化部署、降低數據中心的整體投資與運營成本,進而創造良好的條件牽引更先進綠色的冷卻系統(如液冷系統)的加速落地。圖 1-18 先進數據存力對綠色經濟的影響 先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 2)良政善治:先進數據存力良政善治:先進數據存力推動社會治理現代化推動社會治理現代化,使能社會,使能社會經濟可持續發展經濟可持續發展 先進數據
96、存力是城市建設治理的底座,不僅在防災護生、預防犯罪、電子政務、環保監測等先進數據存力是城市建設治理的底座,不僅在防災護生、預防犯罪、電子政務、環保監測等場景中可展現顯著的價值場景中可展現顯著的價值。通過整合與分析海量數據加速決策過程、提升響應效率、降低運營成本并保障數據的安全性與穩定性。預計到 2030 年,先進數據存力在全球范圍內為社會治理帶來至少 3 萬億元萬億元的經濟效益,而在中國也可以帶來至少至少 1 萬億元萬億元的經濟效益。例如,先進數據存力技術可有效使能災害預警系統,深度挖掘歷史災害數據價值,在災害發例如,先進數據存力技術可有效使能災害預警系統,深度挖掘歷史災害數據價值,在災害發生
97、前迅速識別潛在風險、提供預警方案,避免或減少經濟損失。生前迅速識別潛在風險、提供預警方案,避免或減少經濟損失。經測算,全國每年以先進數據存力賦能的先進災害應急響應方案7,可帶來 3000 億元億元經濟效益,包括減少的直接經濟損失、緊急安置人口及貴重物品轉移8、電梯救援成本減少等項目。再如,先進數據存力可深度分析犯罪歷史數據,融合實時監控數據,實現對犯罪行為的精準再如,先進數據存力可深度分析犯罪歷史數據,融合實時監控數據,實現對犯罪行為的精準預測和實時預警預測和實時預警,幫助預警和防范安全隱患,幫助預警和防范安全隱患。以先進數據存力賦能的智能犯罪預警系統,可實現對潛在犯罪行為的精準預測和實時預警
98、。經測算,全國每年通過先進數據存力支持的犯罪預警系統可節省成本達 4100 億億元元,包括案件減少的數量及經濟損失9,重大經濟犯罪案件追回金額,非法集資案件追贓挽損等項目10。38 3)民生福祉:先進數據存力全方位提高人民生活幸福感民生福祉:先進數據存力全方位提高人民生活幸福感 隨著經濟的高速發展,人民對生活幸福感的要求也隨之逐步提高。在衣、食、住、行、醫、教育、養老等各方面,滿足人民對于高質、高效幸福生活的期許應是各行業發展的應有之義。如果量化為經濟效益,由先進數據存力技術賦能的千行百業,能為全球和中國分別帶來20 萬億元萬億元和 6.9 萬億元萬億元的社會經濟福祉。例如例如,在出行領域,先
99、進數據存力通過賦能多端響應的數據系統,不僅能夠為用戶和城市管在出行領域,先進數據存力通過賦能多端響應的數據系統,不僅能夠為用戶和城市管理者解決擁堵問題,還能提升用戶通勤途中的舒適度和幸福感。理者解決擁堵問題,還能提升用戶通勤途中的舒適度和幸福感。以智慧交通控制系統、智能導航和自動駕駛的協同作用的應用場景為例,先進數據存力賦能的智能解決方案能夠通過智慧交通控制系統解決擁堵問題,通過智能導航和自動駕駛減少用戶擁堵時間,大幅提高通勤過程的舒適度。在快速記錄、同步城市全路段車流量及實景圖后,系統能夠實時調節各路口交通信號燈最佳工作節奏,并將信息同步推薦至用戶端實現無延遲智能導航。此外,先進數據存力賦能
100、的智能駕駛能讓用戶的通勤時間變成休息、學習或娛樂時間19,這將大幅降低通勤過程的時間浪費并徹底消除諸如通勤時間過長會誘發抑郁之類的隱患,一定程度上提高居民生活幸福度。系列應用預計能為全球和中國帶來經濟社會福祉 2.4 萬億元和 7700 億元。又如,又如,在醫療領域,先進數據存力用通過大數量級動態存儲平衡區域間用戶所享受的醫療資在醫療領域,先進數據存力用通過大數量級動態存儲平衡區域間用戶所享受的醫療資源并實現共同效率最大化。源并實現共同效率最大化。以共享醫療的應用場景為例,先進數據存力賦能的智能解決方案可以實現對區域內患者全生命周期內健康信息的存儲與實時更新20。例如面對急診響應,數據庫能夠在
101、極短時間內調取患者健康信息(省去檢查和病例書寫環節),最大限度為急診病人爭取治療時間,提高急救效率;再如,面對疑難雜癥場景,有了先進數據存力賦能的全樣本數據庫,在偏遠地區的患者不必再舟車勞頓來到大城市尋醫問藥,本地醫院可以用數據庫快速匹配類似病例,同曾經處理過類似病癥的科室取得聯系并進行即時會診21。據測算,共享醫療的廣泛應用預計能為全球和中國帶來經濟社會福祉 6.6 萬億元和 2 萬億元。先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 1.5.3 強化區域競爭力:先進數據存力賦能新質生產力生態發展強化區域競爭力:先進數據存力賦能新質生產力生態發展 九大戰略性新興領域的發
102、展都依賴于先進數據存力,以推動技術進步和應用優化。數據存力通過其匯聚、存儲和分發數據的功能,支持了這些領域的高效運作。比特化使得所有領域能夠通過數字化技術進行信息分析和處理,提升了數據的快速處理能力。無論是生成式人工智能的模型訓練,還是量子信息的密鑰管理、元宇宙的虛擬數據存儲,數據存力通過提供快速、高效的存儲,提供了必要的技術支撐,使這些領域能夠處理復雜的數據任務,推動國家技術創新和應用發展22。1)生成式人工智能生成式人工智能 生成式生成式人工智能通過推動科技創新、產業發展人工智能通過推動科技創新、產業發展和人才培養和人才培養,全面增強國家在全球競爭中的戰,全面增強國家在全球競爭中的戰略優勢
103、。略優勢。人工智能通過突破關鍵核心技術,推動產業鏈與創新鏈的深度融合,加快傳統產業的升級改造,形成現代化產業體系。同時,生成式 AI 還通過優化學科建設和人才培養機制,培養適應未來發展的高端科技人才,推動產學研用的緊密合作23。此外此外先進數據存力使得先進數據存力使得 AI 能夠“以存代算、以存強算”,帶來千行百業生產力的躍遷。能夠“以存代算、以存強算”,帶來千行百業生產力的躍遷。首先,“以存代算”的特性賦予了大模型“記憶”功能,通過記錄用戶與模型的交互過程,記住常見問題的答案。當類似問題再次出現時,模型可以直接從存儲系統中提取已保存的“記憶”,確保用戶能夠快速得到準確的回答,從而避免再次使用
104、顯卡進行推理。其次,先進數據存力通過高效存儲、數據處理、對仿真模型的支持和虛擬調試的應用,優化生產線的效率。比如博世蘇州工廠依托數據存儲技術,實現了對印刷電路板的全面高效檢測,提升了產能。2)量子信息量子信息 量子通信技術通過量子密鑰分發量子通信技術通過量子密鑰分發(QKD)等先進加密方法,提供了信息傳輸的絕對保密性,等先進加密方法,提供了信息傳輸的絕對保密性,保衛國家信息安全。保衛國家信息安全。在全球金融、軍事和政府等關鍵領域,這種高度安全的加密手段可以有 40 效抵御黑客攻擊和數據泄露,確保敏感信息的安全,從而增強國家在國際科技和安全領域的戰略優勢。先進的數據存力支持大規模部署和高效管理量
105、子密鑰及糾纏態信息,因此對量子通信行業至先進的數據存力支持大規模部署和高效管理量子密鑰及糾纏態信息,因此對量子通信行業至關重要。關重要。例如,在銀行跨國金融交易中,量子存儲器能夠安全地存儲和傳輸加密密鑰,確保交易過程的安全性。強大的數據存儲能力使得量子通信網絡能夠穩定運行,提升系統的可靠性和安全性,為量子通信的廣泛應用提供了必要支持。3)元宇宙元宇宙 元宇宙通過推動網絡通信技術、促進技術進步、吸引頂尖人才和創造就業機會,提升國家的元宇宙通過推動網絡通信技術、促進技術進步、吸引頂尖人才和創造就業機會,提升國家的競爭力。競爭力。元宇宙是一個融合虛擬現實、增強現實、區塊鏈和互聯網技術的數字生態系統,
106、允許用戶通過數字身份在多個互聯的“數字孿生”世界中進行社交、娛樂、購物和教育等活動。元宇宙驅動了網絡通信的發展,6G、VR 和 AR 等技術的耦合應用將成為元宇宙的殺手級應用場景,為核心技術的進步提供了良好的培育土壤,吸引高質量的人才和就業崗位,從而推動了相關技術的創新和應用。先進的數據存力負責存儲、備份和分發元宇宙這個巨型數字孿生世界中所有的虛擬形象及活先進的數據存力負責存儲、備份和分發元宇宙這個巨型數字孿生世界中所有的虛擬形象及活動的數據。動的數據。數據存儲不僅支撐著用戶在元宇宙中的持續體驗,還確保了虛擬環境的穩定性和可靠性。通過高效的數據存儲解決方案,元宇宙能夠有效管理和處理大量的動態數
107、據,從而提升整體系統的性能和用戶體驗。4)腦機接口腦機接口 腦機接口不僅腦機接口不僅推動高科技醫療設備的創新,還促進了社會福祉的發展。腦機接口是一種通過推動高科技醫療設備的創新,還促進了社會福祉的發展。腦機接口是一種通過將人類大腦與計算機直接連接,讓大腦與外部設備交流的技術。將人類大腦與計算機直接連接,讓大腦與外部設備交流的技術。腦機接口的發展鼓勵了智能科技在醫療領域的顯著進展,改善了殘疾人以及社會整體的生活質量,從而增強國家在全球競爭中的地位。先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 先進數據存力顯著提高了信號處理的速度和精度,使得腦機接口能夠更快速、更準確地解讀
108、先進數據存力顯著提高了信號處理的速度和精度,使得腦機接口能夠更快速、更準確地解讀腦電波。腦電波。腦機接口領頭羊 Neuralink 公司將會通過腦機接口幫助解決腦損傷疾病,為患者創造協調的未來。這一愿景離不開高效的信號采集和處理和深度學習算法,而先進數據存力的進步大大提升了信號處理的速度和精度,使得腦機接口能夠更快、更準確地解讀腦電波,促進了醫療、廣告等領域的應用,例如準確解讀腦信號以有效控制假肢、進行神經康復,并輔助診斷和治療神經系統疾病。5)具身智能具身智能 具身智能在工業生產、家庭服務等領域代替人類實現高效和高精準度的服務,顯著增強國家具身智能在工業生產、家庭服務等領域代替人類實現高效和
109、高精準度的服務,顯著增強國家競爭力。競爭力。具身智能是指具有物理實體和感知能力的人工智能系統,而人形機器人是最具代表性的具身智能形式,它們通過類似人類的身體結構和運動能力,能夠在復雜環境中執行任務,與人類互動,模仿人類行為。在工廠中,人形機器人替代人工搬運貨物,提高生產效率和工作安全性,推動制造業自動化,降低運營成本。在碼頭操作中,人形機器人可以高效處理裝卸和運輸任務,加快物流周轉,提升國家在國際貿易中的地位。家庭服務領域的機器人能夠減輕人們的日常負擔,提高生活質量,同時推動服務業技術革新,創造新的就業機會和經濟增長點24。先進數據存力不僅在性能上推動了機器人技術的發展,還在商業上促進新的“以
110、數據為資產先進數據存力不僅在性能上推動了機器人技術的發展,還在商業上促進新的“以數據為資產“的商業模式?!暗纳虡I模式。技術上,高速的讀寫帶寬、優秀的 IOPS 速度和先進的閃存技術使具身智技術能夠迅速處理和存儲大量數據,從而提高其操作精度和效率。商業上,埃隆馬斯克指出,人形機器人在工作時存儲的數據將會是企業的重要資產,這進一步突顯了數據存儲對提升機器人功能及其商業價值的至關重要性。6)生物制造生物制造 未來生物制造技術通過資源循環利用、環保效益和創新推動,顯著提升國家的經濟競爭力和未來生物制造技術通過資源循環利用、環保效益和創新推動,顯著提升國家的經濟競爭力和可持續發展能力??沙掷m發展能力。首
111、先,生物技術能夠有效利用工業廢棄物和農林廢棄物,轉化為高價值產 42 品,如用鋼鐵尾氣生產的高蛋白飼料和燃料乙醇、用秸稈生產的生物乙醇。這種資源循環利用不僅減少了環境污染,還降低了對糧食的依賴,提升了資源利用效率。其次,生物制造的可再生性支持了國家的“雙碳”目標,有助于實現可持續發展。最后,通過技術創新,我國能夠在全球市場中占據先機,形成新的產業優勢,推動經濟向綠色、智能、高效方向發展,并加快工業轉型升級進程25。先進數據存力通過高效管理和處理生物數據,推動了生物制造領域的精準研究和自動化生先進數據存力通過高效管理和處理生物數據,推動了生物制造領域的精準研究和自動化生產。產。例如,在合成生物學
112、中,先進數據存力存儲海量 DNA 序列數據,使科學家能夠快速分析數以億計的基因信息,從而優化微生物菌株設計,并用于生產醫藥或生物燃料等領域。高效的數據存儲與讀取能力不僅提高了研究效率,還推動了生物制造工藝的自動化,使復雜的生產過程更加穩定和可控,助力行業快速發展。7)未來顯示未來顯示 未來顯示領域的技術創新將推動高科技行業的升級、提升國家文化軟實力,并增強國家安全未來顯示領域的技術創新將推動高科技行業的升級、提升國家文化軟實力,并增強國家安全和戰略防御能力。和戰略防御能力。未來顯示的創新將引領新一輪科技進步,推動電子產品、醫療設備和汽車顯示等行業的升級。同時,先進的顯示技術將推動媒體、教育和文
113、化產業的發展,提升國家的文化軟實力和信息傳播能力,并在軍事和國防領域提升指揮系統和信息化作戰平臺的效率,增強國家的戰略防御能力。先進數據存先進數據存力力技術可以提升未來顯示的數據處理能力,支持創新應用,并且增強設備性能。技術可以提升未來顯示的數據處理能力,支持創新應用,并且增強設備性能。隨著顯示技術的進步,數據量大幅增加,先進存儲系統能夠高效管理和處理這些數據,確保隨著顯示技術的進步,數據量大幅增加,先進存儲系統能夠高效管理和處理這些數據,確保實時、準確地展示復雜圖像和視頻。實時、準確地展示復雜圖像和視頻。此外,這些存儲技術支持虛擬現實、增強現實等應用,推動了沉浸式體驗和動態內容的展示。同時,
114、通過提升存儲速度和容量,存儲技術改善了顯示設備的響應時間和圖像質量,增強了視覺效果和用戶體驗。8)未來網絡未來網絡 先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 未來網絡技術通過加速數據傳輸和提升帶寬,優化智能未來網絡技術通過加速數據傳輸和提升帶寬,優化智能城市、自動駕駛和物聯網應用,增強城市、自動駕駛和物聯網應用,增強國家科技創新。國家科技創新。5G 提升自動駕駛的安全性和效率,而 6G 技術則通過極高的傳輸速率和低延遲,支持智能城市升級、實時數據處理和無人機應用,從而進一步提升國家的技術實力和全球競爭力。先進數據存先進數據存力力通過優化數據管理和分配,為未來網絡的通
115、過優化數據管理和分配,為未來網絡的發展發展提供了關鍵支持。提供了關鍵支持。隨著網絡架構向“以應用服務為中心”轉型,數據存儲技術可實現資源的高效調度和管理。通過融合計算和存儲資源,先進數據存力技術將進一步推動未來網絡的發展,助力人工智能等前沿技術的應用落地。9)新型儲能新型儲能 新型儲能技術的發展顯著增強了國家的電力系統穩定性和能源利用效率新型儲能技術的發展顯著增強了國家的電力系統穩定性和能源利用效率。通過靈活布局和短建設周期,這些儲能技術,如電化學儲能、壓縮空氣儲能和重力儲能,能夠在電力供需不平衡時高效調節電力,支持新能源的開發和消納,減少對傳統化石能源的依賴。此外,新型儲能的規?;瘧脦恿?/p>
116、相關產業鏈上下游的協同發展,加速技術創新與產業進步,從而提升國家在全球能源競爭中的地位。先進先進數據數據存力為新型儲能提供了數據管理和分析支持存力為新型儲能提供了數據管理和分析支持,尤其是在園網荷儲一體化發展中發揮尤其是在園網荷儲一體化發展中發揮了關鍵作用了關鍵作用。高效的數據存儲系統能夠實時監控和優化儲能設備的運行,管理大規模儲能數據,從而提高儲能系統的響應速度和穩定性。例如,在湖北應城的 300 兆瓦壓縮空氣儲能電站中,數據存儲技術用于實時監測和管理地下儲氣庫的運行狀態,確保了儲能系統的高效和安全運行。圖 1-19 先進數據存力對新質生產力 9 大未來產業的賦能 44 先進數據存力:新質生
117、產力的必由之路先進數據存力:新質生產力的必由之路 先進數據存力先進數據存力指標評測:指標評測:建設指標體系保障先進數據存力高質量發展建設指標體系保障先進數據存力高質量發展 46 2.1 發展發展先進數據存力先進數據存力的六大核心考量因素的六大核心考量因素 雖然先進數據存力可有效賦能千行百業加速數智化轉型,但不同行業企業所面臨的情景與業務需求不盡相同。因此,企業應體系化規劃并推進先進數據存力的建設、以正確且全面的認知對先進數據存力進行適度超前的持續投資、以應對智能經濟時代的業務挑戰。圖 2-1 建設先進數據存力的六大核心考量維度 2.1.1 容量容量規劃規劃 當前,中國在數據存儲能力方面面臨顯著
118、挑戰,尤其是與全球領先國家如美國、德國相比,當前,中國在數據存儲能力方面面臨顯著挑戰,尤其是與全球領先國家如美國、德國相比,存力充足性明顯不足。存力充足性明顯不足。2023 年,中國年,中國存力充足性為存力充足性為 6.4%,而美國,而美國與德國與德國這一數據這一數據分別分別為為10.7%與 13.4%。這一差距在企業級應用中尤為突出,眾多行業普遍面臨存儲資源不足的問題,且存儲規模與業務邏輯的匹配度存在偏差。例如,某汽車行業零部件供應商基于其業務特性,為其 EMS 工廠設定了依據依據營收營收額額配置配置相應容量相應容量數據數據存儲存儲容量容量的標準的標準,這種過于簡單的配置邏輯,非常容易導致“
119、數未能盡其用”、數據價值未得到充分挖掘和利用??偟膩砜偟膩碚f,說,我們認為我們認為提升存力提升存力配置配置有有三大三大好處。好處。先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 首先,更多的存力資源可減少了服務器等待首先,更多的存力資源可減少了服務器等待 I/O(輸入(輸入/輸出)操作完成的時間,從而可以更輸出)操作完成的時間,從而可以更高效地利用高效地利用 CPU 和內存資源。和內存資源。例如,本地的高速存儲(如 SSD 和 NVMe 設備)可以顯著加快數據訪問速度,極大減少 CPU 等待時間,更合理的存算比使得服務器的存儲資源與計算資源更匹配,數據可以在靠近計算的地方
120、存放,提升數據的“本地化”程度,加速訪問速度進而提升整體算力資源利用率。其次,增加存儲容量和優化存算比讓更多的虛擬機或容器在服務器上運行,這些技術需要大其次,增加存儲容量和優化存算比讓更多的虛擬機或容器在服務器上運行,這些技術需要大量的存儲資源用于映像、日志和其他運行時數據。量的存儲資源用于映像、日志和其他運行時數據。更大的存儲容量允許數據以更高效的方式進行分區和調度,減少數據在不同存儲設備之間傳輸的時間,提高數據處理效率。最后,更大的存力賦予更高效的備份和恢復策略,應對各種突發事件的能力就更強。最后,更大的存力賦予更高效的備份和恢復策略,應對各種突發事件的能力就更強。正是因為更可靠的數據存儲
121、,使得計算可以更加持續和高效地進行。在備份或數據恢復過程中的停機時間減少,服務器可以更連續地利用計算資源。2.1.2 資源資源利用率利用率 當前當前,主流數據中心的主流數據中心的數據數據存儲設備存儲設備以“服務器加本地盤”以“服務器加本地盤”的模式為主,的模式為主,造成造成數據存儲資源數據存儲資源的的利用率不高利用率不高、副本備份數過多等挑戰、副本備份數過多等挑戰。由于每臺服務器獨立管理本地存儲,數據副本的數量非常多,增加了存儲管理的復雜性和成本。在此背景下,在此背景下,如何如何提升提升存力存力資源利用率成為資源利用率成為一一大核心大核心挑戰挑戰。而先進數據存力所提供的解決方案,就是存力資源池
122、化為核心的“存算分離”架構。在存力資源池化的架構下,海量的專業存力設備之間通過高速互聯、形成了一個巨大的“共享資源池”,這個巨大的資源池能夠兼容各種存儲與通信協議,與北向的算力資源池形成高速互聯,有效使能存算運三大 ICT 底座資源利用率的提升。存算分離是先進存算分離是先進數據數據存力的建設主線之一,也是數據中心架構變革的關鍵演化趨勢之一。存力的建設主線之一,也是數據中心架構變革的關鍵演化趨勢之一。對對計算與大數據領先的國家及企業而言,存算分離的架構已然成為大勢所趨。計算與大數據領先的國家及企業而言,存算分離的架構已然成為大勢所趨。例如,在中國,多家領先 ICT 解決方案供應商也已廣泛采用存算
123、分離架構,并提供相關解決方案;在美國,48 硅谷領頭羊(如谷歌、亞馬遜、微軟和 Meta)已在其數據中心廣泛采用存算分離架構、美國的電商、文娛、物流、生活服務等多個行業的諸多企業也已廣泛應用存算解耦架構。推動存算分離有推動存算分離有六六大大優勢。一是資源獨立擴展優勢。一是資源獨立擴展,存儲和計算資源可以獨立擴展。企業可以根據需求增加存儲容量或計算能力,而不需要同時增加另一種資源;二是維護和升級的靈活二是維護和升級的靈活性性,升級或維護某一部分時不會影響到另一個部分,提高系統完成任務的可靠性、減少停機時間;三是優化性能和更高的可用性三是優化性能和更高的可用性,比如使用更快的存儲介質(如 SSD)
124、來提高數據讀寫速度,同時使用更高性能的計算節點來提高處理能力;四是數據持久性和安全性四是數據持久性和安全性,數據存儲在獨立的存儲系統中,計算節點的故障不會影響數據的完整性和安全性;五五是負載的優化是負載的優化和分布和分布,可以在網絡上分布計算負載和存儲負載,優化網絡資源的使用,進而實現更高效的網絡流量管理,減少網絡瓶頸,提高總體系統性能。六六是是以數據為中心的架構以數據為中心的架構與與近存計算近存計算等等技術,可有效技術,可有效降低網絡降低網絡等資源等資源損耗損耗,讓數據“就近處理,讓數據“就近處理/計算”計算”。當前數據中心在推進存算分離架構時,通常不會一次性對所有軟件系統進行轉換,而是采用
125、當前數據中心在推進存算分離架構時,通常不會一次性對所有軟件系統進行轉換,而是采用漸進式的策略。漸進式的策略。例如,先從大模型等核心系統入手,在試點驗證成功后,逐步推廣到更多的業務系統和支持系統,通過不斷的優化和調整,最終實現全面的存算分離架構。這種方式確保了風險的最小化、資源的合理利用和業務的連續性。因此因此,全球各國政府及企業應加速推動存算分離架構、并持續投資推動替換。,全球各國政府及企業應加速推動存算分離架構、并持續投資推動替換。通過強化對數據中心先進架構變革的持續推動、積極培養相關產業人才(如了解新型架構的運維人才)等舉措,確保持續投入與平穩轉型。2.1.3 性能性能要求要求 對于核心系
126、統對于核心系統(Primary System),以全閃化滿足千行百業的性能需求已成為大勢所趨。,以全閃化滿足千行百業的性能需求已成為大勢所趨。全球范圍看,核心系統的全閃化率在 2023 年已達 27%,預計 2027 年達 35%。以中國為例,主流電信運營商的 ERP 與 OSS 等核心業務系統基本實現全閃化改造;在金融行業,領先保先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 險公司的核心保險系統,財務系統等對業務時效性要求高的系統,都采用全閃化解決方案。再如,上海市青浦區建設城建管理系統時,通過實時動態查看街邊影像,以以 AI 影像識別判影像識別判定違章搭建定違章搭建
127、,系統的讀寫帶寬達到 3 GB/S,IOPS 達 30W,延時要求 50 微秒,MTBF 要求80 萬小時,因此選型全閃化選型全閃化 SSD 解決方案以滿足上述性能要求解決方案以滿足上述性能要求。對于二級系統對于二級系統(Secondary System),數據體量正呈,數據體量正呈指標級增長、企業對數據要素價值的持指標級增長、企業對數據要素價值的持續挖掘與可靠性要求的提升等因素,也將推動續挖掘與可靠性要求的提升等因素,也將推動二級二級系統的全閃化。系統的全閃化。以某中國電信運營商為例,其規定節點讀寫帶寬當量達 500 MB/s 時,就必須以全閃化 SSD 方案滿足時效性要求,因此其 BSS
128、與 OA 系統基本已完全實現全閃。在未來,為滿足集團提出的二級系統RTO 達 2 小時的可靠性要求,該運營商將推動 BSS 與 OA 系統的全閃存化。即使在企業認為性能要求最普通的備份場景(即使在企業認為性能要求最普通的備份場景(Backup),因特殊事件數據量的暴增與特殊),因特殊事件數據量的暴增與特殊場景的備份窗口期要求,全閃化也將逐漸成為剛需。場景的備份窗口期要求,全閃化也將逐漸成為剛需。例如,在 2024 年巴黎奧運會的期間,在長達 2 周的時間內,某電信運營商 OSS 系統的 HDD 備份方案無法滿足保證的訪問量暴增帶來的數據備份需求,導致備份用時超 20-25%;再如,某運營商的洲
129、際 SD-WAN 業務有數據加密需求,為避免 HDD 方案的備份時間過長帶來安全隱患、其采取全閃化備份方案以適配該特殊業務場景的“極速備份”需求。最后,最后,在追求性能的同時,在追求性能的同時,組織也組織也不應犧牲系統的可靠性不應犧牲系統的可靠性,除采取除采取全閃存(全閃存(SSD)先進)先進介質介質外,還應外,還應關注關注快照(快照(Snapshot)等)等用于提升可靠性的高級功能用于提升可靠性的高級功能。例如,快照功能可以用于保護數據、防止數據丟失。企業可以定期創建數據快照,以便在遇到數據丟失、損壞或安全事件(如勒索軟件攻擊)時,迅速恢復到快照時間點的數據狀態,從而將損失降到最低,進而有效
130、提升有效提升數據數據存儲系統的“韌性”存儲系統的“韌性”。而先進數據存力方案先進數據存力方案通過優化設計與各種技術手段,可很好地實現高性能與可靠性的“魚與熊掌兼得“魚與熊掌兼得”,即數據存儲系統數據存儲系統提供高性能數據提供高性能數據訪問訪問時時,提升可靠性的高級功能提升可靠性的高級功能處于開啟狀態處于開啟狀態,這值得千行百業的組織與企業重點關注。50 2.1.4 安全可靠安全可靠防勒索防勒索 構建主動安全主動安全與可靠高韌可靠高韌的數據存儲系統,在如今日趨復雜的網絡環境與數據要素市場快速規?;谋尘跋聞菰诒匦?。一方面,網絡攻擊與數據一方面,網絡攻擊與數據勒索問題已成勒索問題已成企業企業“難難
131、以以承受之痛承受之痛”,強化對端到端防勒索的投入勢強化對端到端防勒索的投入勢在必行。在必行。例如,某電信運營商在建設數據中心時,78%的投資流入構建端到端數據安全上,其中 22.5%為數據存儲相關安全投入。另一方面,隨著數據的要素化與資產化,數據另一方面,隨著數據的要素化與資產化,數據存儲系統的可靠性與韌性也愈發重要存儲系統的可靠性與韌性也愈發重要。在 2030 年數據要素市場達萬億、數據資產超十萬億的背景下,企業以數據資產入表為核心抓手,提升凈資產額與高質量資產比重、進而優化資產負債表、提升資本市場估值,正成為強化自身競爭力的核心手段。當前,勒索軟件對當前,勒索軟件對電力、電力、電信電信、醫
132、療、醫療等等包含關鍵基礎設施在內的包含關鍵基礎設施在內的多個多個行業行業的攻擊愈發的攻擊愈發頻繁、頻繁、勒索勒索贖金的規模也越來越大,使得贖金的規模也越來越大,使得組織對數據存儲的防勒索解決方案組織對數據存儲的防勒索解決方案勢在必行、而并非勢在必行、而并非一個一個“可選項”“可選項”。例如例如,2023 年 1 月,英國皇家郵政遭受 LockBit 勒索攻擊,并索要 8000 萬美元贖金。由于皇家郵政最終未滿足攻擊者的贖金要求,該攻擊導致其國際郵件投遞服務癱瘓,數百萬封信件和包裹滯留在該公司的系統中。1 月 12 日,皇家郵政聲稱網絡攻擊事件迫使他們停止了國際郵政服務。盡管公司聘請了專業機構幫
133、助恢復業務,但遺憾的是,勒索攻擊的影響一直在持續?;始亦]政所在母公司財報顯示,截至 2023 年 9 月,公司收入同比下降 6.5%,給出的原因正是工業行動和勒索軟件入侵。再如再如,2023 年 8 月,Rhysida 勒索軟件組織對美國多個州的醫院和診所發動了一系列勒索攻擊。該組織聲稱已竊取了 1TB 的機密文件和 1.3TB 的 SQL 數據庫,其中包含了約 50GB的病人隱私數據。Rhysida 勒索軟件組織要求醫療信息系統服務商 Prospect Medical Holdings 支付贖金以恢復數據,并威脅將泄露受竊數據。然而,Prospect Medical Holdings先進數據
134、存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 公司拒絕支付贖金,并與執法機構合作進行調查。為了應對此次攻擊,他們采取了緊急措施,包括隔離受感染的系統和從備份恢復數據,恢復過程非常耗時和復雜。在此背景下,丟失數據就是丟失優質資產、強化數據存儲可靠性就是保障核心資產安全。在此背景下,丟失數據就是丟失優質資產、強化數據存儲可靠性就是保障核心資產安全。因此,企業需強化對數據存儲系統可靠性的重視,強化對 RTO、MTBF 等關鍵可靠性指標的管理、重視對容災備份(Backup&Recovery)的投資。例如,某電信行業企業要求 OSS 等核心系統每年的故障時間不超過 26 分鐘(即可靠運行
135、時間超過 99.995%),對極關鍵節點要求每年的故障時間不超過 2 分鐘;即使對 OA 等非核心系統,每年的故障時間亦不能超過8 小時(即可靠運行時間超過 99.9%)。2.1.5 方案級方案級 TCO 當前,諸多企業在二級系統與備份容災系統選型時,因側重 Capex 成本考量而選擇 HDD 方案。然而,隨著 NAND Flash 芯片的持續更新、數據壓縮技術的持續創新與先進 SSD 方案對設備運維能力的持續演進提升,優質優質 SSD 方案方案有條件有條件以更高數據縮減率以更高數據縮減率、更集約更集約化化的部的部署、署、更更自治化的運維自治化的運維與更更低低的的能耗水平,實現比能耗水平,實現
136、比 HDD 更低或至少持平的技術水平更低或至少持平的技術水平。例如,在海量非結構化數據為核心且存儲設備生命周期例如,在海量非結構化數據為核心且存儲設備生命周期 5 年的場景下,當前先進年的場景下,當前先進 SSD 全閃全閃化方案的單位容量化方案的單位容量 TCO 已可與傳統已可與傳統 HDD 方案基本持平。方案基本持平。當前 SSD:HDD 價差大概在 5:1左右。首先,更優的數據縮減技術使得可實現數據縮減率領先傳統 HDD 方案至少 50%;其次,先進 SSD 方案的年度 Opex 相比傳統 HDD 方案可下降至少 80%,一是先進 SSD 介質帶來更低的能耗成本,二是集約化部署帶來的租金成
137、本節降,三是高度自治化運維帶來的維護檢修等費用降低。圖 2-2 先進 SSD 方案與傳統 HDD 方案的 TCO 對比 52 此外,企業也應明確以方案級此外,企業也應明確以方案級 TCO 為單位,結合性能與安全可靠性要求等因素綜合考量為單位,結合性能與安全可靠性要求等因素綜合考量后,再進行全閃化與傳統后,再進行全閃化與傳統 HDD 方案的選擇方案的選擇,而非在二級系統及容災備份系統的選型時單純以成本為考量,以最大化先進數據存力對業務運行的保障與賦能。2.1.6 原生原生 AI 應用賦能應用賦能 展望展望 2030,原生化,原生化 AI 應用將成為大勢所趨。應用將成為大勢所趨?!暗鼗环€,地動山
138、搖”,如何打牢 ICT 基礎設施地基以適配原生 AI 應用時代,成為企業必須思考的一個問題。一方面,以 RAG 向量存儲強化推理精確度提升用戶體驗、進而“以存強算”,成為諸多部署大模型企業的共性需求。例如,中國電信發布的星辰大模型,在 2024 年的版本中,就將加入核心網/無線接入/寬帶接入等系統的最新數據、強化模型推理能力、帶動集團運維能力提升。另一方面,以KV-Cache 多級緩存(建立 HBM DDR SSD 三級數據存儲體系)可解決多輪對話和長序列場景記憶問題、有效環節大模型“幻覺”,實現“以存代算”,可很好地緩釋算力供應鏈緊缺挑戰,實現 10 倍以上的推理成本節降?!叭f卡時代來臨,A
139、I 大模型是實踐存算分離架構應用潛力最大的核心系統之一,萬億級參數使得服務器外掛硬盤的模式不再適用,集約化全閃 SSD 存儲資源池成為剛需?!敝袊娦沤鉀Q方案專家 先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 2.2 先進數據存力衡量指標體系先進數據存力衡量指標體系 為適配 AI 新時代的業務需求、我們對提出了先進數據存力指標體系先進數據存力指標體系,發布“區域發展 數據中心 存儲產品”三級指標體系,作為各區域與千行百業的企業組織評估自身競爭力、建設存力體系的參考,并對區域發展層級的關鍵指標進行了詳盡梳理分析、對各國的關鍵指標進行追蹤與更新。我們在測算過程中共選取了我們
140、在測算過程中共選取了 19 個不同區域和發展水平的國家進行深入研究,綜合比較樣本個不同區域和發展水平的國家進行深入研究,綜合比較樣本國家在數據存力各個維度的表現進行國際橫向對比。國家在數據存力各個維度的表現進行國際橫向對比。全面的先進數據存力指標體系,將更好幫助各個國家厘清現有的發展優勢和尚待提升的空間,助力其加快建設全面的數據存力支撐經濟社會高質量發展。圖 2-3 先進數據存力指標排名匯總 54 2.2.1 區域發展級區域發展級 先進數據存力的區域發展級指標可用于衡量全球各經濟體的先進數據存力發展情況,整體而言沿用了體量體量、效率效率、基礎保障基礎保障與前沿保障前沿保障四大維度,并結合發展先
141、進數據存力的六大核心考量因素進行了補充更新。充足的體量仍是任何區域實現先進數據存力產業的前提基礎,而在智能經濟時代,全球數據充足的體量仍是任何區域實現先進數據存力產業的前提基礎,而在智能經濟時代,全球數據要素市場快速發展,數據將逐漸演化為全球各經濟體的核心資產。要素市場快速發展,數據將逐漸演化為全球各經濟體的核心資產。因此,我們在原有數據存力指標體系的基礎上,補充了“數據存留率”作為核心指標,建議各區域強化對數據要素的挖掘與存留。從統計結果看,中國當前的數據存留率僅 2.8%,而美國達到 7.3%,這說明中國對數據要素的挖掘相較美國等國而言仍有較大的提升空間仍有較大的提升空間。圖 2-4 先進
142、數據存力指標體系(區域發展級)先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 2.2.2 數據中心級數據中心級 在數據中心層面的先進數據存力建設上,我們建議企業在原有指標體系上,額外關注數據覆數據覆蓋率蓋率(以數據地圖已映射數據資產數量/全部數據資產數量的比例表示)、年均設備汰換率年均設備汰換率(以當年淘汰存儲設備容量/區域內存儲設備容量比例表示)、存算解耦架構比存算解耦架構比(以存算分離式架構容量當量/存儲總容量表示)以及智能計算存算比智能計算存算比(智能計算場景中有效數據存力容量/有效數據算力總量)。首先,高數據覆蓋率高數據覆蓋率表示企業能夠全面了解和管理其所有數據資
143、產、能夠對本企業的單個/多個數據中心的數據進行統一管理,這對于企業的數據治理、合規性和安全性管理等方面至關重要。其次,關注維保期內設備占比維保期內設備占比可使得企業很好地掌握自身數據存儲設備的資產健康度,通常而言數據存儲設備使用至多通常而言數據存儲設備使用至多 5 年就應換新、在使用期也應定期關注資產健康度年就應換新、在使用期也應定期關注資產健康度,而不應超過這個周期,乃至“一直用到壞為止”。在數據要素市場快速發展、數據成為新生產要素與可交易高價值資產的背景下,企業在建設先進數據存力時不應過于關注成本,因為丟丟失數據就是丟失企業在智能經濟時代的核心資產,也將損害企業的核心競爭力失數據就是丟失企
144、業在智能經濟時代的核心資產,也將損害企業的核心競爭力。其次其次,存算解耦作為現代數據中心架構設計的一種關鍵趨勢,存算解耦作為現代數據中心架構設計的一種關鍵趨勢,也值得組織重點關注也值得組織重點關注。存算解耦架構比的提升,首先能夠顯著提升各區域 ICT(信息與通信技術)基礎設施的利用率。存算解耦通過提升資源利用率和賦能算力多元化發展,有效緩解了算力產能緊張的問題,為數據要素市場的快速發展提供了堅實的支撐。同時,它也為企業在智能經濟時代保持核心競爭力和持續創新提供了有力保障。最后,智能計算存算比智能計算存算比作為評估智能場景下數據存儲與數據處理算力匹配度與效率的關鍵指標,也應得到企業的重視。我們建
145、議企業我們建議企業綜合考量綜合考量硬件架構(如是否采取存算分離)、數據類型與規模,以及應用場景等多因素的影響,在不同的場景下在不同的場景下做出做出合理的合理的存算比存算比配置配置。例如,圖像和視頻數據通常需要大量的存儲空間和高速的數據處理能力。56 以多模態大模型多模態大模型為例,當前美國典型多模態 LLM 在部署時,存算比通常在通常在 1:10 內內、智算場景下的存算比相對合理,而中國普遍高于普遍高于 1:40,這一現象值得關注值得關注。提升對先進數據存力的建設以優化存算比、利用其“博聞強記”的優勢實現大模型大模型推理精度推理精度的顯著提升與的顯著提升與推理推理成成本的顯著降低本的顯著降低,
146、是中國強化自身強化自身 AI 產業產業實力實力、打造打造具備國際競爭力具備國際競爭力 AI 產品產品的一大機會點機會點。圖 2-5 先進數據存力指標體系(數據中心級)先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 2.2.3 存儲產品級存儲產品級 存儲產品級,我們建議將原有的單位容量價格指標單位容量價格指標(存儲費用/容量)改為單位容量單位容量 TCO(存儲系統 TCO/容量),以綜合考量先進數據存力解決方案的軟硬件特性(先進介質、高密盤框等)對單位容量單位容量 TCO 的影響,加速先進數據存力產業的規?;l展規?;l展。圖 2-6 先進數據存力指標體系(存儲產品級)58
147、 2.3 全球各國先進數據存力發展程度對比全球各國先進數據存力發展程度對比 2.3.1 體量衡量:充足供應與持續增長支撐經濟社會的體量衡量:充足供應與持續增長支撐經濟社會的可持續增長可持續增長 指標指標 1 單位單位 GDP 存儲容量存儲容量 1)指標解釋與結果展示指標解釋與結果展示 存儲空間的容量,是人們對數據存儲能力的最基礎的認知??紤]到經濟體量較大的國家往往會擁有較大體量的存儲空間,本文在計算存儲能力的容量時采用單位 GDP 存儲容量來確保不同國家的可比性,即用數據存儲空間容量除以 GDP 規模。每一萬美元 GDP 對應的存力容量越高,表明該國的數據存力容量水平越高,該國數字經濟在 GD
148、P 中的滲透程度越高,能更好支撐經濟社會高質量發展。圖 2-7 各國單位 GDP 存儲容量表現 2)指標結果分析與典型案例指標結果分析與典型案例 2023 年的測算結果顯示,新加坡、瑞典、德國、捷克等國家的單位 GDP 存儲容量較高,每一萬美元的 GDP 對應的存儲容量分別達 37.26 GB、35.76 GB、33.66 GB、32.82 GB,存先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 儲在經濟發展中的支撐能力較為明顯。日本、中國、法國等國家處于中間水平,每一萬美元的 GDP 對應的存儲容量約在樣本國家中位數 20-25 GB 左右,墨西哥、巴西等發展中國家的排
149、名較為靠后。相較于 2020 年,不同國家的單位 GDP 存儲容量有不同趨勢,但是全球主流國家的存力投資容量 2021-2023 年這兩年間至少增長了 15%26,這表明全球主要區域及國家對存力容量高度重視且持續通入。另一方面,部分國家受到通貨膨脹等因素影響,導致名義 GDP 增速快于實際存儲容量投入。例如,巴西名義 GDP 在 21-23 年增長了約 24.8%,但通貨膨脹率也在同期顯著增長,如巴西在 2021-2023 年的通貨膨脹率分別是 10.6%、5.8%、4.6%,存力投資快速實際經濟增長27。指標指標 2 數據存力充足性數據存力充足性 1)指標解釋與結果展示指標解釋與結果展示 數
150、據存力充足性衡量的是數據量需求和存儲容量供給之間的匹配關系。通過計算一國數據存儲容量除以一國數據總產量可以反映當年一個國家或地區所生產的所有數據中,有多大占比可以被存儲,以反映存力的充足性可以衡量一個國家的數據存力是否足夠充足以支撐其經濟社會高質量的發展需求。圖 2-8 各國數據存力充足性表現 60 2)指標結果分析與典型案例指標結果分析與典型案例 2023 年,當前水平世界排名前三的國家還包括瑞典、德國和新加坡,數據存力充足性分別為 14.2%,13.4%和 12.2%。全球數據產生量在快速增長,存力供給增速相對較慢,因此數據存力充足性出現下行趨勢。隨著語音、視頻、圖片等非結構數據體量的快速
151、增長,對安全可靠高性能的數據存儲方案的需求將會持續提升。例如,德國自 2021 年開始就通過了一系列聯邦政府數據戰略(如歐洲“Gaia-X”項目),強調服務數據安全存儲、處理和共享的基礎設施建設,增強歐洲數字主權,這有效刺激了數據存儲產業的建設需求。2023 年,中國的數據存力充足性數據為 6.4%(2020 年為 8.9%),當前數據充足水平尚不充足。對比同期美國數據能發現,中國存力供應起步晚、基數小,充足性絕對水平不足、增長速度仍相對較慢。指標指標 3 數據存留率數據存留率 1)指標解釋與結果展示指標解釋與結果展示 先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 數據
152、存留率測算在單位時間內,一個區域內產生的總數據量中,被有效保存至硬盤存儲(“盤化”)的數據總量占比。如果說數據存力充足性表示一個區域“承接數據產生量的潛力上限”,那么數據存留率則表示“有多少數據被該區域保存至存儲系統并被妥善保管”,更高的數據存留率直接反映了一個區域/國家對數據要素的重視程度及實際利用情況。具體而言,數據存留率其中的計算過程涉及了存力充足性、新增數據占用率以及新增數據周轉率等因素,其中“區域內存力供應*被保存數據存力資源占用率”表示每年新增被盤化保存的數據當量,受到數據保存策略、冷熱溫數據生命周期管理策略等因素影響,是一個應被重點關注的綜合性指標??偟膩砜偟膩碚f,說,我們認為我
153、們認為數據存留率數據存留率的重要性的重要性來自兩方面來自兩方面。一方面是深化對深化對歷史歷史數據價值的挖掘數據價值的挖掘,從而從而促進促進社會社會福祉福祉、保障民生保障民生民權民權、使能產業發展使能產業發展。例如,在德國博物館、圖書館和國家檔案館保存的具有歷史和文化價值的文件,需要永久電永久電子化保存子化保存,以方便公眾查詢和歷史研究;再如,德國公司的股東會議記錄、董事會決議等數據,需電子化保留至少電子化保留至少 10 年年,以確保公司治理公司治理和法律合規法律合規。另一方面另一方面為為加速加速智能時代的智能時代的到來,到來,國家和國家和企業企業要要挖掘并挖掘并留存更多的數據供留存更多的數據供
154、 AI 發展使用發展使用。當前以大模型為代表的原生 AI 應用,更多是更多是學習正確的結果學習正確的結果(即“經驗”)。在未來,以數據為“燃料”的 AI 原生應用,有條件通過學習錯誤的結果有條件通過學習錯誤的結果(“教訓”),以及從從“過程數過程數據據”中進行學習中進行學習,加速通用人工智能(AGI)的到來。正如圖靈獎得主、谷歌前副總裁杰弗里辛頓辛頓曾做訓練過一個嘗試識別手寫數字的小型神經網絡,在訓練數據集編寫時,辛頓故意讓訓練數據集的錯誤率達到錯誤率達到 50%且不且不更改更改這些被錯誤標注的數據集。但當他基于該數據集,使用反向傳播訓練法(BP 算法)進行持續梯隊優化時,神奇的事情發生了:在
155、識別新的手寫數字時,在識別新的手寫數字時,模型給出模型給出答案答案的的誤差降到了誤差降到了 5%以下以下。這意味著,這個小型神經網絡“意識”到訓練數據集本身是有問題的,已具備了一定的“分辨”能力,成功避免了過擬合(Overfitting)等問題。辛頓辛頓后來后來感嘆感嘆道道:“使用錯誤的訓練數使用錯誤的訓練數 62 據,據,可能可能反正能讓反正能讓 AI 獲得更好的結論獲得更好的結論,正如聰明學生可以知道老師講的知識中,有一半可能并不那么準確、因此能夠(通過學習與反思)比其導師更聰明,AI 也是如此?!贝竽懻雇磥?,除了“錯誤的數據”外,大模型等 AI 原生應用也可能通過對“過程數據過程數據”
156、的學習,在執行任務時在執行任務時將不僅能“知其然”,還能“知其所以然”將不僅能“知其然”,還能“知其所以然”。例如,隨著敏捷開發成為趨勢,開發者的代碼也被分為了成功提交上主干(Main Branch)且符合公司編碼要求的“正確代碼”,及未成功提交主干的“過程代碼”。通過全盤學習“正確代碼”與“過程代碼”,輔以海量數據輸入與先進算法架構,AI 原生應用有條件真正理解敏捷開發全過程、從而具備檢查錯誤代碼乃至生成正確且符合公司編碼規范代碼的能力。圖 2-9 各國數據存留率表現 2)指標結果分析與典型案例指標結果分析與典型案例 中國的數據存留率僅為中國的數據存留率僅為 2.83%,不及美國的一半,不及
157、美國的一半,也落后于瑞士、新加坡、德國、美國等國,幾國分別為 8.62%、7.75%、7.37%、7.30%。數據存留率其中的計算過程涉及了對國家的存儲容量供應、企業級數據存力充足性、生產數據周轉率等領域,存留率應當被視作為先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 一個綜合性指標。因此通過此指標可反映出中國的綜合實力較孱弱,進步空間大,中國目前的存力水平依舊與世界數據存儲強國有較大差距。中國與中國與歐美歐美等國數據存留率有差距,核心等國數據存留率有差距,核心在于在于潛在價值數據目前還沒有潛在價值數據目前還沒有在存儲系統中在存儲系統中存留存留。而數據存不下來、不被組織
158、保存下來的核心原因,是因為數據沒法很好地賦能決策、數據的價值也未得到充分挖掘。在智能經濟時代,隨著數據要素市場的規?;l展與大模型等 AI原生應用對海量高質數據的需求,勢必會強化千行百業對數據價值的深化挖掘,使得更多行業的數據將需要被很好地保存、以形成高質量數據集。例如例如,在氣象預測領域,早在 2018 年,歐洲中期數值天氣預報中心(ECMWF)就啟動了“歐洲氣候數據存儲(CDS)”服務,提供過去、現在和未來氣候信息的一站式服務。具體而言,CDS 包含一個工具箱,可以讓用戶建立自己的基于網絡的應用程序,分析、監測和預測氣候驅動因素的變化及其對商業部門的影響,如分析地表溫度和土壤濕度的變化及其
159、對能源、水資源管理或旅游業的影響。該數據存儲服務可開放獲取并免費供所有人使用,極大地改善了獲取氣候數據和工具的途徑,為社會經濟與氣象科學發展帶來了海量價值??偟膩碚f,總的來說,中國可在中國可在四四個維度個維度進行考量并且高質量優化數據存留率進行考量并且高質量優化數據存留率。一是以深入數據要素的價值挖掘、將更多數據保留將更多數據保留以直接提升數據存留率數據存留率;二是在重點行業圍繞核心應用(如金金融、電信、政務等行業的核心系統融、電信、政務等行業的核心系統)加速推行存算分離架構加速推行存算分離架構的加速落地,強化構建集約化共享存力資源池、以間接提升被保存數據的有效占有率、降低“服務器+本地盤”方
160、案帶來不必要的冗余數據備份、排掉“被保存數據的存力資源占用率”中的“水份”、使能高質量發展;三是持續以持續以大模型等大模型等創新型應用創新型應用為為牽引、牽引、強化對數據價值的挖掘、提升熱溫數據占比進強化對數據價值的挖掘、提升熱溫數據占比進行行,進而帶動數據周轉率的提升;四是通盤考量熱溫冷數據生命周期管理策略(即冷、熱、溫數據的存儲周期),確保較高安全等級的數據得到足夠長時間的存留確保較高安全等級的數據得到足夠長時間的存留,不可一味追求高存留率,致使關鍵或高度敏感的業務數據的存儲周期過低。64 在引導數據存留率的提升上在引導數據存留率的提升上,政府政府有有不應不應簡單地簡單地數據存留率視作企業
161、數據存留率視作企業的的內部管理內部管理行為行為,而應,而應積極發揮引導作積極發揮引導作,“有為而治有為而治、主動引導主動引導”。第一,政府應積極發展數據要素市場發展,加加速速完善完善數據數據要素要素的確權的確權、定價機制定價機制,使能數據在不同組織間的有序有序流通流通與交易與交易,從源頭上源頭上提提升升企業挖掘、存留數據的積極性,促使企業將數據視作智能經濟時代的“核心資產”。第二,政府可強化以大模型等原生 AI 應用在政務、金融、電信等行業的部署、以對智能涌現的促進、強化對數據要素價值的深度挖掘,實現從“人力頭腦風暴式數據挖掘”到“硅基智能體自適應數據挖掘”范式的轉變。第三,政府應應針對各個行
162、業出臺數據針對各個行業出臺數據分級分級管理管理機制機制、推推動更多動更多組織組織日常日常數據的數據的保存保存。例如例如,英國國家衛生服務體系(NHS)也實施了電子健康記錄系統,患者的病例保存期限受到一系列法律法規和指導方針的規定患者的病例保存期限受到一系列法律法規和指導方針的規定(如 X-ray 及其他放射影像通常與病歷保存時間一致,多為最低 8 年);再如再如,荷蘭的醫院與診所遵循嚴格的法律規定,確保 X-ray 影像的長期存儲(可長達百年)。第四第四,政府政府可可主動規定敏感重要數據的存主動規定敏感重要數據的存儲周期要求儲周期要求、避免避免企業一味追求過高的數據存留率而忽視對重要敏感數據的
163、存儲周期要求忽視對重要敏感數據的存儲周期要求。例如,德國要求所有本國企業保留商業信函與員工記錄至少 6 年,相比之下中國在規范性與要求上不如德國設定嚴格,用人單位保存終止的勞動合同信息僅 2 年。指標指標 4 存力存力投資增長率投資增長率 1)指標解釋與結果展示指標解釋與結果展示 存力投資增長率指標使用 2021 年至 2023 年三年間各國的存儲投資容量的年復合增長率來衡量各國增長動能。高增長率體現的是在各國已有存力規模上的追加投資增速。圖 2-10 各國存力投資增長率表現 先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 2)指標結果分析與典型案例指標結果分析與典型案例
164、 巴西、南非等發展中國家的存儲市場增長迅速,2021-2023 年復合存力投資增長率(按容量)均超過 40%。巴西政府重視數據中心的行業發展,將其視為鼓勵包括銀行業等多行業發展的重要推力,寬松的環境也吸引了針對性的投資。2017 年來,谷歌已經在巴西持續投入建設 ICT 基礎設施、強化存力投資建設,并將在圣保羅等地進一步擴大投資水平。中國 2021-2023 存力容量擴建投資復合增長率僅為 24.4%,與 17-19 年 44.7%增幅相比,出現較大滑落。此外,中國存力容量擴建投資仍有相當一部分來源于二級系統的 HDD 規模增長,相比之下同為發展中國家的南非和巴西,在 19-23 年期間,全閃
165、化投資超過 55%。2.3.2 效率衡量:效率衡量:10 倍性能提升與內生智能特性加速數字經濟規?;鲩L倍性能提升與內生智能特性加速數字經濟規?;鲩L 指標指標 5 通用計算通用計算存算比存算比 1)指標解釋與結果展示指標解釋與結果展示 66 存儲和計算均為數字基礎設施中的重要組成部分,通過計算數據算力的體量和數據存力的容量可以評估數據中心建設的平衡性,避免因為存力的短缺造成算力的冗余而影響數據處理中的效率。隨著數據為王的時代到來,數字應用的關注重點也從追求計算機的計算速度轉變為追求大數據處理能力,單純的數據算力無法單方面支撐整個數據中心的運營,還需要相匹配的數據存儲容量。圖 2-11 各國通
166、用計算存算比 2)指標結果分析與典型案例指標結果分析與典型案例 存算比表現相對較好的國家中,新加坡作為亞太地區的數據樞紐,不僅政府推出一系列如“智慧國計劃”的政策激勵強調 ICT 基礎設施,還是多個全球 ICT 解決方案供應商的區域總部,如谷歌、微軟等。據預測,據預測,全球通用計算總量將全球通用計算總量將在在 2030 年年達達到到 3.3 ZFLOPS,與與比比 2020 年年相比相比增長十倍增長十倍,這意味著全球年均算力將在這十年間呈這意味著全球年均算力將在這十年間呈 25%的年復合增長率。的年復合增長率。中國作為算力全球第二,且將人工智能產業作為核心未來產業且 AI 產業應用潛力最大的國
167、家之一,其對算力(尤其 AI算力)的需求量必定不低于 25%。當前,中國在 2021-2023 年算力年復合增長率約為 25%先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 左右,這意味著算力配置仍有一定增長空間;21 到 23 年中國目前的同期存力年復合增長率僅為 11.5%,存力有進一步增長的空間。指標指標 6 閃存占比閃存占比 1)指標解釋與結果展示指標解釋與結果展示 閃存是業內升級演進的重要趨勢,通過計算各個國家當年數據存力總投資額中閃存相關產品的投資占比可以進一步分析不同國家對于敏捷高效生產力的使用情況,占比越高代表該國家進行快速的數據調取和挖掘時,閃存能夠提供
168、強大的底層支撐能力,存力敏捷性更強。圖 2-12 各國閃存占比表現 2)指標結果分析與典型案例指標結果分析與典型案例 閃存技術相對于傳統 HDD 響應快、容量更高,且近幾年由于競爭逐步完全、價格正在逐步下行。中國對于 2019 年至 2023 年 5 年的累計閃存投資額僅為總體 5 年投資額的 29.2%,在世界內均處較低水平。排除小基數的影響,美國仍然是當前世界范圍內閃存占比指標表現美國仍然是當前世界范圍內閃存占比指標表現最好的經濟體最好的經濟體。如此看來,中國企業需更積極地挖掘數據要素價值、提升熱溫數據比例、從 68 源頭提升對先進介質的需求;同時,積極關注 SSD 介質在方案層級 TCO
169、(如低碳帶來的運營成本節降)而非單純聚焦 SSD 與 HDD 在 Capex 上的對比。相較于 2020 年的累計統計數值,哥倫比亞依然維持世界領先的地位。哥倫比亞的數據中心產業持續蓬勃發展,尤其在電信、電子政務、智慧城市、金融等關鍵行業持續加碼先進閃存介質的應用。例如,Claro Columbia、Movistar Columbia 等電信運營商在其數據中心內積極應用全閃化數據存儲解決方案。再如,金融等行業同樣需要快速交易、實時分析、保障敏感數據安全也加大了國家對于先進介質的擁抱,因此哥倫比亞的閃存化率保持世界領先。領先國家閃存率高的核心原因,主要在于更高自動化程度的應用系統對領先國家閃存率
170、高的核心原因,主要在于更高自動化程度的應用系統對 SSD 全閃化方案提全閃化方案提出的剛出的剛性性需求,以及在選項數據存儲方案時對方案級需求,以及在選項數據存儲方案時對方案級 TCO 的重視。的重視。一方面,高度自動化的系統對數據處理速度和效率有極高要求,推動了對 IOPS 和讀寫帶寬等高性能指標的需求;另一方面,全閃化方案的 TCO 當前在諸多場景下已有條件與 HDD 方案相當乃至更優,對方案級 TCO 的重視也使能領先國家更傾向于使用全閃存化解決方案。2.3.3 基本保障:滿足安全穩定的基本發展要求基本保障:滿足安全穩定的基本發展要求 指標指標 7 災備覆蓋率災備覆蓋率 1)指標解釋與結果
171、展示指標解釋與結果展示 容災備份投資是可靠性重要表征,充足的容災備份能有效應對各類網絡安全攻擊和意外。災備覆蓋率衡量的是數據存力投資中用于備份和容災恢復的投資占比。更高災備覆蓋率意味著企業能將自身更大的業務數據存儲更高的年限。圖 2-13 各國災備覆蓋率表現 先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 2)指標結果分析與典型案例指標結果分析與典型案例 從樣本數據來看,數據存儲的災備覆蓋率仍低于預期。新加坡(43.5%)、加拿大(37.6%)和法國(36.2%)的存儲投資中用于災備的占比最高,表明其數據應對各類意外的韌性較強。而中國(11.1%)的災備投資占比相對較低,
172、可以看出中國在存儲災備行業投入嚴重不足,一旦發生應急事件或會造成較大損失。2024 年 4 月,中國工信部發布關于做好 2024 年信息通信業安全生產和網絡運行安全工作的通知已經提及,現階段應當“加強投入保障,各企業加強頭籌規劃能力,以增強容災備份能力”。目前,中國容災備份等級最高的金融業僅實現 4 級(美國已擁有多個 6 級存儲區域),大部分行業備份水平仍處于 1-2 級,可見中國容災備份行業未來的增長空間巨大,政府需要以更大的力度采取措施鼓勵、敦促容災備份在國計民生各個行業發揮應有的風險防控作用。新加坡為數據中心產業、金融服務與金融科技產業等國家關鍵戰略產業提供了安全穩定的數據存儲方案,新
173、加坡對數據容災備份的重視和顯著投資是出于對自身重點產業的保護,在新加坡,有許多數據中心直接采用了 Tier 3 和 Tier 4 級別的災備需求。70 2020-2023 年,日本推出了一系列政策以提升數據災備覆蓋率和加強災害管理,提高災害管理的效率;法國通過經濟復蘇計劃(France Relance)加強了數據災備的覆蓋率,特別是通過對數字化和綠色技術的投資來提高數據中心的安全性和可持續性。2.3.4 前沿創新:綠色先進實現可持續發展需求前沿創新:綠色先進實現可持續發展需求 指標指標 8 單位存儲容量能耗單位存儲容量能耗 1)指標解釋與結果展示指標解釋與結果展示 存儲設備導致的碳排放與日常使
174、用過程中的能耗直接相關,在衡量綠色指標中,通過將存儲設備一年耗電量除以總存儲容量來進行不同國家存儲設備綠色性的比較,單位存儲容量能耗越低,則代表數據存力碳排放低,更好支持社會實現節能減排。圖 2-14 各國單位存儲容量能耗表現 2)指標結果分析與典型案例指標結果分析與典型案例 2020 年到年到 2023 年,全球主要國家的單位容量能耗都有下降的趨勢,核心原因是各國閃存年,全球主要國家的單位容量能耗都有下降的趨勢,核心原因是各國閃存化率的提高與對數據中心綠色化發展解決方案的投入?;实奶岣吲c對數據中心綠色化發展解決方案的投入??傮w而言,當前數據存儲行業正見證先進數據存力:新質生產力的必由之路先
175、進數據存力:新質生產力的必由之路 著向低碳、高效兩個維度的轉型。從排名來看,英國、美國、捷克、德國、瑞典和法國單位容量能耗最低,而南非、墨西哥、泰國和印度最高。中國相較中國相較 2020 年有一定程度下降,但整體而言降幅相對美國、德國等仍有一定差距,主要年有一定程度下降,但整體而言降幅相對美國、德國等仍有一定差距,主要的原因之一是全閃化率的提升程度較低。的原因之一是全閃化率的提升程度較低。在 2023 年,中國對數據存儲的投資額中,僅32.6%為閃存投資,相比之下德國、新加坡、英國、美國與印度等國的閃存投資額占比均超50%。盡管國內部分數據中心在積極嘗試創新型解決方案(如創新型冷卻系統),但提
176、升閃存占比對節省存儲設備能耗而言,是更為本質且效果更為顯著的降碳方案。為持續降低單位容量能耗水平,中國一方面需強化全閃化進程、從源頭降低存儲設備的能耗水平,另一方面在數據中心層面探索降低能耗的解決方案,如創新型冷卻系統、數據中心智慧運維方案、引入可再生能源等,雙管齊下以實現可持續降碳。指標指標 9 數據存力專利占比數據存力專利占比 1)指標解釋與結果展示指標解釋與結果展示 數據存力相關專利體現了科技創新水平,也幫助企業增強市場競爭力。本文統計了 2023 年當年全球“數據存儲”和“存儲器”相關的專利申請量,并按照申請人注冊地址區分國別。圖 2-15 各國數據存力專利占比表現 72 2)指標結果
177、分析與典型案例指標結果分析與典型案例 2023 年,全球與數據存儲年,全球與數據存儲和存儲器和存儲器有關的專利申請數超過有關的專利申請數超過 28 萬。萬。從專利數量上來看,美國始終保持世界范圍內的領先優勢,中國中國已在已在 2023 當年已顯現追趕勁頭,但總量上仍與美當年已顯現追趕勁頭,但總量上仍與美國仍有差距國仍有差距。尤其在高價值專利領域,中國和美國差距十分顯著。尤其在高價值專利領域,中國和美國差距十分顯著。在 2023 年,美國超過 30 萬美元以上的高價值專利申請數超過 2.7 萬份,超本國申請專利數的 20%,與此同時,中國基本沒有高價值專利申請。這意味著,在尖端存儲領域的創新上,
178、中國與美國仍存在較大差距。美國高價值由一眾高科技公司貢獻,主要是谷歌、英特爾、Sonos、蘋果等在為專利研究做貢獻,高價值專利內容的關鍵詞有“服務器架構”、“存儲網絡”、“存儲池”等。另一方面另一方面,美國的專利申請環境玩家多元、內容均衡,美國前十專利申請人僅貢獻了整體專利申請數的 10%。而中國的前十專利申請人貢獻了整體專利申請數的近 20%。美國的領先優勢源于其強大的研發基礎、充足的資金支持、豐富的人才儲備和完善的知識產美國的領先優勢源于其強大的研發基礎、充足的資金支持、豐富的人才儲備和完善的知識產權保護體系。權保護體系。尤其需要注意的是,美國達成了產學研一體化的統一性,通過政府和企業、高
179、校之間的密切支持合作,促進技術研發和創新。比如,Manufacturing USA 計劃通過聯邦和企業共同資助,促進工業界與學術界合作,推動先進制造業發展。加州大學伯克利分校先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 的實驗室 AMPLab 與戴爾公司展開長期的技術合作,專注于大數據處理和存儲技術的研究,共同推動了技術的應用和優化。亞洲方面,印度亞洲方面,印度的的表現表現非常非常突出突出,主要是因為近兩年有諸多跨國公司在印度申請專利。,主要是因為近兩年有諸多跨國公司在印度申請專利。例如,2023 年印度前十專利申請人有 7 家是大型跨國公司,例如 Qualcomm、小
180、米、三星等,且這 7 家公司貢獻了印度整體專利申請數的 25%29。2.4 全球各區域發展存力的高階發展建議全球各區域發展存力的高階發展建議 2.4.1 全球各全球各區域存力發展現狀區域存力發展現狀 不同國家區域的發展階段不盡相同,我們按照存力充足性存力充足性(衡量充分性)與全閃化率全閃化率(衡量先進性),將全球區域細分為 4 大類型,分別為“普惠閃存型”、“充足傳統型”、“精益聚焦型”與“后發漸進型”。圖 2-16 全球各區域存力產業發展現狀 74“普惠閃存型”“普惠閃存型”國家國家存力充足性以及閃存化率均較高,存力充足性以及閃存化率均較高,通過定位全球存儲產業地位、出臺激通過定位全球存儲產
181、業地位、出臺激勵與規范政策、推動聯合創新以及鼓勵頭部企業采納先進方案,全面發展國家先進勵與規范政策、推動聯合創新以及鼓勵頭部企業采納先進方案,全面發展國家先進數據數據存力存力產業。產業。例如,美國的數據存儲充足性和高閃存化率得益于政府的高度重視和財政支持,如芯片法案等政策提供了大量資金支持。通過產學研一體化的合作,企業與國家實驗室共同推動先進存儲技術研發。此外,產業界對先進存儲方案的積極應用,如英偉達在 AI 基礎設施中的全?;鉀Q方案,進一步提升了美國的存力水平。未來,美國將繼續在存儲技術創新、數據安全與可持續性以及國際合作方面發力,鞏固其在全球存儲產業中的領導地位?!俺渥銈鹘y型”國家的存力
182、充足性處于世界領先地位、但閃存化率低于全球平均。這些國家“充足傳統型”國家的存力充足性處于世界領先地位、但閃存化率低于全球平均。這些國家通常已具備較好的數據中心產業基礎,但國家內的存力升級的速度仍有待進一步提升。通常已具備較好的數據中心產業基礎,但國家內的存力升級的速度仍有待進一步提升。以加拿大為例,加拿大的存力充足性得益于廣泛分布的災備覆蓋的發展。目前加拿大的 HDD 和SSD 容量分別占總容量的 86%和 14%,其閃存化率較低與其資源型的經濟結構和數據密集型產業的需求相對較少有一定關系。未來,以加拿大為代表的充足傳統型國家可以通過政策支持和激勵措施,鼓勵企業和數據中心投資于閃存技術;此外
183、,這類國家還可以加強對綠色ICT 產業的打造,進一步推動閃存化進程?!熬婢劢剐汀眹议W存滲透率高但存力充足性水平較低、“小范圍先進、普惠性不足”?!熬婢劢剐汀眹议W存滲透率高但存力充足性水平較低、“小范圍先進、普惠性不足”。巴西的高閃存率與低存力水平之間的差異,主要源于其數據中心服務的集中性。數據中心主要服務于政府、金融、油氣等高需求行業,這些行業對數據存儲的安全性、可靠性和性能要求極高,因此推動了閃存技術的廣泛應用。然而,這些設施并未普及到全社會,普通用戶和小型企業的存儲需求相對較低。此外,巴西正積極發展電商和智能制造等新興產業,這些領域對先進數據存力的需求逐步增加,但整體仍處于初期發展
184、階段,導致人均存力水平仍然較低。展望未來,以巴西為代表的精益聚焦型國家可考慮加大對電商、智能制造等新興產業的支持,推動數據存力的廣泛應用;與此同時,加強 ICT 基礎設施建設,普及先進存儲技術,使更多中小企業和個人能夠受益。先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 “后發漸進型”的國家的存力充足性以及閃存化率均較低?!昂蟀l漸進型”的國家的存力充足性以及閃存化率均較低。以中國為例,多數應用系統的自動化水平較低導致對存儲的性能要求有限、對方案級 TCO 重視程度不足等原因,使得閃存化率偏低,當前中國全閃化率僅為 6.22%,遠低于世界平均水平 17.01%。但辯證地看,
185、“后發漸進型”國家也有更大的“彎道超車”機遇“后發漸進型”國家也有更大的“彎道超車”機遇,這些國家并不存在需大規模替換現有傳統存儲方案,而可直接加速全閃化方案的投資建設,實現存力產業“躍遷”。2.4.2 典型國家建設先進數據存力典型國家建設先進數據存力的核心的核心啟示啟示 成功從發展先進數據存力產業獲益的國家可分為三類,一類是強應用型國家,一類是注重芯成功從發展先進數據存力產業獲益的國家可分為三類,一類是強應用型國家,一類是注重芯片和整機研發制造的產研型國家,還有一類是全棧型國家。片和整機研發制造的產研型國家,還有一類是全棧型國家。強應用型國家更多聚焦采購應用先進數據存力相關解決方案以賦能自身
186、產業轉型升級,不大規模投入數據存儲設備及零部件研發,全球大多數國家均為應用型國家,其中德國、新加坡為強應用型國家的代表;產研型國家聚焦研發存儲設備的關聯零部件(如 NAND Flash 芯片)和軟件,具備整機研發制造能力,但不一定在先進數據存力方案應用上進行大規模投入,僅少數國家有能力成為產研型國家(如韓國);全棧型國家實現了“芯片/軟件/部件設計生產 存儲整機研發制造 先進數據存力方案應用”的全?;采w,這樣的國家既具備端到端自研能力,也積極在本國應用先進數據存力方案,如中國、美國。本白皮書以德國、新加坡、韓國與美國為例,對三類國本白皮書以德國、新加坡、韓國與美國為例,對三類國家的發展特征及
187、關鍵成功要素進行梳理總結,以期形成可借鑒的經驗供其它區域參考。家的發展特征及關鍵成功要素進行梳理總結,以期形成可借鑒的經驗供其它區域參考。圖 2-17 全球各國建設先進數據存力產業的領先實踐 76 德國德國:政策與產業應用雙元并舉,打造全球數據存儲強國政策與產業應用雙元并舉,打造全球數據存儲強國 德國作為歐盟的經濟領頭羊,在歐洲數據存儲產業中扮演了積極擁抱者的角色,同時以嚴格德國作為歐盟的經濟領頭羊,在歐洲數據存儲產業中扮演了積極擁抱者的角色,同時以嚴格的政策要求促進數據存儲等的政策要求促進數據存儲等 ICT 產業的安全可持續發展,具體而言可總結為產業的安全可持續發展,具體而言可總結為三個階段
188、三個階段。第一階段始于 1990 年代中期,德國經歷互聯網服務快速增長,企業開始建設和租用數據中心;第二階段發生在 2000 年代初期,谷歌、微軟等科技巨頭開始進入市場并設立研發中心,德意志電信等開始大規模建設數據中心以提供多樣化服務;第三階段從 2010 年開始大數據時代來臨,帶來了數據中心的建設量井噴,并于 2016 年起強化數據保護法與綠色發展法案,強化安全可持續發展。如今,德國數據存儲產業在存力充足性、全閃化率、可靠性(如災備覆蓋率)、綠色可持續發展實現全球領先(如 PUE),在政策與企業的雙重驅動下成為歐洲存儲強國??偨Y德國存儲產業發展的成功要素,我們發現其具備三大特征??偨Y德國存儲
189、產業發展的成功要素,我們發現其具備三大特征。一是政策監管與德資企業對合規性的忠實,帶來更高的剛性容災備份需求,二是德國企業對數據要素的挖掘充分;三是高度重視可持續發展,持續產業政策與標準要求進行牽引。先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 首先首先,德國,德國對多種類型對多種類型數據數據的的存儲存儲要求要求設定了更高標準設定了更高標準,使其存力投資與災備覆蓋率充足,使其存力投資與災備覆蓋率充足。例如,在 2020 年商法典及稅務法的修訂版中,要求德國企業保留商業信函與員工記錄至少 6 年,賬簿、發票等會計記錄至少 10 年。相比之下,盡管中國也有如勞動合同法法規,
190、但是中國在規范性與要求上不如德國設定嚴格,如用人單位保存終止的勞動合同信息僅 2 年,對諸多企業日常經營類數據缺乏相關硬性規范和嚴格要求。此外,此外,德國全球性德國全球性企業通常也會對數據存儲年限做出嚴格企業通常也會對數據存儲年限做出嚴格且具體且具體的的要求。要求。例如,某德資領先汽車行業 Tier 1 知名供應商要求員工檔案至少保存 10 年30、年度財報與 BP 報告等敏感信息至少保存 15 年,且在全球范圍內貫徹該要求(包括中國區)。其次,德國政府高度重視可持續發展,持續產業政策與標準要求進行牽引。其次,德國政府高度重視可持續發展,持續產業政策與標準要求進行牽引。在 2014 年,德國推
191、出了 DIN EN 50600 數據中心標準,為谷歌、微軟等一眾巨頭確立了數據中心的建設參考規范。在 2021 年,德國政府聯邦政府數據戰略提出建設可持續的數字基礎設施,而德國復興信貸銀行也根據德國的可再生能源法修訂版與德國氣候行動計劃 2050推出了針對綠色數據中心的最高百萬級的貸款計劃,以低息率、長期還款期等政策優惠,根據企業項目規模等因素對在德數據中心進行改造與建設。例如,德意志銀行在 2017 年與 Pure Storage 合作,采用了 Pure Storage 的全閃存陣列替代了傳統機械硬盤改造了數據中心,極大程度提高了德意志銀行的數據處理效率,比如提升了 CRM 和 ERP 系統
192、性能,使得德意志銀行處理大量客戶數據和實時信息抓取管理的效率有效加強。此外,德國企業對數據要素的挖掘充分此外,德國企業對數據要素的挖掘充分。例如,某外資汽車零部件供應商設立專門的數據管控組織,按需協助業務部門抓取并導出所需分析的數據,從組織架構上為研產供銷服等各職能提供數據服務,促進各職能提升對自身日常運營及成本項目等數據的掌控與實時分析能力?;谄髽I與政府的共同推動,德國當前具備超 350 個數據中心,一級存儲系統在全存儲系統中占比高達 76%、全閃存占整體存儲容量的 51%,成為數據存儲強國。78 新加坡:以政策優惠新加坡:以政策優惠招商招商引資引資,持續強化本土運營商創新能力持續強化本土
193、運營商創新能力形成互補形成互補 首先,新加坡在過去半個世紀以來持續重視創新產業,并積極以稅收優惠及補貼政策招商引首先,新加坡在過去半個世紀以來持續重視創新產業,并積極以稅收優惠及補貼政策招商引資并吸引外資高科技企業的持續投資、提升經濟水平、創造就業機會、培養高水平人才資并吸引外資高科技企業的持續投資、提升經濟水平、創造就業機會、培養高水平人才。例如,1999 年發布的全球貿易計劃32與 2010 年發布的創新發展計劃33等政策,提供高達 10%的企業所得稅等優惠,并成功吸引多家 ICT 企業在新開設分支機構與持續投資,其中就不乏數據存儲產業領先企業,西部數據于 81 年入駐、希捷于 82 年入
194、駐。再如,2016 年發布的 34 等補貼政策,通過提供新員工 90%的培訓補貼、應屆生 50%-70%的培訓與實習費用補貼以及定制化培訓計劃激勵谷歌等企業培養本地新加坡人才,向數字化未來更進一步。例如,谷歌 2022 年在新招聘約 200300 名員工,而其中來自新國高校的候選人就達到 65 人,占當年招聘員工量的至少 20%。近年來,為適配數智化時代的到來,新加坡在近年來,為適配數智化時代的到來,新加坡在 2014 年提出了智慧國度年提出了智慧國度 2025 計劃,以數據計劃,以數據中心建設為核心,發展先進數字化產業。中心建設為核心,發展先進數字化產業。一方面,滿足當地產業生態的數字化升級
195、要求,如新加坡本土企業 Singtel、Keppel Data Centres 運營的數據中心為有數據存儲需要的企業提供托管服務;另一方面,將算力與存力等數據服務發展為一個獨立的戰略性產業,如Singtel 利用自己的數據中心為其他企業提供提供數據數據存儲服務存儲服務。更進一步,為強化本土企業創新能力、強化自主創新能力,新加坡本土運營商也積極與在新更進一步,為強化本土企業創新能力、強化自主創新能力,新加坡本土運營商也積極與在新ICT 廠商合作、聯合研發數據中心管理工具方案等創新型業務廠商合作、聯合研發數據中心管理工具方案等創新型業務。如此,新加坡運營商與外企ICT 基礎設施廠商就形成了互補關系
196、,共同為用戶企業提供數據存儲托管服務套餐。例如,Keppel 與思科一同開發數據中心管理工具,Singtel 與微軟 Azure 聯合創新數據存儲技術等?;谶@些創新型解決方案,運營商提升了對自身數據中心的運營管理能力、也實現了第二增長曲線,如 Keppel Data Centres 的數據中心服務可占 Keppel 集團總收入的 7%。先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 此外,新加坡高校也積極與數據存儲企業合作,形成產學研一體化生態。此外,新加坡高校也積極與數據存儲企業合作,形成產學研一體化生態。如希捷與南洋理工大學合作開展了數據存儲課程和項目,共同研發高密
197、度數據存儲解決方案,包括熱輔助磁記錄技術等先進存儲方案。經過多年的發展,以數據中心為核心的產業生態已為新加坡直接貢直接貢獻了約獻了約 15 億美元億美元 GDP 增長(占新加坡年增長(占新加坡年 GDP 增量超增量超 10.5%)與大量就業崗位)與大量就業崗位,帶動提升了新加坡的數據存儲產業生態發展??偟膩碚f,新加坡發展數據存儲產業的成功要素有三??偟膩碚f,新加坡發展數據存儲產業的成功要素有三。一是設立清晰的政策目標清晰的政策目標,到 2025年數據存力產業投資規模達到 10 億新加坡元,每年培養數以千計的人才完成高級技能培訓以支持國內外存儲領域企業,并新建或改建 20 個綠色標準數據中心;二
198、是利用優質外商投利用優質外商投資與補貼政策吸引優質資與補貼政策吸引優質 ICT 企業入駐企業入駐;三是產學研深度協同產學研深度協同、持續保障頭部企業的高素質人才供給。美國:多級政府齊發力,打造產學研一體化的先進數據存力生態美國:多級政府齊發力,打造產學研一體化的先進數據存力生態 在政府層面在政府層面,美國聯邦及州政府高度重視數據存儲產業,在過去十年積極出臺多項政策,以美國聯邦及州政府高度重視數據存儲產業,在過去十年積極出臺多項政策,以直接財政支持先進數據存力產業發展。直接財政支持先進數據存力產業發展。例如,美國聯邦政府于 2022 年推出了芯片法案,以超 500 億美元的費用資助美國本土半導體
199、產業用于半導體和存儲技術的研發、生產以及人才培養,并給予了 240 億美元的投資稅抵免。再如,紐約州的 Strategic Plan 中提到的Tech Innovation for All Program 希望將的政府、企業與科研組織相結合以達成科技技術創新研發,其中包括數據存儲技術,為此政府提供了 5 千萬美元的贊助費用。除直接對企業進行財政支持以外,以政府機關鼓勵并資助除直接對企業進行財政支持以外,以政府機關鼓勵并資助國家實驗室國家實驗室推動產學研一體化,也推動產學研一體化,也是美國實現存力產業領先的核心抓手之一是美國實現存力產業領先的核心抓手之一。企業通過國家科學基金會與能源部的CRAD
200、As政策(合作研究和開發協議政策)達成與國家實驗室的直接合作,開發 N+1 代產品的架構與特性,如 Seagate 與勞倫斯伯克利國家實驗室(美國能源部所有,加州大學運營管理)一同 80 開發了應用于大數據和快速數據處理需求的創新存儲介質與架構;另一方面,也可以為下一代產品做預研,如 HP 與橡樹嶺國家實驗室一同開發了應用于超算環境下應用于超算環境下的數據管理和存儲解決方案。針對超算場景,美國政府資助的實驗室亦多有布局,進而帶動了先進數據存力產業的進一步針對超算場景,美國政府資助的實驗室亦多有布局,進而帶動了先進數據存力產業的進一步發展。發展。例如,美國橡樹嶺國家實驗室(Oak Ridge N
201、ational Laboratory)的 Frontier 超級計算機在第 62 屆 TOP500 排名為第一,是世界上第一臺百億億次級別的超級計算機。Frontier實現了 1.194 Exaflop/s 的性能,存儲環境則具有近 700 PB 的容量,這使得其存算比也達到11 PFlops:7 PB 的標準的標準。具體而言,Frontier 系統使用了超超 5000 個個 NVMe 設備設備,總讀/寫速度達到 10TB/s,并能夠進行超過 200 萬次隨機讀取操作,輔以額外的 480 個個 NVMe設備設備構成的元數據層,用于處理混合工作負載和維護文件系統的結構。再如,23 年 6 月 2
202、2 日,英特爾(Intel)官方宣布美國能源部阿貢國家實驗室已經完成基于英特爾 CPU 及 GPU 的新一代超算“Aurora”的安裝工作,上線后將提供超過 2000 PFlops的浮點性能;存儲方面,Aurora 集成了超過 1024 個存儲節點以每秒 31TB 的總帶寬提供220PB 的總的存儲容量,這使得其存算比達 9.1 PFlops:1 PB。此外,美國產業界也對先進存儲方案有著開放的心態與積極的應用。此外,美國產業界也對先進存儲方案有著開放的心態與積極的應用。例如,英偉達優先采購專業外置存儲、為其 AI 算力基礎設施架構提供有效補充,與其算力生態形成高效協同的全?;鉀Q方案。正如黃
203、仁勛在 2024 年 GTC 大會上強調:“在 AI 大模型時代,專業存儲伙伴對我們非常重要!”,并強調Milvus等開源向量數據庫在大模型訓練場景下值得關注,認為向量數據庫乃是解鎖大型自然語言模型潛力的至關重要的基石37?!表n國:選定高價值環節多年持續投入韓國:選定高價值環節多年持續投入,政府與頭部企業緊密協同,政府與頭部企業緊密協同 先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 總的來說,韓國并不是一個“強應用型國家”,但卻由于其在存儲領域的商業優勢擁有行業總的來說,韓國并不是一個“強應用型國家”,但卻由于其在存儲領域的商業優勢擁有行業內的定價權。內的定價權。三星通
204、過其在存儲領域的市場主導地位,依靠龐大的產業鏈控制市場定價,不僅為自身帶來了可觀的經濟效益,同時創造了大量的就業崗位,顯著提升了整個韓國存儲行業的競爭力。2023 年,三星存儲業務的收入達到了 674 億美元,占集團總營收約 36%;海力士在 2023 年的存儲業務收入為 298 億美元,占其集團營收的約 70%,先進的存儲芯片產業為韓國創造了海量經濟價值與可觀的高薪工作機會,有效促進社會發展?;仡櫄v史,韓國將存儲產業作為國家半導體領域的第一優先級,自回顧歷史,韓國將存儲產業作為國家半導體領域的第一優先級,自 1970 年代開始,舉國之年代開始,舉國之力持續研發,最終在存儲領域底層技術領先世界
205、,在全球擁有存儲芯片的定價話語權。力持續研發,最終在存儲領域底層技術領先世界,在全球擁有存儲芯片的定價話語權?;仡欗n國半導體發展歷程,在 1970 年代間,以三星為代表的韓企開始為日企代工電子產品,并逐漸完成了技術轉移;同時韓國政府修改了外資投資法,確保對本土企業的強力支持。在1980 年代,韓國政府啟動了半導體產業培育計劃以推動集成電路產業的發展,同時期三星也開始研發 DRAM,并在 1990 年代末市場份額成功反超日本,時至今日,三星和海力士的 DRAM 市場份額達到的 43%和 28%。隨后,三星在 1990 年代初開始研究 NAND 芯片及 SSD,經過多年發展,最終在 2016 年前
206、后確立并夯實了自身在存儲芯片領域的技術領先地位。除三星等企業自身的大舉研發投入,韓國政府也在持續更新自身政策、對以存儲為代表的半導產業出臺多項專項政策。例如,在2010 年推出國家半導體戰略,確立了在 2030 年成為半導體領域世界第一的目標,并在2021 年實施K-半導體戰略擬投資超 4000 億美元持續推動半導體產業35,又在 2023 年提出K-芯片法案36,對 2023 年起在國家戰略產業投資可商業化設施的企業,在兩年內抵免大、小公司最高達 15%、25%的投資稅抵免,且基于 23 年是否有額外投資,可額外增加 10%的 2023 年本年的稅務額外優惠。在多重政策的加持下,三星與海力士
207、等巨頭最終確立自身在終端市場的領先地位,更進一步,三星與海力士分別于 2010 年與 2013 年前后,推出數據中心級推出企業級 SSD 產品。82 2024 年 6 月,韓國政府公布了新一期半導體行業發展規劃,擬投入 190 億美元以增強韓國半導體基礎設施建設,由韓國開發銀行贊助韓國芯片制造商和供應商,并延長了稅收優惠政策,繼續推動韓國的半導體和存儲器的發展。除了韓國政府和企業的齊心協力,雙方也積極帶動國家高校及研究中心,以求技術突破、克除了韓國政府和企業的齊心協力,雙方也積極帶動國家高校及研究中心,以求技術突破、克服人才短缺,繼續維持韓國的存儲技術領域領先地位。服人才短缺,繼續維持韓國的存
208、儲技術領域領先地位。例如,韓國政府每年以 2.7 億美元的資金直接資助韓國人工智能和大數據研究院以求 AI 和大數據計算、存儲的能力突破。再如,三星與海力士作為龍頭企業也積極與韓國各大學合作推動項目以培養人才克服短缺,兩家公司于延世大學、成均館大學以及韓國科技技術研究院等高校推出與半導體相關的課程,提供培訓項目以及獎學金支持,希望在五年內通過聯合課程培養 1160 名存儲產業人才。啟示:先進數據存力產業的穩健可持續發展,需政府與企業深度協同,在政策啟示:先進數據存力產業的穩健可持續發展,需政府與企業深度協同,在政策引導、技術創新與市場應用上齊發力引導、技術創新與市場應用上齊發力 首先,一個國家
209、需明確認知自身在全球產業格局中的位置,為自身在全球存儲首先,一個國家需明確認知自身在全球產業格局中的位置,為自身在全球存儲全棧全棧產業生態產業生態中進行中進行“戰略定位戰略定位”(如需全?;l展、還是僅核心零部件的突破)(如需全?;l展、還是僅核心零部件的突破)。例如,美韓通過產業鏈協同,分別實現了應用生態的繁榮與存儲芯片產業的領先。對中國而言,積極發展并端到端覆蓋“芯片/軟件 存儲設備整機 存算網全棧解決方案”全產業鏈環節已成為大勢所驅。其次,基于產業的其次,基于產業的“戰略定位戰略定位”制定發展目標、提供政策支持、鼓勵技術創新。制定發展目標、提供政策支持、鼓勵技術創新。一是提出清晰可量化的
210、存力產業發展目標(如新加坡智慧國度 2025 配套計劃提出數據存力產業投資規模達到 10 億新加坡元,且培養 2500 高級存儲產業人才,并新建或改建 20 個綠色標準數據中心),二是為支持這些目標的實現提供監管與鼓勵性政策支持,監管性政策對數據保存與可持續發展有嚴格規范,如德國商法典與稅務法的修訂版以及DIN EN 50600數據中心建設規范系列等,鼓勵性政策提供資助與稅收優惠,如新加坡知識產權發展激勵計先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 劃、創新發展計劃以及國家研究基金等,三是以產學研合作等機制為抓手,鼓勵企業提前布局下一代存力技術、強化頭部企業的創新能力
211、。隨后隨后,各國在各國在市場應用上應在公共部門(如政府及銀行等國有部門)積極開展先進數據存力市場應用上應在公共部門(如政府及銀行等國有部門)積極開展先進數據存力方案試點。方案試點。如果公共部門不進行大規模應用、打造可復制的先進產業案例,則國內產業將始終難以形成先進且成熟的解決方案組合、實現真正的引領。此外,也應積極鼓勵頭部 AI 原生應用廠商(大模型廠商等)強化對先進數據存力方案的應用。尤其對中國這種旨在成為全球先進數據存力全棧技術創新引領者的國家而言,以政策支持與尤其對中國這種旨在成為全球先進數據存力全棧技術創新引領者的國家而言,以政策支持與產學研協同等機制鼓勵全棧技術創新十分重要。產學研協
212、同等機制鼓勵全棧技術創新十分重要。一方面,端到端全棧創新所需的研發投入巨大,國家可定向扶持重點實驗室、鼓勵企業與高校聯合起來,共同進行下一代存力技術創新(如在超算環境下的數據存儲技術);另一方面,存儲行業規模效應顯著,從美韓等國的發展歷程看,各國最終能引領存力整個行業的僅為極少數廠商,因此應在先進數據存力全棧環節(存儲芯片、解決方案供應商等)選擇少數廠商組成產業聯盟、以頭部企業牽引行業標準制定,共同定義并持續賦能“先進數據存力”產業的發展。圖 2-18 對全球各國政府建設先進數據存力產業的建議 84 行動倡議:行動倡議:發展先進數據存力是實現新質生產力發展先進數據存力是實現新質生產力 先進數據
213、存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 3.1 先進數據存力產業發展目標建議先進數據存力產業發展目標建議 3.1.1 將數據存儲作為將數據存儲作為 ICT 產業的重要獨立門類產業的重要獨立門類單獨單獨管理管理 在數字經濟時代,算力、存力與運力的概念被提出,分別對應計算、存儲與網絡產業。盡管三力并駕齊驅的格局已然形成,但存力本身并未被作為一個重要獨立的門類進行單獨管理存力本身并未被作為一個重要獨立的門類進行單獨管理。究其本源,一是因為存力產業缺乏具體的品類映射具體的品類映射(如服務器/GPU之于“算力”、交換機/路由器/防火墻等網絡設備之于“運力”),變成了服務器硬盤與專業
214、存儲設備的統稱,而專業外置存儲的重要性并未得到重視;二是數據存儲在數字經濟時代并未與人工智能等戰略性新興產業建立起直接的關聯關系,而是更多作為ICT底座的一部分提供賦能支撐。然而,在智能經濟時代,事情正在起變化。然而,在智能經濟時代,事情正在起變化。首先,存算分離的架構創新使得抽象的“存力”有了具體的實體映射(以專業外置高性能數據存儲設備為代表)實體映射(以專業外置高性能數據存儲設備為代表),先進數據存力以集約化存力資源池、高通量網絡與開放算力生態組成的創新型架構,使得專業的外置數據存儲設備(External Controller Based Storage)成為智能經濟時代先進數據存力的核心
215、價值載體。其其次,先進數據存力“以存強算、以存代算”的特性,次,先進數據存力“以存強算、以存代算”的特性,使其能夠加速 AI 產業的發展、與算力形成補充共同促進“智能涌現”,因此智能經濟時代,建設先進數據存力也需要作為發展AI 產業的重要組成部分,在制定 AI 產業的發展戰略時一同納入考量。3.1.2 確保先進數據存力產業全棧自主可控高效協同,強化先進確保先進數據存力產業全棧自主可控高效協同,強化先進 SSD 顆粒的顆粒的國際定價權獲取國際定價權獲取 先進數據存力不僅僅是一個硬盤,其能力更不局限于一個機架,而是可以推動數據中心架構端到端變革、加速通用AI智能涌現的革命性力量,其全棧生態涉及“零
216、部件 存儲整機 存算網一體化解決方案”三個層次。近年來,全球自由貿易流通的格局與高科技領域的全球化產業分工格局于近年面臨越來越多 86 的不確定性,中國中國當前當前如希望在先進數據存力領域取得可持續的全球領先地位,需如希望在先進數據存力領域取得可持續的全球領先地位,需構建自主構建自主可控可控的先進數據存力的先進數據存力供應鏈供應鏈,將產業全棧端到端自主可控作為產業實現可持續發展的基礎。,將產業全棧端到端自主可控作為產業實現可持續發展的基礎。關鍵零部件層面,盡管國內涌現了長江存儲等關鍵零部件層面,盡管國內涌現了長江存儲等 NAND Flash 廠商且在顆粒創新上取得了一廠商且在顆粒創新上取得了一
217、定突破,但從全球視角看,當前定突破,但從全球視角看,當前 NAND Flash 顆粒的定價權集中在極少數國際品牌。顆粒的定價權集中在極少數國際品牌。如果不加速國產關鍵零部件廠商的規?;瘧貌⒖焖偃〉枚▋r權,則中國在 SSD 全閃化方案的牽引上將始終“受制于人”。因此,建議政府定向對頭部國產 NAND Flash 廠商的規?;瘧眠M行支持,強化中國在全球強化中國在全球 SSD 領域的定價權領域的定價權,為先進數據存力解決方案在千行百業的應用落地提供有力支撐。存儲整機層面,國內雖已有一批較為成熟的存儲整機層面,國內雖已有一批較為成熟的 OEM 廠商,但在產業協同上仍有進一步強化的廠商,但在產業協同
218、上仍有進一步強化的空間??臻g。先進數據存力產業尚在發展初期,產業標準尚需完全統一產業標準尚需完全統一(如接口標準、分布式標準、運維標準、安全標準等),此時正需要各類產業生態廠商(如 OEM)積極協作強化溝通、共同制定先進數據存力相關產業標準共同制定先進數據存力相關產業標準,推動先進數據存力方案走向千行百業。存算網全?;鉀Q方案層面,端到端國產化是打造本土安全可靠生態的剛需。存算網全?;鉀Q方案層面,端到端國產化是打造本土安全可靠生態的剛需。在存算分離的架構下,集約化存力資源池、高通量網絡與北向算力生態深度耦合,若其中任意一方非國產,則全?;桨刚w亦無法實現真正意義上的安全可靠。3.1.3 推
219、進以全閃化為核心的先進數據存力方案在千行百業的廣泛應用推進以全閃化為核心的先進數據存力方案在千行百業的廣泛應用 為實現先進數據存力產業的全球領先,高閃存化率是必要條件。為實現先進數據存力產業的全球領先,高閃存化率是必要條件。一是性能躍遷性能躍遷,SSD的優異特性可以很好地滿足業務性能要求,相較HDD,SSD能實現讀寫帶寬與IOPS等核心指標10倍的提升,以及更高的存儲可靠性,確保企業能夠適應當前數據量快速提升、應對數據治理日益復雜等挑戰;二是全場景普適全場景普適,當前優異的SSD全閃化方案,已可在解決方案級與HDD方案在TCO上打平,這意味著全閃化方案事實上已可全場景普適(如AI大模型等核心系
220、統、數據備份),未來隨著數據壓縮等技術的進一步發展,全閃化方案的優勢將進一步擴大。先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 總的來說,全球領先的閃存化率是總的來說,全球領先的閃存化率是發展發展先進數據存力產業的基礎。先進數據存力產業的基礎。然而,當前中國的閃存化當前中國的閃存化率僅率僅29%,相比全球主要經濟體而言顯著更低,不及世界平均;與此同時,美國的閃存化率高達55%、德國亦達48%,與中國拉開顯著差距。因此,我們建議將推進以全閃化為核心的先進數據存力方案在千行百業的廣泛應用我們建議將推進以全閃化為核心的先進數據存力方案在千行百業的廣泛應用,作為中國先進數據存力
221、產業發展的一個核心目標。3.2 建設先進數據存力發展高階行動建議建設先進數據存力發展高階行動建議 3.2.1“定目標”:將區域級先進數據存力指標體系納入政府產業發展目標“定目標”:將區域級先進數據存力指標體系納入政府產業發展目標 建議將閃存化率、數據存留率區域級先進數據存力指標體系納入政府產業發展目標,建議將閃存化率、數據存留率區域級先進數據存力指標體系納入政府產業發展目標,確保各確保各級政府充分認知先進數據存力產業的重要性級政府充分認知先進數據存力產業的重要性、投入必要資源。、投入必要資源。一方面,建議各級政府以數據數據存留率存留率等指標確保各行各業的企業與組織對數據要素的充分利用;另一方面
222、,各級政府可以閃存化率閃存化率等指標進行牽引,加速全閃化方案在千行百業的落地,鼓勵地方政府及國有企業優選全閃化方案,加速先進數據存力產業生態的規?;l展。3.2.2“巧引導”:圍繞先進數據存力產業發展目標,制定監管與鼓勵性政策“巧引導”:圍繞先進數據存力產業發展目標,制定監管與鼓勵性政策 總的來說,建議政府從監管性與鼓勵性政策出發,結合當前實際情況與先進數據存力產業發總的來說,建議政府從監管性與鼓勵性政策出發,結合當前實際情況與先進數據存力產業發展目標制定相應政策。展目標制定相應政策。監管性政策的核心目標是確保數據要素在千行百業的企業與組織間安全有序流通、對不同敏感度的數據制定差異化且符合國情
223、的合規性要求,而鼓勵性政策的核心目標,則是確保先進數據存力產業全棧生態的良性發展、推動先進數據存力應用普及。監管性政策上,建議對標德國等強應用型國家的數據分級管理政策,完善數據敏感度分級與監管性政策上,建議對標德國等強應用型國家的數據分級管理政策,完善數據敏感度分級與保存周期政策、強化企業對數據備份的重視。保存周期政策、強化企業對數據備份的重視。例如,德國要求所有本國企業保留商業信函與員工記錄至少 6 年,賬簿與發票等會計記錄至少保存 10 年。相比之下,中國在規范性與要 88 求上不如德國設定嚴格,如用人單位保存終止的勞動合同信息僅 2 年,且對諸多企業日常經營類數據缺乏相關硬性規范和嚴格要
224、求。鼓勵性政策上,建議強化對長江存儲等鼓勵性政策上,建議強化對長江存儲等 NAND Flash 晶圓廠定向補貼晶圓廠定向補貼。當前 NAND Flash 顆粒的定價權集中在極少數國際品牌、國產品牌不強勢的競爭格局,使得企業級企業級 SSD 價格時價格時常出現波動、不利于以全閃化先進方案的規?;瘧贸3霈F波動、不利于以全閃化先進方案的規?;瘧?。以政府支持實現國產存儲芯片晶圓廠在先進 SSD 顆粒的研發、量產與規?;瘧蒙稀邦I跑全球”,可有效控制國內先進 SSD 顆粒價格水平、確保以全閃化方案為核心的先進數據存力方案在各行業的落地。3.2.3“促應用”:積極推動先進“促應用”:積極推動先進數據數
225、據存力方案的在金融、政務、電信等關鍵存力方案的在金融、政務、電信等關鍵行業的應用,鼓勵國產開源數據庫等開源軟件生態發展行業的應用,鼓勵國產開源數據庫等開源軟件生態發展 首先,建議積極促進以全閃化為核心先進數據存力在千行百業落地,在金融首先,建議積極促進以全閃化為核心先進數據存力在千行百業落地,在金融、電信、政務等、電信、政務等關鍵行業先試先行,核心原因有三。關鍵行業先試先行,核心原因有三。一是這些行業對數據存儲的性能有更高的要求性能有更高的要求,先進數據存力的優異特性可以很好地滿足讀寫帶寬、IOPS等業務性能要求;二是這些行業有著更這些行業有著更高的數據合規要求高的數據合規要求,無論是端到端防
226、勒索保障數據安全、分鐘級RTO確保數據可靠性、還是長周期安全穩定的數據備份要求,先進數據存力方案都可以很好地滿足;三是“樹標桿促轉“樹標桿促轉型”型”,全閃化方案與存算分離的架構等先進數據存力方案的應用,可以很好地提升存算運三者的資源利用率,帶動數據中心整體的成本節降,并且有助于形成標桿項目規?;瘡椭菩纬蓸藯U項目規?;瘡椭?。其次,建議政府其次,建議政府組建包含存儲整機廠商在內的先進數據存力產業聯盟,共同制定先進數據存組建包含存儲整機廠商在內的先進數據存力產業聯盟,共同制定先進數據存力相關產業標準。力相關產業標準。通過產業聯盟的建立與持續發展,先進數據存力有望加速落地。最后,建議政府鼓勵國產開源
227、數據庫等開源軟件生態發展、拓展先進數據存力解決方案的應最后,建議政府鼓勵國產開源數據庫等開源軟件生態發展、拓展先進數據存力解決方案的應用空間。用空間。培養國產開源軟件生態是具有良好外部性效應(如鼓勵國產數據庫等軟件的創新)、可持續累計(因生態伙伴持續參與貢獻代碼)且終極可靠(零風險)的舉措,值得持續投入強化。盡管國內企業可以選擇多元化的手段緩釋采取國外開源軟件的潛在安全風險,先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 如持續貢獻社區提升話語權、主動向社區提供代碼修改建議確保軟件安全性、使用開源社區中成熟的版本確保穩定性與兼容性,但當面臨重大國際地緣風險時,他國的開源生
228、態依舊不但當面臨重大國際地緣風險時,他國的開源生態依舊不是完全中立且可靠的是完全中立且可靠的。3.2.4“強創新”:資助并以產學研聯合實驗室為核心載體,提前布局超算存“強創新”:資助并以產學研聯合實驗室為核心載體,提前布局超算存儲等儲等 N+1 代先進數據存力解決方案代先進數據存力解決方案 通過對韓國、美國等在先進數據存力領域創新能力領先國家的對標研究發現,由政府大力資助的產學研實驗室,是兩國實現數據存儲創新能力持續領先的重要抓手實現數據存儲創新能力持續領先的重要抓手,也是這些國家提前提前布局布局 N+1 代先進數據存力解決方案代先進數據存力解決方案(如超算存儲)的核心載體。一方面,當今時代技
229、術革新的速度持續加快,技術演化方向的不確定性正在持續提升,這使一方面,當今時代技術革新的速度持續加快,技術演化方向的不確定性正在持續提升,這使得完全依靠自研,以“內生方式”覆蓋所有潛在創新點模式的可行性受到挑戰得完全依靠自研,以“內生方式”覆蓋所有潛在創新點模式的可行性受到挑戰。在此背景下,以產學研聯合實驗室產學研聯合實驗室為載體,使能企業與學界的合作集思廣益、共研共創,可為業的當當代產品設計創新代產品設計創新帶來新的動能。例如,三星結合自身技術規劃三星結合自身技術規劃,與韓國科學技術院與韓國科學技術院聯合研發存內計算(Process-in-memory)技術,并將其作為通用技術模塊(Comm
230、on Building Block),賦能自身存儲芯片產品線研發的提質增效。另一方面,對于技術路線不另一方面,對于技術路線不那么清晰的下一代產品那么清晰的下一代產品(N+1 代代),國家資助的產學研實驗室則是,國家資助的產學研實驗室則是理想的預研載體。理想的預研載體。一是因為預研話題過于超前、企業參與的積極性可能相對有限,二是由于部分研發所需的運行環節與測試設備的組建成本高昂、通常需國家出資負擔。例如,希捷與勞倫斯伯克利國家實驗室(美國能源部所有)一同開發了應用于大數據和快速數據處理需求的創新存儲介質與架構;再如,HP 與橡樹嶺國家實驗室一同開發了應用于超算環境超算環境下的數據管理和存儲解決方
231、案,這些實驗室均不離美國政府的資助這些實驗室均不離美國政府的資助。圖 3-1 對中國政府建設先進數據存力產業的建議 90 先進數據存力:新質生產力的必由之路先進數據存力:新質生產力的必由之路 附錄附錄 1:參考文獻:參考文獻 1.美國聯邦調查局發布 IC3 2023 年年度報告 2.Sophos 網絡集中安全管理發布 The State of Ransomware 3.360 安全中心發布 2023 年勒索軟件流行態勢報告 4.Gartner 存儲報告 5.Germany|Data Center Market Overview|Cloudscene 6.TechTarget Data Cent
232、er 7.應急管理部發布全國自然災害基本情況 8.應急管理部發布 2022 年全國自然災害基本情況_中國政府網 9.中華人民共和國最高人民檢察院()10.Reports on world crime trends(unodc.org)11.國家發展和改革委員會()12.UN E-Government Survey 2022 13.華語醫療智庫(cn-)14.中共中央國務院印發“健康中國 2030”規劃綱要 15.中國大陸食源性疾病暴發監測資料分析()16.世界經濟論壇(weforum.org)17.國際勞工組織數據庫 18.世衛組織數據庫 19.網易數讀 20.國際貨幣基金組織:人工智能的治愈
233、能力(imf.org)21.醫政醫管局完善院前醫療急救服務指導意見 22.北京采編中心 23.中國科技網經濟參考報 24.上??茖W技術委員會 92 25.央視網:發展新質生產力 生物制造 制造萬物 26.Gartner 存儲報告 27.世界銀行 28.IDC&Gartner 29.Patsnap Database 30.Commercial Code(Handelsgesetzbuch HGB)(gesetze-im-internet.de)31.Industry 4.0:Innovative Flash Solutions for Worldwide Competition|Pure Storage 32.新加坡全球貿易商計劃指南|文章 匯豐機匯()33.新加坡經濟發展局(edb.gov.sg)34.SSG|TechSkills Accelerator(TeSA)(skillsfuture.gov.sg)35.韓國政府發布政策 36.全球芯片賽跑:韓國出臺K-芯片法案 37.Nvidia GTC 2024