《中國智能計算產業聯盟:2023國家“東數西算”工程下算力服務發展研究報告(49頁).pdf》由會員分享,可在線閱讀,更多相關《中國智能計算產業聯盟:2023國家“東數西算”工程下算力服務發展研究報告(49頁).pdf(49頁珍藏版)》請在三個皮匠報告上搜索。
1、 1國家“東數西算”工程下算力服務發展研究報告國家“東數西算”工程下算力服務發展研究報告出品單位:支持單位:單志廣 張云泉 何寶宏 張廣彬 著 3國家“東數西算”工程下算力服務發展研究報告顧問:陳潤生 陳國良 鄭緯民 袁國興主編:單志廣 張云泉 何寶宏 張廣彬執行主編:安靜 王海峰編委:沈文海 陳學斌 方娟 賈海鵬 賴能和 袁良 李婧穎 張延強 戴彧 徐凌驗 舍日古楞 王丹丹 趙浩鴻 陳栩 劉殷 宋心榮 涂菲菲 張翼 張廣婷特別鳴謝:清華大學 益企研究院參編單位:國家信息中心信通院云大所中科院計算所清華大學國家氣象中心國家“東數西算”工程下算力服務發展研究報告編寫委員會 4目錄目錄 CONTE
2、NTSP5第一章算力服務在算力經濟中的定位P6一、算力經濟成為新一輪經濟發展抓手P6二、算力服務形成分析P9三、算力服務與云計算服務的區別P13 第二章算力服務發展的主要挑戰P14一、“東數西算”背景下的新挑戰P17二、算力網絡的智能調度P18三、算力服務復合型人才系統構建P20四、算力服務標準確保產業健康發展P21 第三章算力服務產業鏈可持續發展路徑 P22一、算力服務產業鏈商業模型P23二、多樣性算力技術創新發展路徑P25三、大模型時代的算力服務演進P29四、構建軟硬協同的高性能、安全的公共算力設施P31五、先進制冷技術演進發展P35六、算力網絡優化算力布局P40七、算力網絡不同路線實踐P
3、43 第四章面向 2030 年算力服務展望P44一、算力服務的綜合價值展望P46二、算力服務促進算網深度融合帶來算力服務變局 5國家“東數西算”工程下算力服務發展研究報告CHAPTER1算力服務在算力經濟中的定位 6第一章算力服務在算力經濟中的定位一、算力經濟成為新一輪經濟發展抓手算力作為最為重要的生產力之一,已逐步成為和水、電、燃氣一樣的基礎資源。特別是 ChatGPT 的爆火出圈,以大算力、大模型、大數據為核心的生成式人工智能(GAI)引發全社會廣泛關注,極大地拉動了對算力的需求,進一步“引爆”了算力服務市場。2018 年,張云泉博士正式提出“算力經濟”這個名詞,最初定義的維度是比較簡單的
4、。首先計算要成為算力經濟的核心,未來,以計算能力來衡量一個地方或地區的數字經濟發展水平,使之成為一個很重要的指標?!皷|數西算”世紀工程的發布正式開啟了算力經濟時代,一個地區的算力產業是不是發達,也意味著數字經濟是不是有機會,算力經濟也成為西部地區新一輪經濟發展的強力抓手。狹義的算力經濟是指與算力強關聯的算力服務產業鏈,包括算力設施提供者、算力生產者、算力運營者、算力消費者等 4 類參與者。他們共同閉環成為一種商業模式。隨著認識的深化,“算力經濟”的內涵日益豐富、深化和拓展,即算力+。凡是可以用到算力的國民經濟的各個方向單元,都是算力經濟的范圍。只要以算力為核心生產要素,以算力為引擎,就都是廣義
5、的算力經濟。算力經濟逐步成為數字經濟的重要組成部分,并在數字經濟中的比重會越來越大。綜上所述,圍繞算力本身產生的算力服務產業,狹義的算力經濟指算力服務業產業鏈;廣義的算力經濟為數字產業化、產業數字化、城鎮數字化提供各種基礎設施、支撐保障的新模式、新業態,也就是算力+產業。二、算力服務形成分析狹義的算力經濟是指與算力強關聯的算力服務產業鏈,包括算力設施提供者、算力生產者、算力運營者、算力消費者等 4 類參與者。他們共同閉環成為一種商業模式。隨著認識的深化,“算力經濟”的內涵日益豐富、深化和拓展,即算力+。CHAPTER1 算力服務在算力經濟中的定位 7國家“東數西算”工程下算力服務發展研究報告中
6、國高性能計算機 TOP100 排行榜已經發布了 20 多年,行業一直通過排行榜觀察中國超級計算產業的發展趨勢。到 2021 年,在 TOP100 的前 10 名有 7 臺機器,它們不是專門服務某些行業,而且這些機器沒有具體的應用目標,是公司買過來之后專門用于售賣算力的,而且這些機器性能很強。面對這個新出現的狀況,TOP100 的專家委員定義了一個新領域叫算力服務業。2022 年,算力服務的性能指標相比上一年已經翻倍,增長速度很快。算力服務是以云資源接入和一體化調度機制為基礎,以算力網絡為連接,以云計算、人工智能、大數據等技術為支撐,將異構算力統一輸出管理,為用戶提供通用算力、智能算力、超算算力
7、等多樣算力資源和存儲資源,以及算力發現、供需撮合、交易購買、智能調度等綜合服務,本質上是算力的供給方式。隨著算力服務的不斷演進發展,呈現“四化”特征:圖片來源:算力經濟時代 數字中國萬里行 2023 新型算力中心調研報告 8一是便捷普惠化。用戶不必關注復雜的底層技術和龐大的架構,無需購買服務器,即可“隨時、隨地、隨需”享受便捷的一站式服務,實現算力資源人人可得、人人可用、人人適用。二是智能泛在化。運用虛擬化、容器化等技術,將大規模、異構算力轉化為標準化算力單元,通過適應性策略和敏捷性框架對算力資源進行精準匹配,滿足敏捷開發、快速部署需求。三是靈活定制化。以彈性方式靈活調度算力資源,并結合不同用
8、戶的使用場景和使用需求提供個性化的服務方案。四是安全可信化。一方面,通過對算力提供方的資質核驗及可信度評估,從源頭上保證算力資源的安全可信。另一方面,通過對算力使用過程的監管,保證算力使用的全程流程可追溯。圖片來源:算力經濟時代 數字中國萬里行 2023 新型算力中心調研報告CHAPTER1 算力服務在算力經濟中的定位 9國家“東數西算”工程下算力服務發展研究報告研究表明,國家計算力指數與 GDP 的走勢呈現出顯著的正相關,計算力指數每提高 1%,數字經濟和 GDP 分別增長 3.5和 1.81,而且該趨勢預計將繼續保持到2025 年。全球算力競爭日益白熱化,算力服務正在成為數字經濟發展的新引
9、擎和各國戰略博弈的關鍵要素。從全球看,算力總規模保持高速穩定增長,2021 年全球計算設備算力總規模達到 615 EFlops,增速達到 44%,預計 2030 年全球算力規模達到 56 ZFlops2。全球主要國家和地區加大算力布局,美國不斷加強量子計算、超級計算、類腦計算等前沿算力布局,力保人工智能等關鍵領域的全球領導地位;歐盟持續加碼算力基礎設施建設和關鍵技術研發投入,陸續發布 塑造歐洲的數字未來、2030數字羅盤、歐洲工業戰略 等,推動構建安全、高性能和可持續的數字基礎設施,助力企業數字化轉型;日本堅持以應用和綠色并重,制定人工智能(AI)及量子技術等尖端技術相關的國家戰略,并頻繁強調
10、振興半導體產業。從我國看,國家對算力服務的重視程度不斷提升,國家發展改革委、中央網信辦、工業和信息化部、國家能源局四部委先后聯合印發 關于加快構建全國一體化大數據中心協同創新體系的指導意見全國一體化大數據中心協同創新體系算力樞紐實施方案,推動匯聚聯通政府和社會化算力資源,構建一體化算力服務體系。在各類政策舉措的強力加持下,我國算力服務發展成效顯著,梯次優化的算力供給體系初步構建。數據顯示,近年來我國算力產業規模持續快速增長,年增長率近 30%。截至 2022 年底,我國算力總規模達到180EFLOPS,居全球第二3。電信運營商、地方政府、企業、行業機構等紛紛推出算力服務平臺,已發布或建設算力平
11、臺超 10 個,旨在通過整合不同來源、類型和架構的算力資源,提供算力支撐服務。三、算力服務與云計算服務的區別算力服務是云計算服務的升級版,除了要提供虛擬化、分布式計算等云計算服務外,還包括算力調度、云網融合、供需匹配等新要求。為了更好理解兩者的區別,下面從云計算和算力服務的發展背景和歷程進行說明。1.IDC、浪潮信息、清華大學全球產業研究院,2021-2022 全球計算力指數評估報告2.中國信通院,中國算力發展指數白皮書(2022 年)3.年增長率近 30%我國算力總規模全球第二,https:/ 10從單機計算到云計算。云計算將計算能力(指廣義的數據存儲和處理能力)抽象化,通過互聯網向用戶提供
12、服務,用戶在云計算平臺上按需購買、使用和管理各種計算資源,而無需關心其背后的復雜實現細節。在云計算出現前,從用戶的角度常存在以下痛點。一是擴容難,企業(或個人)用戶自行購置運維的數字基礎設施在擴容算力時,從評估、規劃到實施、調試需要較長時間周期,往往以周或月計,難以及時匹配快速變化的業務需求。二是利用率有限,因擴容難,用戶在應對快速變化的業務需求時通常采用“留足算力冗余”的方式,以增加投入換減少擴容次數,這也造成了算力閑置現象。此外,若用戶業務收縮,自行購置運維的算力難以縮容,將進一步加劇算力閑置。三是需要專業技術團隊負責運維。隨著企業應用需求日趨復雜,企業的數字基礎設施的架構也變得復雜,為維
13、護數字基礎設施正常運行,企業需要擴大運維團隊的規模和提高技術水平,提高了企業運營的人力成本。云計算以其可按需擴容、按使用計費、由服務商團隊提供專業運維的特點,一定程度上解決了上述痛點。從云計算到算力網絡。隨著 5G 與人工智能時代的發展,各類新型應用不斷涌現,數據產生量呈爆發式增長,智能計算被廣泛應用于工業、零售、醫療、教育等行業領域,帶圖片來源:算力經濟時代 數字中國萬里行 2023 新型算力中心調研報告CHAPTER1 算力服務在算力經濟中的定位 11國家“東數西算”工程下算力服務發展研究報告“一體化算力服務”由中科曙光率先提出,該服務集“算力”“算能”“算網”三方面于一體?!坝嬎銉炏染W絡
14、”由華為提出,“算力感知網絡”由中國移動提出,“算力網絡”由中國電信、中國聯通倡導,CCSA TC3 會議將三者統一為“算力網絡”。來算力需求的幾何級數級增長,并對算力的實時性、可靠性、安全性等提出更高要求。當前以數據中心為單元的云計算組織方式已逐漸無法為社會發展提供豐沛的、高質量的算力供給。一是無法有效組織邊緣計算節點。二是各數據中心、智算中心、超算中心等云計算中心間無法有效協同。三是云計算中心和網絡間缺乏協同,難以保證算力傳輸的實時性和可靠性。在此背景下,算力網絡應運而生。算力網絡旨在通過泛在算力與網絡的融合,突破數據中心、超算中心、云計算、邊緣計算等“孤島”狀態下的計算能力限制,將大量散
15、落在全網中的各類型算力(通用計算、智算、超算等)匯聚成統一的計算資源池,進行管理和調度。算力網絡以構建算網一體的新型智能、高效、按需的算力服務體系網絡為目標,實現算力和連接的全局優化與高效協同,解決不同類型節點的算力分配與資源共享需求難題,形成 CPaaS(算力即服務,Computing Power as a Service),滿足國家與行業需要,促進我國數字經濟的發展?!坝嬎銉炏染W絡”、“算力感知網絡”與“算力網絡”是在算力網絡的標準化研究制定過程中,不同時期由不同企業提出和倡導的概念?!耙惑w化算力服務”由中科曙光率先提出,該服務集“算力”“算能”“算網”三方面于一體?!坝嬎銉炏染W絡”由華為
16、提出,“算力感知網絡”由中國移動提出,“算力網絡”由中國電信、中國聯通倡導,CCSA TC3 會議將三者統一為“算力網絡”。從云網融合走向算網一體。從算力網絡的建設目標與技術發展理念來看,算力網絡是通信、計算、存儲以及智能化調度的高度融合。算力網絡以泛在算力資源為基礎,網絡通信為紐帶,智能化調度為核心,實現網、云、邊、端、業務的高效協同與適配,滿足行業高差異化算力服務需求。云網融合和算網一體是實現此目標的兩個相輔相成的 12發展階段。對于云網融合,網絡是以云為中心的。從云的視角看,一云多網對網絡的主要需求是連通性、開放性,對服務質量的要求是盡力而為,網絡起到支撐作用,云作為算力提供側是價值中心
17、。對于算網一體,網絡是以用戶為中心的。從用戶的視角看,需要網絡支持低時延、安全可信通信,對服務的質量要求是確定性,作為算力提供測的云和作為算力運輸側、用戶需求感知測的網絡共同成為價值中心。最終,算力網絡的建設將統一融合算力與網絡,同時突破算力與傳統網絡的技術限制,構建“統一調度、彈性適配”的算力網絡平臺,形成端到端業務開通以及可視、可管、可控能力,實現全國范圍內跨越組織、業務、運維、運營、應用的全局規劃以及算力的高效協同調度與應用,為我國數字經濟打下堅實的算力基礎。CHAPTER1 算力服務在算力經濟中的定位 13國家“東數西算”工程下算力服務發展研究報告CHAPTER2算力服務發展的主要挑戰
18、 14第二章算力服務發展的主要挑戰一、“東數西算”背景下的新挑戰隨著“東數西算”工程的實施,算力基礎設施建設迎來快速發展機遇的同時,也對算力服務提出了更高的要求。當前,在以數據中心為主要載體、跨區域算力需求不斷增長的背景下,算力服務仍面臨資源使用效率不高、場景實現成本不菲、網絡時延傳輸不暢、供需匹配不力、體系安全布局不密等現實挑戰。資源使用效率不高。當前,數據中心建設規模迅速擴大,國內市場供大于求、同質化競爭問題突出,存在盲目投資和經營風險。預計到2025年國內IDC機架將是現在3倍。西部 6 省市(寧夏、甘肅、內蒙古、貴州、四川和重慶)規劃遠超預期,2025 年機架有望增至 362 萬架(5
19、 年增長 9 倍),全國占比達到 41%(5 年提升 30pp)4。但與此并存的是現有數據中心資源利用不充分。一方面,國內現有數據中心存在“重建輕用”現象,造成了數據中心資源的浪費。2021 年中國數據中心市場報告顯示,目前全國數據中心整體上架率僅為 50.1%。以上海為例,據2020-2021 年上海及周邊地區 IDC 市場研究報告顯示,2020 年上海地區 IDC 機房平均空置率為 16.4%,部分數據中心空置率甚至超過了40%5。另一方面,全國數據中心空間利用率尚不均衡,華東、華北、華南地區數據中心上架率約在 65%至 68%,華中地區為 39%,而西部地區的西北和西南分別為 34%和
20、41%,低于平均水平,遠低于東數西算起步期上架率水平(65%)6的建設目標。場景實現成本不菲。一是網絡傳輸價格較為高昂?!皷|數西算”各類場景需要大量的網絡傳輸服務進行支撐。然而,目前網絡通信價格仍然偏高。據測算,帶寬為 1Gbps 的網絡傳輸專線費用約為 16 萬元/月,超過某些計算場景總成本的 75%,若提升帶寬至4.https:/ 算力服務發展的主要挑戰 15國家“東數西算”工程下算力服務發展研究報告2.5Gbps 或 10Gbps,其費用將進一步大幅增長,可能高于東部企業可以承受的網絡費用成本7。二是部署成本難現優勢。除了網絡傳輸成本,“東數西算”涉及的算力網絡建設成本也比較高。比如如果
21、在北京、內蒙古租用同樣的機架,疊加長途帶寬費用后,內蒙古園區相比北京園區可能并不具有成本優勢。同時,西遷意味著業務架構需要重構,在IT 側技術和投資方面存在新的壓力。網絡時延傳輸不暢。西部數據中心向東部提供算力,因距離原因存在網絡時延。根據 全國一體化大數據中心協同創新體系算力樞紐實施方案,數據中心端到端單向網絡時延原則上在 20 毫秒以內;車聯網、聯網無人機、智慧電力、智能工廠、智能安防等實時性要求高的業務需求,時延原則上在 10 毫秒以內8。經測試,貴陽到東部某城市的時延最低為 36 毫秒,通過網絡加速等技術手段,最低可降至 28 毫秒,但距離承接東部時延敏感算力需求還有較大差距9。7.范
22、靈俊,鄭衛城,彭亞松等.“東數西算”工程落地的關鍵問題分析與對策建議 J.中國信息安全,2023(02):100-104.8.關于印發全國一體化大數據中心協同創新體系算力樞紐實施方案的通知 https:/ J.中國信息安全,2023(02):100-104.圖片來源:算力經濟時代 數字中國萬里行 2023 新型算力中心調研報告 16“數”“算”供需匹配不力。一是算力資源調度問題?!皷|數西算”涉及的數據類型多樣、業務需求各異。CPU、GPU、FPGA、DPU、專用加速器等對處理不同種類的數據各有優勢與劣勢,也有運營成本高低之分10。目前,在異構算力層面仍然缺乏整體有效調度機制,面對各種東部城市不
23、同的算力需求場景時,難以快速合理精準地匹配算力資源,網絡性能、算力實時性、數據安全等各方面仍面臨挑戰。二是算力網絡長效運行機制仍需探索。算力網絡的核心是復雜巨系統的多資源聯合優化,復雜巨系統的多目標聯合優化,確保實時的、全網的、面向任務調度的 QoS11。與電力系統完善的分級調度不同,算力網絡調度機制實踐難度很大。如何開展多層級的面向性能、價格、效益等多方面的測算,形成真正的應用需求供給和可持續的長效動力機制仍需探索。體系安全布局不密。一是國產化適配與替代問題。2022 年 8 月 31 日,美國政府下令英偉達、AMD 等停止向中國銷售部分高性能 GPU。GPU 芯片可被用于加速人工智能任務,
24、是 AI 系統訓練的關鍵,也是“東數西算”諸多場景的基礎。在這樣的環境下,“東數西算”工程對國產化基礎軟件服務能力提出更高要求。而目前部分應用仍缺少相應的國產化軟件適配、靈活部署以及服務能力,難以針對各類場景形成針對性的解決方案。二是數據安全問題?!皷|數西算”工程八大樞紐節點協同聯動,工程體系龐大、結構復雜,算力網絡的海量數據、多種類算力資源與網絡基礎設施對數據安全帶來了全新挑戰和更高的要求。一方面,算力網絡中的巨大數據交換共享形成更大吞吐量,容易增加網絡面和暴露面,還易面臨篡改和竊取風險。另一方面,“東數西算”背景下原本獨立運行的業務系統和網絡需要對接,有可能造成系統應用和數據暴露面增加,催
25、生更多數據安全風險。三是網絡安全問題。開源組件在每個行業都被廣泛使用,并且是當今所有應用程序的構建基礎。應用安全公司 Synopsys 最新發布的2023 年開源安全和風險分析(Open Source Security and Risk Analysis,OSSRA)報告指出,絕大多數代碼庫(84%)至少包含一個已知的開源漏洞,相較去年增加了近 4%12。在“東數西算”工程中涉及的數據開放共享、算力開放應用、算網協同運營等環節,具有支撐作用的網絡基礎設施以及網絡環境方面的安全防護能力存在挑戰。10.范靈俊,鄭衛城,彭亞松等.“東數西算”工程落地的關鍵問題分析與對策建議 J.中國信息安全,202
26、3(02):100-104.11.單志廣,摸清家底數算匹配智能調度,經濟日報,2023 年 2 月 20 日,11 版智庫。12.Analyst Report Open Source Security and Analysis Report|Synopsys https:/ https:/ 算力服務發展的主要挑戰 17國家“東數西算”工程下算力服務發展研究報告二、算力網絡的智能調度算力調度是解決算力供需矛盾、算力網絡傳輸問題、算力資源普惠問題的新型能力體系。算力調度根據算力資源提供方的供給能力和應用需求方的動態資源需求,整合區域內算力基礎設施底層的計算、存儲、網絡等多維資源,基于算力調度平臺對
27、算力資源進行一致性管理、一體化編排和統一調度,實現跨行業、跨地區、跨層級的算力資源的協同聯動與精準匹配。2022 年,國家“東數西算”工程正式實施,算力資源的精準智能調度成為保障“東數西算”工程實施的關鍵核心問題之一。算力資源跨網、跨行業、跨區域調度。從算力布局看,構建國家一體化大數據中心體系和“東數西算”工程的實施,奠定了以國家算力樞紐為核心的全國一體化算力網絡格局?!皷|數西算”工程覆蓋地域廣、涉及領域多,且需要多云之間、云數之間、云網之間的高效互聯,和國家算力樞紐節點之間的相互配合以及考慮運營成本等問題。從算力服務業務角度看,不同場景下的計算任務對算力資源、算力規模、數據傳輸圖片來源:算力
28、經濟時代 數字中國萬里行 2023 新型算力中心調研報告 18效率等側重點各有差異,而節點間的高速互聯、計算節點的增減、網絡計算性能等均對數據流通效率和算力資源調度帶來影響。圍繞全國一體化大數據中心建設重大工程,在全國布局10個左右區域級數據中心集群和智能計算中心,以匹配雙碳要求、資源高效利用的要求,通過算力網絡智能調度實現算力的全網共享和布局優化,實現東數西算、東數西訓、東數西存,使能數字經濟的高質量發展。全國一體化大數據中心建設提出“國家樞紐節點之間進一步打通網絡傳輸通道”“優化東西部間互聯網絡和樞紐節點間直連網絡”“提升跨區域算力調度水平”,算力網絡智能調度根據全域實時的算、網、數資源以
29、及云、邊、端分布情況,靈活、動態地計算最優協同策略與調度路徑,實現多云之間、云和數據中心之間、云網之間算網協同,算力資源跨行業、跨區域、跨層級的智能管控和統一協同調度。對多樣性算力資源進行靈活按需匹配和調度。通用計算、人工智能計算、超級計算等多樣性算力資源智能匹配與調度全面發展,自動駕駛、遠程醫療、工業自動化以及高精度的物理模擬、大規模的社會科學模型等復雜應用場景對網絡和計算資源的需求不斷提升。算力網絡智能調度涉及全局資源感知、資源采集、統一管控、統一注冊/建模/度量、最優化靈活調度、計費與結算、生命周期管理等多方面,通過對全局異構算力資源自動感知,根據算力和網絡部署狀況,進行全局的編排調度,
30、面臨多樣性算力接入適配、算力資源調度路徑、算力度量等問題,按需自動創建面向應用的全局多級算力資源自動分配調度、算網一體化服務編排、動態彈性算力和網絡資源的協同調整,實現對泛在的多樣化算力資源的統一管理和動態調度。三、算力服務復合型人才系統構建算力經濟建設的核心是算力設施設計與建設,這離不開算力相關半導體人才梯隊的搭建與培養,正如在 2023 年度中國大陸地區集成電路人才供需報告 所提到的,需要持續投入和產學研用一體式協同推進。一方面,高校、高職等相關學校,要建立“EDA-設計-流片-封測-系統應用”綜合實踐平臺,培養行業上下游產業鏈相關人才和高中低階人力培養體系,另一方面,企業應該加強與院校合
31、作推廣訂單式培養模式,形成人才合作及供需聯動機制。一方面,多維度打造算力技術人才培養生態。算力是數字技術創新的高地,隨著算力需求日益增長,對大數據、云計算和人工智能等相關技術領域人才供不應求。人社部CHAPTER2 算力服務發展的主要挑戰 19國家“東數西算”工程下算力服務發展研究報告中國就業培訓技術指導中心新職業在線學習平臺發展報告指出,未來 5 年,大數據、云計算產業人才缺口將高達 150 萬。彌補算力技術人才缺口的關鍵在于多維度打造人才培養生態。一是支持高校、科研機構設立大數據、云計算、人工智能等算力相關專業,加強專業人才培養。二是鼓勵龍頭企業、科研機構、高校聯合成立算力研究機構,支撐人
32、才培養。如中國聯通寧夏分公司、寧夏大學等單位共同發起成立“寧夏東數西算產融研究院”,下設產業規劃研究中心、人才發展中心等,積極推進東數西算領域的前沿研究、人才培養。三是依托計算中心,強化創新人才培養。如武漢人工智能計算中心陸續孵化出紫東太初等大模型團隊,而 2017 年成立的中科曙光書院,先后攜手鄭州大學、深圳理工大學等眾多高校,在先進計算、人工智能、大數據等領域開展人才聯合培養計劃。此外,為響應教育部職業技術教育中心“1+X”證書制度試點工作,中科曙光推出的“人工智能系統平臺實施”職業技能等級證書成功入選教育部全國第四批“1+X”試點證書名單。由中科曙光公司編著的“1+X”指定教材人工智能系
33、統平臺實施中級順利出版,切實推進人工智能等算力領域人才培養和發展。另一方面,匯聚群策群力營造算力應用人才培育生態。隨著算力服務應用領域不斷拓展,智慧能源、智慧醫療、智能網聯汽車、智慧物流、智慧金融等特色應用層出不窮。不同場景對算力需求不同,在保證通用算力服務的同時,針對具體應用場景需求,充分優化專業應用性能是算力發展的方向。因此,各領域亟需算力應用復合型人才??商剿鞒闪⑿滦脱邪l機構、舉辦計算應用大賽等多種方式營造算力應用人才培養生態。鼓勵算力企業、應用企業、行業協會、高校、科研機構聯合建立行業算力應用中心,培育算力應用人才。如蘇州協鑫能源計算中心、中移鐵通智慧鐵路邊緣數據中心等,聚焦特定行業應
34、用,在應用中培養復合型人才。計算應用大賽、計算應用論壇等也是促進高水平復合型算力應用人才培養的良好路徑。如面向全社會科技從業者及愛好者的“先導杯”計算應用大獎賽,至今已連續舉辦三屆,共吸引來自清華大學、北京大學等重點高??蒲袡C構、知名企業的 3000 名選手 2300 支隊伍參賽,很好發揮了對計算應用、科技創新的引領帶動作用。20四、算力服務標準確保產業健康發展“十四五”國家信息化規劃文件指出,建設完善一體化算力服務。加強云資源接入和一體化調度,推動政務、科學、教育、醫療等公共算力服務資源整合開放,構建低成本、廣覆蓋、可靠安全的公共算力服務,促進算力的普及應用。算力服務本質是以多樣性算力為基礎
35、,以算力網絡為連接,以供給有效算力為目標的算力產業新領域,通過全新計算技術實現異構算力任務式統一輸出,并與云、大數據、AI(人工智能)等技術交叉融合,最終將算力、存儲、網絡等資源統一封裝,以服務形式(如API)完成算力交付。目前產業內雖進入算力服務相關技術快速落地期,但面向算力服務的定義、場景、需求與技術框架尚不清晰,亟需產業共同制定、研究相關標準規范??傮w來看,結合算力服務核心內涵,算力服務的標準制定應當從基本框架、應用服務、技術能力、基礎資源四個方面進行。一是基本框架,主要包括算力服務概念定義、服務化過程基本模型等內容,用于明確算力服務基本概念與流程要求;二是應用服務,主要包括多場景下的算
36、力服務化應用方式能力要求,如算力互聯互通場景下的算力調度能力要求、網絡互聯要求等;同時也包括異構算力服務化平臺應用能力要求,如高性能計算平臺、智算平臺等;三是技術能力,主要包括服務化技術能力相關要求,如編排調度、控制與轉發、運營運維等方面,用于為上層服務化能力輸出鋪設中層技術基礎;四是基礎資源,主要包括如GPU、FPGA等在內的異構算力資源服務化應用能力要求,用于為算力服務輸出多樣化異構算力服務。圖片來源:算力經濟時代 數字中國萬里行 2023 新型算力中心調研報告CHAPTER2 算力服務發展的主要挑戰 21國家“東數西算”工程下算力服務發展研究報告CHAPTER3算力服務產業鏈可持續發展路
37、徑 22第三章算力服務產業鏈可持續發展路徑一、算力服務產業鏈商業模型算力經濟時代,我國目前已經基本形成較為完整的算力服務產業鏈,算力服務產業鏈主要包含四類參與者:一是算力設施提供者,二是算力生產者,三是算力運營者,四是算力消費者;他們共同形成閉環成為一種商業模式。算力設施提供者主要是算力生產所需軟硬件設備的供應方,主要涵蓋芯片、操作系統、服務器生產、數據中心建設等資源供給的產業鏈角色,這些企業不直接生產算力,而通過從芯片生產、板卡集成、操作系統適配到服務器組裝、應用軟件開發等關鍵環節的生產要素流轉,為算力直接生產者提供了豐富的資源選擇與資源積累。算力生產者主要通過建設、購買或租用算力設施,以電
38、力支撐算力、存力和運力,實現對通用算力、智算算力、超算算力、存儲和網絡等算力服務支撐資源的供給。算力運營者主要對計算資源進行分配和管理,以滿足計算任務的需求。提高計算效率,最大化利用計算資源。在貫徹落實國家“東數西算”工程要求中,東西部算力高效互補和協同聯動的實現離不開算力調度。算力運營者主要是針對通用、智算、超算等不同客戶的不同需求,設計異地、異構資源池調度引擎,實現不同廠商的異構資源池的算力圖片來源:算力經濟時代 數字中國萬里行 2023 新型算力中心調研報告CHAPTER3 算力服務產業鏈可持續發展路徑 23國家“東數西算”工程下算力服務發展研究報告動態感知與作業智能分發調度。算力運營者
39、的業務模式還包括在算力基礎資源上進行服務化能力建設,并通過服務商 API 等方式完成算力供給的產業鏈角色,包含傳統的云服務商、智能算力和超算以及算力網絡服務商等。如云服務商的角色從在云服務產業鏈中的核心生產者,變成算力服務產業鏈里算力服務生產者中的一類,向下仍對接基礎設施等供應商,向上支撐算力調度、算力交易等多個算力服務生產環節。算力網絡服務商和算力調度者主要實現對算力、網絡、存儲等資源的服務化轉化,通過算力編排、算力調度、算力交易技術實現算力到用戶的服務化供給。算力消費者實際上就是算力服務應用方,如行業用戶等,將實現算力賦能醫療、交通、教育、政務、金融、工業等千行百業產生直接的經濟價值。二、
40、多樣性算力技術創新發展路徑近年來,隨著智能制造、自動駕駛、數字金融、智慧醫療、區塊鏈共識等數字技術應用場景的蓬勃發展,算力的多樣化供給需求明顯增強,除了傳統的通用算力,對智能算力、超算算力的需求突飛猛進,除了傳統的中心算力,對邊緣算力的需求也與日俱增。算力服務迎來了多樣化發展的繁榮期,結合不同應用場景需求的技術創新將加快推進。面向高性能算力新型硬件架構加速推廣應用。工信部新型數據中心發展三年行動計劃(2021-2023 年)提出,到 2023 年底,全國數據中心總算力超過200EFLOPS,高性能算力占比達到 10%。當前,數據中心 IT 基礎架構正在面向高性能計算需求向新型硬件架構轉變,越來
41、越多地采用 GPU、FPGA、ASIC 為代表的 AI加速芯片(基于傳統芯片架構,對某類特定算法或者場景進行 AI 計算加速),神經網絡處理器 NPU(Neural Processing Unit),以及先進 AI 芯片,如類腦芯片、通用 AI芯片 IPU(Intelligence Processing Unit)等。多樣性計算需求,加速算力格局變換?;?x86 的通用計算繼續構建數字經濟發展的基礎,依然保持計算的核心地位。一方面繼續提供更強的核心和更多的核心數滿足客算力經濟時代,我國目前已經基本形成較為完整的算力服務產業鏈,算力服務產業鏈主要包含 4 類參與者:一是算力設施提供者,二是算力
42、生產者,三是算力運營者,四是算力消費者;他們共同閉環成為一種商業模式。24戶不同場景需求,如第四代 AMD EPYC 處理器基于業界領先的 5nm 制程工藝,提供多達 96 個“Zen 4”架 構核心、192 線程,以及最大 384MB 的 L3 緩存容量。另一方面,在 AI 應用的規?;渴鸷蛯嵺`中發揮重要的作用。為了更加充分地利用 CPU 的資源,幾年前英特爾就在 CPU 中內置針對 AI 進行加速的專用運算單元或指令集,英特爾第四代至強可擴展處理器新集成 5 種加速器,并搭配以更為簡單易用、能夠降低部署和優化難度的軟件工具。目前云數據中心領域正在進行 x86+Arm 多元算力的布局。另外
43、,在運營商層面,Arm 架構也在基站領域快速發展,持續為 5G 發展添磚加瓦。在智能計算場景領域,以 CPU+AI 芯片(GPU、FPGA、ASIC)提供的異構算力,并行計算能力優越、互聯帶寬高,可以支持 AI 計算效力實現最大化,成為智能計算的主流解決方案。人工智能算法需要從海量的圖像、語音、視頻等非結構化數據中挖掘信息。大模型的訓練、場景化的微調和推理應用場景都需要算力支撐。在大模型層面,以 GPU 等 AI 訓練芯片為主,為 AI 計算提供更大的計算規模 和更快的計算速度。算力服務成為一種新的業態,將通用計算、智能計算、并行計算等多樣性算力統一納管和調度,屏蔽不同硬件架構差異,實現大規模
44、異構計算資源的統一調度,實現算力的普惠化。除了大模型,目前在 AI for Science 領域,人工智能正在給科學計算帶來重大的范式革命。AI for Science 的數據來自各個學科的數據積累,模型來自各圖片來源:算力經濟時代 數字中國萬里行 2023 新型算力中心調研報告CHAPTER3 算力服務產業鏈可持續發展路徑 25國家“東數西算”工程下算力服務發展研究報告領域科學家發現的科學原理和規律;算法源自機器學習算法和數值方法等方面的創新;需要多樣算力融合的綜合型智能計算平臺,通過分布式異構并行體系結構,實現多樣算力的融合、優勢互補,為 AI 訓練、AI 推理、數值模擬等不同應用提供不同
45、算力,實現高精度到低精度算力的全覆蓋、多種計算類型的全覆蓋,以及 AI 訓練+推理全覆蓋。多元算力的多元開發生態體系相對獨立,應用的跨架構開發和遷移困難,需通過開源、開放的方式建立可屏蔽底層硬件差異的統一異構開發平臺。同時,當算力和網絡的發展呈現一體共生之勢時,從算網協同到算網融合,業務需求的變化會通過芯片、計算和存儲等 IT 設備傳導到網絡架構層面,即數據中心作為基礎設施也會相應的產生自上而下的變化。為此,除了算力網絡,數字中國萬里行考察期間也重點關注 DPU/IPU 乃至芯片間的互連,展現數據中心基礎設施如何應對這些變化與挑戰,更好的服務于用戶,并可持續的良性發展。邊緣計算成為集中式云計算
46、架構的重要補充。在工信部公布的 2021 年國家新型數據中心典型案例名單中,已有 12 個邊緣數據中心入選。邊緣計算是指將計算和數據存儲移動到網絡的邊緣,主要用于支撐低時延業務應用,服務自動駕駛、智慧醫療等重點應用場景落地。傳統的集中式云計算架構是通過互聯網將計算資源和數據存儲提供給用戶使用。邊緣計算和云計算相互補充,通過完善在云、邊緣、現場終端不同層級的泛在智能算力體系,有助于實現更快、更低時延、更低成本的算力輸出。三、大模型時代的算力服務演進大模型熱潮下算力需求爆發,亟需建立高效率、大規模的智能算力基礎設施。2022 年底 ChatGPT 橫空出世,人工智能加速邁入大模型時代。自 2011
47、 年以來,全球人工智能模型參數規模呈幾何式高速增長,已突破萬億級。隨著參數量的急劇增長,計算規模越來越大,需要的硬件資源(內存、GPU)越來越多。據 OpenAI 統計,自 2012 年以來,業界最復雜的人工智能訓練任務對算力的需求每 3 至 4 個月就會翻倍。據不完算力消費者實際上就是算力服務應用方,如行業用戶等,將實現算力賦能醫療、交通、教育、政務、金融、工業等千行百業產生直接的經濟價值。26全統計,我國人工智能大模型數量已超過 100 個13,大模型已成為推動人工智能能力提升和應用落地的重要方向,智能算力需求將在短期內集中爆發,一般的算力基礎設施很快將難以勝任。當前我國智能算力還遠遠無法
48、滿足潛在計算需求,據 IDC 預測,我國智能算力規模將持續高速增長,預計到 2026 年將達到 1271.4EFLOPS,年復合增長率達 52.3%14。我國智能算力分布在不同地區、不同主體,建立以人工智能芯片為主的高效率、大規模的智能算力基礎設施已成為大模型發展面臨的現實需求。同時,智算中心有技術實現復雜、建設周期長、資源投入巨大、產業輻射面廣的特點。一方面,智能算力需求呈現幾何式增長,本地智算中心主要服務本地產業和科研機構,無法向全國提供算力服務。另一方面,為了提供相匹配的超大規模的算力支撐,通過算力的生產、聚合、調度和釋放,支撐產業創新聚集,亟需構建云化的智能算力網絡,通過情況和各地區的
49、需求情況進行算力動態調配,確保已建成的人工智能計算中心保持高效運營。ChatGPT 是 AI 大模型創新從量變到質變長期積累的結果,是通用人工智能(AGI,Artificial General Intelligence)發展的重要里程碑。以 GPT-4 為例,超大規模預訓練模型展示了一條通向通用人工智能的可能方向,人們通過輸入提示詞和多模態內容,便可生成多模態數據。更重要的是,它可以用自然語言方式生成任務描述,以非常靈活的方式應對大量長尾問題和開放性任務,甚至是一些主觀的描述?!按竽P?大算力+大數據”成為邁向通用人工智能的一條可行路徑,比如大模型技術是自動駕駛行業近年的熱議趨勢。自動駕駛多模
50、態大模型可以做到感知和決策一體化。在輸出端,通過環境解碼器可對 3D 環境進行重建,實現環境的可視化理解;行為解碼可生成完整的路徑規劃;同時,動機解碼器可以用自然語言描述推理的過程,進而使自動駕駛系統變得可以解釋。而大規模深度學習模型的參數和數據量達到了一定量級,超大規模AI 大模型的訓練一般必須在擁有成百上千加速卡的 AI 服務器集群上進行,需要相應算力的支撐。根據 OpenAI 的數據,GPT-3 XL 參數規模為 13.2 億,訓練所需算力為27.5PFlop/s-day。由于ChatGPT是在13億參數的 InstructGPT 基礎上微調而來,參數量與 GPT-3 XL 接近,因此預
51、計 ChatGPT 訓練所需算力約為 27.5PFlop/s-day。同樣,算力作為自動駕駛的基本要素,從視覺檢測、傳感器融合、軌跡預測到行車規劃,上萬個算法模型需要同時完成高并發的并行計算,需要更高性能的智算中心來完成訓練、標注等工作。13.https:/ 中國人工智能計算力發展評估報告CHAPTER3 算力服務產業鏈可持續發展路徑 27國家“東數西算”工程下算力服務發展研究報告作為算力的聚集點,云數據中心的規?;沟盟懔Φ靡云栈莼?,用戶按需采購算力、存儲、帶寬即可開展業務。隨著國內大模型市場的快速發展對我國的基礎算力提出更高的要求,沒有算力基礎,算法等發展難以為繼。此時,云計算廠商的算
52、力基礎設施優勢凸顯,大模型的爆發會導致訓練的應用場景越來越多,對訓練的需求大幅增長,如何保證算力不衰減,對算力的高帶寬、存算一體等提出新要求,需要底層平臺+分布式框架+加速算法的高效集成。2023 年,云計算廠商開始發布人工智能大模型。未來,云數據中心的核心依然是:讓算力更加普惠,促使 AI 大規模普及。全方位的算力服務能力依然是云服務商競爭力的基石,算力基礎設施的使用效率,會直接影響到云服務商的創新能力和盈利能力。另外,大模型是一場“AI+云計算”的全方位競爭,超千億參數的大模型研發,并不僅僅是算法問題,而是囊括了底層龐大算力、網絡、大數據、機器學習等諸多領域的復雜系統性工程,需要有超大規模
53、 AI 基礎設施的支撐。因此,云服務商不斷優化硬件基礎設施提升算力效率,提供通用計算、智能計算能力,通過云統一管理多種算力,靈活調度算力資源,并形成完整的產業生態,推動新興產業發展。智算中心是服務于人工智能的數據計算中心,采用領先的人工智能計算架構,提供人工智能應用所需算力服務、數據服務和算法服務的公共算力新型基礎設施。2022 年,智算中心作為發展最快的一種算力供給形式,全球人工智能算力成為主要增量。在中國,智算中心發展尚處于初期階段但發展迅速。從國家信息中心發布的智能計算中心創新發展指南來看,當前我國超過 30 個城市正在建設或提出建設智算中心,整體布局以東部地區為主,并逐漸向中西部地區拓
54、展。智算中心建設目的促進產業 AI 化、AI 產業化,主要應用在城市治理、智能制造、自動駕駛等領域。2023 年火熱的大模型計算的需求加速了算力的商業應用以及智算中心的發展。無論是智慧城市還是智能制造、無人駕駛、數字孿生等場景,除了要有數據支撐以外,還要和各領域、各場景的知識模型、機理模型甚至物理模型相疊加,形成基于人工智能的新應用和場景實現。以 AI 芯片為主的高效率、低成本、大規模的智能算力基礎設施將成為訓練 AI 大模型的前提。云數據中心的核心依然是:讓算力更加普惠,促使 AI大規模普及。全方位的算力服務能力依然是云服務商競爭力的基石,算力基礎設施的使用效率,會直接影響到云服務商的創新能
55、力和盈利能力。28超算算力是基于超級計算機等計算集群所提供的高性能計算能力,通過各種互聯技術將多個計算機系統連接在一起,利用所有被連接系統的綜合計算能力來處理大型計算問題,所以又通常被稱為高性能計算集群。目前已有 11 個國家級超算中心,多個省級超算中心和高校級超算中心。AGI 時代來臨,模型服務(MaaS)商業模式呈現。就在 ChatGPT 面世之前,業界并不知道大模型可以實現令科技界為之興奮的應用水平,只是知道它可以寫一點新聞、聊天、畫畫,這些簡單的功能會在更多應用場景中帶來價值。從 GPT3 到 ChatGPT 的過程,是大模型技術發展的關鍵節點,也是中國人工智能之路和美國人工智能之路的
56、分歧點。這兩年大模型國內也有相當數量的公司參與其中,但追求的是參數量,從千億級到萬億級很快的躍進,但是智能屬性沒有涌現。OpenAI 則利用人工反饋的訓練機制,通過標注、對齊高質量數據,最后把這條路走通了,用千億參數的大模型把通用智能挖掘出來了,這個事情是值得國內科技界去反思的。圖片來源:算力經濟時代 數字中國萬里行 2023 新型算力中心調研報告CHAPTER3 算力服務產業鏈可持續發展路徑 29國家“東數西算”工程下算力服務發展研究報告另外一條路是 AIGC,國內眾多企業已經在 AIGC 賽道布局。這些都意味著人工智能進入通用人工智能(AGI:Artificial General Inte
57、lligence)時代,具備五個特性:涌現性(參數超過臨界值,模型能力實現突變)、工程化、通用性、密集型、顛覆性。這里就不多展開闡述。未來 5 到 10 年通用大模型的發展有可能使 AI 對文字、音樂、繪畫、語音、圖像、視頻等領域的理解力超過人類平均水平,并與互聯網和智能設備深度融合,深度改變全社會的消費模式和行為。通用大模型能力將嵌入生產力和生產工具、AI 驅動數據中心發生全景式革命,行業大模型和場景化 AI 等多路徑融合,AI 技術創新對商業價值的影響將變得更加廣泛和不可預測。四、構建軟硬協同的高性能、安全的公共算力設施算力是數字經濟時代新的生產力,對推動數字產業化、產業數字化、城市治理效
58、能提升,賦能經濟社會高質量發展具有重要作用。隨著數字時代的發展進程逐漸深入,數字孿生、元宇宙、Web3.0、通用人工智能等新興技術快速興起,海量數據爆炸式增長,多元化應用場景在各領域涌現,各行各業對高性能、高安全、高性價比的算力,特別是AI 算力的需求成百上千倍增長。因此,構建高性能、普惠、安全的公共算力基礎設施成為支撐產業轉型升級和創新發展的剛性需求和必然選擇。一是以異構計算為核心,突破通用算力架構體系性能瓶頸。傳統 CPU 架構強調算力的通用性,適合處理串行計算、數據庫運行等類型的工作,在海量數據和圖像處理等并行計算方面存在較大的性能瓶頸。隨著人工智能在各行業領域應用的不斷深化,特別是當前
59、以ChatGPT為代表的AI大模型的橫空出世,推動人工智能應用場景不斷豐富,并對計算性能提出了更加多元化、高標準的要求。根據摩爾定律,CPU 的性能每隔 18到24個月就能增長一倍,但是人工智能訓練任務所需要的算力每3.43個月就會翻倍,單核 CPU 的主頻已經逼近極限,傳統以 CPU 為主的通用計算架構已無法滿足海量數據下多元化場景的計算需求,以 CPU+AI 芯片(如 GPU、FPGA、ASIC 等)為主體的異構架構應運而生。異構架構通過將 CPU 與多種 AI 芯片集成,融合了通用計算單元和專用計算單元的優點,使不同類型的計算單元都可以執行自己最擅長的任務,具有高性能、高效率、低功耗等顯
60、著優點,可以有效解決新場景下通用算力性能不足的問題。二是以軟硬協同為途徑,提升異構算力的計算和調度能力。隨著摩爾定律逼近極限,基于馮諾依曼體系架構的硬件算力提升日漸乏力,而軟件程序效率的提升仍有較大空間,通 30過體系結構上的創新和軟硬件一體化協同來滿足持續增長的算力需求,是實現更大規模、更高效率并行計算和調度的有效途徑。因此,以異構架構為核心的新型算力體系要求算力基礎設施從以硬件為主導的計算性能提升向軟硬件協同優化演進。一方面,異構加速的軟硬件協同設計是面向性能、時延、功耗、可靠性、安全性等多種約束條件下的最優化問題,可以通過使用領域特定結構設計思路,對硬件、架構和代碼進行協同優化,有效提升
61、負載中的并行效率,提高數據和計算吞吐量,從而提升計算的整體性能。另一方面,軟硬件協同可以通過整合編譯器、編程語言、軟件開發庫等,面向異構的底層計算架構提供編程模型和程序接口,從而實現多元異構算力的統一高效調度和管理。數字中國建設整體布局規劃明確,數字中國建設按照“2522”整體框架布局,強調強化數字中國關鍵能力,構筑自立自強的數字技術創新體系,筑牢可信可控的數字安全屏障。近年來,隨著網絡安全法、數據安全法、個人信息保護法出臺,將我國數據安全保護及管理要求提升至新的高度。同時,“十四五”以來,國家出臺多項政策要求加快培育數據要素市場,建立高效共享的普惠型數據要素市場。構建高安全可控的數字基礎設施
62、,是維護、夯實數字基礎設施和數據資源體系的重要保障,是發展數字經濟的重要技術支撐。隨著國產處理器、國產操作系統、國產數據庫的發展和成熟,在黨政機構、能源、金融等關鍵行業領域,實現了高安全數字基礎設施的“從無到有、從有到優”,高安全數字基礎設施成為建設數字中國的重要力量。高安全數字基礎設施包含以下關鍵要素:一是可信可控,具備高水平自立自強的數字創新體系,實現在云、計算、存儲、網絡、安全、數據、智能等關鍵核心技術攻關,確保所有的技術資料、知識產權、源代碼,云平臺中不存在惡意后門并可以不斷改進升級,不受制于其他技術壁壘。二是原生安全,安全效果不能依靠單一技術或產品來解決,需要依靠“系統論”思想,進行
63、體系性建設。通過搭建云平臺原生安全、可信安全、云原生安全產品、合規安全等構建可信云原生安全架構??尚旁圃踩軜嬀邆渌拇蠛诵脑踩芰Γ嚎尚虐踩?、云原生安全、數據原生安全、智能安全。三是統合算力,通過構建自主可控的算力調度服務平臺,逐步開展異構云資源納管,系統優化算力基礎設施布局,對通用算力、超算、智算、邊緣數據算力等算力資源進行統一調配,實現數據資源高效配置,數據要素加速流通,數據價值全面釋放,數據安全有效保障。四是數智融通,數據和人工智能是數實融合的關鍵,數智能力需要融入數字基礎設施,構建云、網、智、算融合體系的數字經濟基礎底座。加大對大數據、人工智能、5G、區塊鏈等數字技術的創新應用
64、,利用 AI 技術激活數據價值,加快釋放行業數字化生產力,實現質量、效率和動力變革。CHAPTER3 算力服務產業鏈可持續發展路徑 31國家“東數西算”工程下算力服務發展研究報告五、先進制冷技術演進發展在通用算力方面,工信部數據顯示,截止 2021 年底,我國在用數據中心機架總規模超過 520 萬標準機架,平均上架率超過 55%。在智能算力方面,根據智能計算中心創新發展指南,2022 年我國智能算力規??焖僭鲩L,達到 268 百億億次每秒(EFLOPS),超過通用算力規模,預計未來 5 年中國智能算力規模的年復合增長率將達 52.3%。對于算力中心而言,算力規模持續增長,隨之而來的是散熱壓力和
65、節能挑戰。目前,作為服務器關鍵部件的 CPU/GPU,隨著性能提升功耗增加非常顯著。CPU 方面,第四代英特爾至強可擴展處理器的核心數最多可達 60 個,比代號 Ice Lake(-SP)的第三代至強可擴展處理器高出 50%。相應的,公開款的 TDP 指標上限,也從 270 瓦(W)一躍而至 350 瓦。AMD EPYC 9004 系列處理器,最大功率可達 400W。GPU 方面,2022 年英偉達于 GTC 大會上發布針對數據中心的新一代 Hopper 架構的 GPU 芯片單顆功耗達到 700 瓦,挑戰傳統風冷系統散熱的能力邊界。相比于傳統服務器,AI 服務器的功耗更高,隨著 AI 大模型與
66、訓練需求的持續增長,AI 服務器的市場規模將會繼續擴大。根據 IDC 數據,2022 年全球 AI 服務器市場規模達 202 億1,4001,2001,000800600400200031.775.0155.2268.0427.0640.7922.81,271.42019 2020 2021 2022 2023 2024 2025 2026百億億次浮點運算/秒(EFLOPS)中國智能算力發展情況圖片來源:算力經濟時代 數字中國萬里行 2023 新型算力中心調研報告 32美元,同比增長 29.8%,占服務器市場規模的比例為 16.4%。算力基礎設施高功耗、高功率密度發展成趨勢,液冷等新型冷卻技術
67、前景廣闊。訓練、使用大模型需消耗巨量算力,對使用芯片的性能和數量要求極高。為了滿足高算力負載的需求,需要疊加多核處理器,或者提高單核主頻,將使得處理器功耗顯著增加、數據中心功率密度越來越高。近年來國家出臺一系列政策文件規范數據中心的能耗管理和電能使用效率(PUE),明確要求到 2025 年,全國新建大型、超大型數據中心平均 PUE 降到 1.3 以下,國家樞紐節點降到 1.25 以下,綠色低碳等級達到 4A 級以上。隨著芯片功率、ICT 設備器件性能提高和單機柜功耗的增加,發熱量隨之上升,傳統風冷技術的散熱效率已經跟不上計算效率,難以完全解決高熱密度場景下的數據中心散熱問題,亟需應用液冷等新型
68、冷卻技術。液冷技術多適用于高功率、高密度數據中心,數據中心的液冷技術目前處于探索階段,總體發展趨勢良好。液冷的優勢在于,單位體積的液體帶走熱量的能力通常比空氣強得多,可以用較緩慢的流速冷卻更高發熱量的部件,而且工作溫度也可以相對高一些。這就意味著液冷即使在氣溫較高的地區也可以更多地利用自然冷源,減少對電能的使用,具有更好的節能效果。與傳統風冷技術相比,液冷技術具有更強的冷卻能力,其冷卻力是空氣的 1000-3000 倍,熱傳導能力是空氣的 25 倍,在同等散熱水平下,可數據整理:益企研究院CHAPTER3 算力服務產業鏈可持續發展路徑 33國家“東數西算”工程下算力服務發展研究報告節省 30%
69、-50%的冷卻能耗。隨著液冷技術的日益成熟,浸沒式液冷技術可以使 PUE降到 1.2 以下,聯合其他技術可使 PUE 趨近于 1。以“東數西算”成渝樞紐節點內,曙光承建的西部(重慶)科學城先進數據中心為例,采用立體化機柜布局,高密集約,從傳統密度角度看,提升了近 10 倍;同時該數據中心采用了曙光浸沒式液冷技術、余熱回收、綠色建筑等多種節能技術方案,不僅解決了散熱,還可以充分的釋放芯片的潛能。先進數據中心核心計算設備PUE值低至1.04,為全球最低,能耗水平比行業數據中心平均值低 30%左右。數據中心內的服務器整體無風扇,并與液冷換熱設備分層布置,機房內十分安靜。相比傳統風冷技術,液冷數據中心
70、正受到產業更多青睞。據賽迪顧問2023 中國液冷應用市場研究報告顯示,國內液冷數據中心市場近三年來飛速發展,市場部署規模達到 111.6MW。而中科曙光旗下的曙光數創以 58.8%的市場份額位列 2021 年至2023 年 H1,中國液冷數據中心基礎設施市場部署規模第一。34行業對液冷數據中心技術的關注,也映射到了科幻電影。如在 2023 年初上映的科幻電影流浪地球 2中,“未來航天中心計算機”就由中科曙光公司的新型液冷計算“出演”。該新型液冷計算機,將熱量通過相變液體換熱方式移出,使其可極大降低散熱能耗。目前采用相關冷技術的多地數據中心已節電超4億度,約減少了超1.35萬噸二氧化碳排放。CH
71、APTER3 算力服務產業鏈可持續發展路徑曙光浸沒相變液冷技術運行示意圖流浪地球 2劇照 35國家“東數西算”工程下算力服務發展研究報告六、算力網絡優化算力布局算力的互聯互通和統一調度是實現“東數西算”的一項基本條件,更是數據中心算力發展的必由之路。中國創新的提出了“算力網絡”的概念,旨在通過網絡將全國各個算力中心連接起來,形成一臺龐大的“網絡計算機”。一方面要提高算力輸送效率,通過并網實現高帶寬、低延遲的算力互聯;另一方面,需要團結領域內各大企業,可以屏蔽異構基礎設施的差異,通過統一編程框架和編譯的資源管理與調度軟件實現算力的互通和資源的統一調度和管理,穩步推進“東數西算”的發展與預后工作。
72、實現全社會算力資源的使用最優、效率最高。伴隨著算力經濟的深入發展,計算與存儲技術、全光網絡、算網一體化運營與管理等技術的不斷創新,全國各主要算力樞紐與各數據集群建設的不斷完善,以及各地區各行業數字化業務轉型的深入,全國一體化算力網絡將得到持續完善,并推動各區域內外部算力布局持續優化,對我國各地區、各行業的數字化轉型升級起到有力的支撐。首先,算力網絡的持續優化完善將構建形成多層級協同、多元化算力的一體化算力布局。從全國范圍的宏觀層面看,以“統籌、集約、創新、安全”為原則,在京津冀、長三角、粵港澳大灣區、成渝、內蒙古、貴州、甘肅、寧夏形成8個國家算力樞紐節點,形成多個國家算力樞紐為核心與東西南北算
73、力樞紐互聯互通的算力骨架。從重點區域范圍的中觀層面看,以“供需協同與綜合能效”為牽引,結合大型城市人口稠密、經濟產業發達等城市特點,通過在一線城市及其周邊建設大型、超大型數據中心滿足一線城市數字經濟復雜多變的業務應用場景與數字化轉型任務要求,形成區域中心與周邊協同發展“中心城-衛星城”算力布局。從城市內部范圍的微觀層面看,以“應用場景和用戶服務”為核心,通過建設中小型數據中心、邊緣計算中心和超邊緣計算中心等,提升城市算力云邊端互動與協同能力,服務智慧城市、智慧產業和數字政府等場景,形成城市內部的“多中心-多邊緣”融合的算力布局。從多元化算力發展的角度看,一線城市周邊的算力中心布局可以是通用型數
74、據中心、超算中心和智能計算中心,城市內部的數據中心還可以包括邊緣數據中心、超邊緣數據中心和終端算力等??傮w上看,隨著算力經濟的持續發展,我國將形成全國范圍內的多層級協同、多元化算力的一體化算力布局。36在此背景下,國內企業也進行了一體化算力服務的相關探索。如中科曙光及其旗下曙光智算公司就推出了一體化算力服務平臺(A),并以該平臺為統一接口,實現了包含曙光 GridView 計算集群管理和 Sothis AI 深度學習平臺等功能的曙光計算服務,依托“算力”、“算能”、“算網”三大服務板塊,解決了算力在全國范圍內的輸出、轉化、匹配、應用等難題,為超 10 萬用戶提供了過億次作業提交服務。一體化算力
75、布局將有力地促進數字產業與產業數字化的發展。算力資源的合理布局將極大地促進數字產業的創新發展,助力半導體芯片產業、數據中心產業、新一代信息網絡與安全產業、人工智能產業、數據要素產業和綠色低碳產業發展,形成算網融合產業生態。同時,算力資源的建設將有效賦能產業數字化轉型進程,助力智能制造、自動駕駛等傳統產業實現跨區域協同發展,為產業發展注入新的活力。CHAPTER3 算力服務產業鏈可持續發展路徑 37國家“東數西算”工程下算力服務發展研究報告其次,先進的算力資源將有力促進人工智能從技術突破走向產業落地。經過機器學習領域多年的技術積累,人工智能生成內容(AIGC)技術的表現近年得到了實質性突破,基于
76、全新一代多模態大模型 GPT4 的 ChatGPT 在圖文數據處理方面的能力得到大幅提升,其在知識問答、翻譯、內容創作等諸多應用取得了驚人的表現。ChatGPT 的核心價值在于改變了人類的“知識表示和調用方式”,使通用人工智能的實現又邁出了堅實一步,為人工智能產業的發展提供了極大可能。AIGC 應用具有數據傳輸量巨大和模型規模巨大等特點,傳統計算模式無法滿足其發展需求。一方面,AIGC 應用需要處理和傳輸的數據量巨大。在 AIGC 應用中,需要對來自傳感器、監控設備、社交網絡、移動設備等不同來源的結構化、非結構化和半結構化(包括文本、圖像、視頻)數據進行采集、傳輸、清洗、轉換、整合和標注等操作
77、,然后傳輸至算力網絡的算力節點,由算力節點接受任務后利用模型訓練生成內容,其中模型包括自回歸模型、生成對抗網絡、變分自動編碼器、基于流的生成模型、擴散模型等大模型;以便進行深度學習和機器學習算法的應用,訓練好的模型、算法和結果傳輸回客戶端系統,由于傳輸的數據量通常很龐大,需要高帶寬和低延遲的網絡來支持。另一方面,AIGC 模型持續擴大。在 AIGC 領域應用的大模型通常由多層級的復雜結構組成,需要處理數以百萬計的參數和變量,這些模型和算法通常需要大量的計算資源來進行訓練和推理。GPT-4 在 120 層中總共包含了 1.8 萬億參數。為了處理海量的數據和復雜的模型,需要使用并行計算和分布式計算
78、技術,以利用多個計算機或處理器來同時處理數據。AIGC 應用通常需要大規模的計算資源來支持其復雜的計算需求,隨著 AIGC 數據規模的增大和多樣化,處理數據的能力需要不斷提升。傳統計算模式無法滿足 AIGC 應用對算力的需求。在普通的計算任務和業務中,傳統的計算方法如邊緣計算和云計算具有一定的局限性,無法完全滿足 AIGC 應用的需求。云計算和邊緣計算對于一些復雜和大規模的計算任務,傳統的計算方式受限于計算能力、數據處理能力和模型表達能力等。云計算和邊緣計算在處理大量的 AIGC 應用數據時無法保證低延遲。為了解決數據上傳和下發以及大模型的算力問題,算力網絡將云邊端三層算力結構組織調度成具有高
79、效和安全性能的網絡,可以在區域間、區域內部的中心城市與周邊城市間優化算力布局,共同完成大規模計算任務。AIGC 應用通過分布式存儲和分布式計算等技術,可以將數據和計算任務分散到處于不同地理區域間的多臺計算機上,從而提高數據處理和模型訓練的效率。算力網絡架構把網絡資源層和算力資源層合并為網 38絡基礎設施層,以實現由網絡資源、計算資源分治管理到算網統一控制和管理;由網絡調度過渡到網絡和計算聯合調度,由網絡的度量過渡到網元和算力節點的互聯、度量和建模。算力網絡具備強大的算力、數據處理和自動化的工具,同時具有高度可擴展、可靠和彈性的系統設計能力。算網融合化一體化發展不僅可以優化我國算力布局結構,還可
80、以很好地支撐我國人工智能大模型產業的發展。如中科曙光就依托“一體化算力服務平臺”,探索如何降低 AI 大模型的訓練與推理成本。該平臺可讓全國用戶無需投入大量成本購買硬件設施,就能完成 AI 大模型的訓練與推理工作,平臺除能夠在線提供 Tensorflow、PyTorch、PaddlePaddle 等主流 AI 框架算力支持外,還可實現在數千節點規模時仍能滿足高效訓練目標,進而曙光與 AI 企業形成了基于 AI 模型的聯合解決方案,攻克類腦智能、基因技術等難題。目前,曙光“一體化算力服務平臺”已為“紫東太初”、“悟道 2.0”、“文心一言”等多個國內大模型訓練提供算力支持。再次,算網融合與算力資
81、源的優化布局將有力賦能傳統制造業走向智能化、協同化?;谛乱淮畔⒕W絡和云計算制造協同平臺提供協同化制造已成為重塑全球制造業競爭優勢的關鍵因素?!笆奈濉敝悄苤圃彀l展規劃指出,建設智能制造示范工廠。引導龍頭企業建設協同平臺,帶動上下游企業同步實施智能制造,打造智慧供應鏈。鼓勵各地方、行業開展多場景、多層級應用示范,培育推廣智能化設計、網絡協同制造、大規模定制、共享制造、智能運維服務等新模式。雖然我國制造業發展在多個領域取得了顯著成績,但與世界先進國家相比,我國的工業基礎依然薄弱,尤其在應用于重要領域的核心裝備產品的生產制造工藝、產品自主研發能力和產品結構方面差距較大,同時,市場對制造業產品的要
82、求也在快速變化,呈現出大型化、小批量、定制化、交付快等新特征。算力網絡正具備強大的算力、數據處理和自動化的工具,同時具有高度可擴展、可靠和彈性的系統設計能力。算網融合化一體化發展不僅可以優化我國算力布局結構,還可以很好地支撐我國人工智能大模型產業的發展。CHAPTER3 算力服務產業鏈可持續發展路徑 39國家“東數西算”工程下算力服務發展研究報告從需求看,制造業智能化、協同化發展已經成為必然趨勢。制造業產品研制的過程是一種知識密集型工作,需要綜合多個學科專業和領域的知識,為了實現制造裝備的高效、快速、精確制造,在產品生命周期的各個階段需要調用許多設計單位長期在工作習慣、設計流程和管理手段等方面
83、積累的資源和經驗。同時,制造業終端客戶和產品提供商分布于不同地區,為用戶提供各類按需制造服務要多個異地企業在跨領域和跨地域的合作下完成。因此,制造企業轉型需要根據客戶訂單快速重新調整生產方式和組織架構,以快速響應瞬息萬變的市場變化與消費者個性化定制需求,實現產品全生命周期、跨地域、跨機構、跨專業的網絡化協同服務,提升系統的整體協同效應,為創新產品帶來活力。建設動態快速響應的制造網絡協同服務平臺,強調對復雜產品全生命周期信息、數據的高效管理,提升設計、工藝與制造過程以及整個供應鏈的協同運轉效率是數字經濟和數字化轉型背景下,制造業協同化發展的必然選擇。從供給看,先進的算力網絡將有力支撐制造業智能化
84、、協同化發展。為了更好地支撐協同制造業務創新,需要構建先進的智能算力中心、云計算中心、網絡等算網資源,和跨區域的云網融合機制。一是支持數據的存儲與處理,制造業的設計、仿真、試驗及企業的生產制造各環節中產生海量數據和知識,規范化、標準化數據管理極具挑戰性,同時領域知識更新變化快,導致知識積累困難、知識創新力度不夠,嚴重制約研制周期和技術創新。需要構建制造研制數據中心系統和云計算中心對數據進行存儲、管理、分 40析應用,以及知識獲取、知識更新與維護、知識主動推送、知識創新與共享,實現全生命周期數據管理,挖掘利用業務數據實現對決策支持系統的數據支撐,提高產品研制質量并縮短研制周期。二是支持產品研發。
85、制造業具有性能要求嚴格、設計更改頻繁、產品構型眾多、零件材料及形狀各異和內部結構復雜等特點,其研制過程是一項多專業協同設計仿真的工作。需要溝通先進的算力網絡支撐構建以任務為核心的設計仿真流程管理系統、工程師統一工作平臺、知識驅動的模塊化設計軟件、統一的研發數據中心,形成制造業數字化過程研發體系,全面監控研發過程中資源使用、任務進度、數據狀態、基礎技術應用,全面提高企業的研制管理效率、資源利用效率、專業設計效率。三是支撐協同制造。制造業企業的生產方式逐步從大批量生產向多品種、小批量客戶化生產的生產方式轉變,要求企業對生產過程的管理和監控更加趨于準時化、柔性化和實時化。以先進的算網融合技術,優化城
86、市內部算力布局,可以有效支撐產業鏈上企業之間的協同生產,實現對作業計劃和工廠、人員、設備等生產主體的實時跟蹤,提升產業鏈整體信息流轉效能,實現對鏈上企業的全方位的監控管理,達到快速響應市場和顧客的要求,從而從整體上提升產業鏈聯動協作水平,增強各企業的執行力和產品質量。七、算力網絡不同路線實踐 打造高效的算力網絡是實現“東數西算”中“國家樞紐節點之間進一步打通網絡傳輸通道”、“優化東西部間互聯網絡和樞紐節點間直連網絡”,“提升跨區域算力調度水平”的關鍵。近年來,我國在算力網絡方面取得了長足的進步。如在 2023 年 4 月,科技部在天津組織召開國家超算互聯網工作部署啟動會,發起成立了國家超算互聯
87、網聯合體。國家超算互聯網是以互聯網的思維運營算力中心,并連接產業生態中的算力供給、應用開發、運營服務、用戶等各方能力和資源,構建一體化算力網絡和服務平臺。從整體構架上看,算力網絡的架構可分為三層,從下至上依次為基礎設施、編排管理和運營服務層。并通過市場化的運營和服務體系,實現算力資源統籌調度,降低算力應用門檻。目前,國家超算互聯網正式啟動服務商招募工作。首期招募主要面向國內優秀的軟件服務商及個人軟件服務者。同時發起包含市場發展基金、免費算力資源等豐厚福利的“超賦”千萬基金激勵計劃。CHAPTER3 算力服務產業鏈可持續發展路徑 41國家“東數西算”工程下算力服務發展研究報告同在 2023 年,
88、中國信通院牽頭成立“中國互聯網協會算網云協同系統工作委員會”,旨在促進算網云產業協同發展。中國信通院提出算力互聯五通五層模型以及“三位一體”實現路徑,通過算力注冊感知、算網參數調度、身份認證管理、統一計費度量等公共服務,構建架構互通、高速互聯的標準化環境,降低算力服務商算力互聯互通成本,實現“一點接入、全算貫通”。計算與通信產業鏈相關企業在中國科學院科技算力基礎設施建設、運營實踐基礎上聯合發起成立算力互聯公司。算力互聯集算力運營、資源交易、數據交換、生態服務于一體,聚集了豐富的算力資源中心、算網數據交換中心、算力互聯網接入點以及算網生態應用平臺,打造以算力互聯全國一體化算力調度服務平臺 ACL
89、ink 和全國一體化算力服務通信網絡 ACNet 為核心、面向科技和產業的算力互聯網。該公司正以“資管+交易”模式開展“自營+互聯”算力基礎設施全國布局,希望打造算力互聯與算力智能的技術體系與經濟體系。梳理國內算力網絡的實踐路徑,最早可追溯到 2015 年,中國科學院計算技術研究所(計算所)提出的“信息高鐵”概念。計算所將“信息高鐵”定義為面向 IT3.0 時代的新型信息技術設施。2023 年,計算所打造了廣域分布式的數算融合基礎設施試驗平臺,建成連接北京、南京、鹽城、鄭州、重慶、蘇州 6 地算力站國家超算互聯網部署啟動儀式現場 42的“算力高鐵”綜合試驗場,自主研發了算力網操作系統(算力商店
90、)和原生的模型市場。平臺實現了算力資源動態接入和全局統一調度,支持以“分層解耦”方式構建算力、數據、模型及應用服務,是我國首個云網邊端一體化的信息基礎設施綜合試驗平臺,并參與國家“東數西算”跨區域算力調度示范。2019 年,鵬城實驗室以“鵬城云腦”為初始樞紐節點、以智算中心為基礎,啟動了中國算力網的研發與建設。2022 年 6 月,中國算力網正式上線“智算板塊”,采用算網融合技術,計劃實現全國智算中心聯網與入網中心的統一規劃、統一調度、統一運維。眾多實踐雖有不同的技術路徑,但懷有一顆相同的“初心”:通過解決異構算力數據中心的互聯和互通問題,最后實現全國統一的分布式的異構資源的調度,提高運營效率
91、。CHAPTER3 算力服務產業鏈可持續發展路徑 43國家“東數西算”工程下算力服務發展研究報告CHAPTER4面向 2030 年算力服務展望 44第四章面向 2030 年算力服務展望一、算力服務的綜合價值展望算力服務將提高科技創新速度,成為大數據、人工智能等技術創新發展的基石,加快科技成果轉換。首先,算力服務提供了一個高效且便捷的計算環境,使得科研機構、企業、高校、開發者等可以更便捷地開展各種計算密集型工作,加速了科技創新的進程。其次,算力服務為大規模數據處理和復雜算法模型訓練提供了必要的計算能力,加速人工智能大模型的訓練過程,從而加快技術的迭代和應用落地,為大數據、人工智能等數字技術的創新
92、與應用提供了堅實的基礎。算力服務將成為算力賦能傳統產業數字化轉型升級的重要手段,同時激發算力產業迸發新活力。首先,傳統產業在數字時代下正面臨產業數字化轉型升級的機遇與挑戰,但傳統行業通常存在 IT 人才儲備不足、數據資產積累薄弱、數字化轉型試錯成本高的問題,提供簡單易用的算力服務是算力賦能傳統產業數字化轉型的重要手段。其次,算力服務可以激發算力新產業。一方面,算力服務激發新的產業角色,算力服務的發展衍生了算力度量、算力調度、算力交易等多種算力管理新范式,同時出現了以上述技CHAPTER4 面向 2030 年算力服務展望圖片來源:算力經濟時代 數字中國萬里行 2023 新型算力中心調研報告 45
93、國家“東數西算”工程下算力服務發展研究報告術研發為核心業務的新型算力服務商;另一方面,算力服務推動信息技術產業構成升級,為適應算力服務發展,傳統芯片、操作系統、網絡、云計算等企業紛紛延伸業務范圍,發展出軟硬一體、算力網絡等新理念,重塑和整合信息技術產業結構,刺激數字經濟迸發全新活力。如曙光的“一體化算力服務平臺”,其服務范圍不僅覆蓋了人工智能、氣象、生物、材料、智能制造等眾多領域,還為滿足用戶融合創新需求,實現了不同領域應用在同平臺的同步編譯、運行和處理,進而極大提升創新速度。算力服務通過賦能千行百業可以產生直接的經濟價值,也通過擴大算力核心產業規模產生巨大經濟效益。一方面,通過將算力服務逐步
94、滲透至醫療、交通、教育、政務、金融、工業等各產業、助力細分行業企業數字化轉型,形成強大的生態服務圈和數字經濟效應增長。算力服務直接支持第一二產業數字化轉型,其帶來的資本與技術投入為制造、交通、零售等多個傳統行業帶來產值增長,這些傳統行業發展程度越高,算力服務對經濟的促進程度越顯著。另一方面,算力服務有助于擴大算力核心產業規模,產生巨大經濟效益。據工業和信息化部數據顯示,截至 2022 年,算力核心產業規模已經達到 1.8萬億元。算力服務的普惠化、泛在化、標準化特性,使得算力將成為社會基礎公共資源和未來智能社會的技術底座。首先是算力服務通過一體化感知調度技術,屏蔽異構算力資源的底層差異,實現其統
95、一調度、輸出,降低了用戶異構算力資源使用的門檻,拓展算力服務用戶群體與規模,加深算力服務普惠化。其次是云網邊端融合程度的加深,能夠將泛在算力資源互聯,形成覆蓋范圍更為廣泛的資源池,讓用戶能夠隨時隨地享受算力服務通過賦能千行百業可以產生直接的經濟價值,也通過擴大算力核心產業規模產生巨大經濟效益。算力服務的普惠化、泛在化、標準化特性,使得算力將成為社會基礎公共資源,成為未來智能社會的技術底座。46到算力資源提供的服務,擴大算力服務覆蓋范圍,實現算力服務泛在化。最后是統一資源接入方式、接入架構等,能夠為異構算力資源建立輸出標準,助力算力服務的標準化。算力服務的普惠化、泛在化和標準化特性使其將成為類似
96、水電、廣泛應用于社會各領域的公共基礎資源,為社會的數字化、智能化發展提供了堅實的技術基礎。二、算力服務促進算網深度融合帶來算力服務變局算力服務作為新時代下數字經濟的重點產業,將在未來數年為各領域創新發展注入新動力。資源上,計算架構持續升級,異構資源實現協同聯動。當前,全球數據量爆發性增長,人工智能、區塊鏈、數據中心和邊緣計算等場景對算力的需求越來越高。為了滿足多元化的算力需求和應用場景,未來的基礎計算架構將引入更多種類的基礎資源來加速計算。除了傳統的 CPU 計算單元外,還包括 GPU、DPU、AI 加速芯片等。目前,芯片提供商主要依靠自身的硬件條件來構建計算架構,彼此之間差異較大,導致跨架構
97、應用開發和遷移面臨困難。未來將通過開源框架和接口等方式建立一個統一、規范且可以屏蔽底層軟硬差異的計算架構平臺,從而支持不同類型資源之間的聯合協作,從底層優化算力服務性能。服務上,算力服務水平持續提升,供給模式不斷優化。隨著各行各業數字化轉型進度加快,企業對算力供給的要求越來越高。算力供給作為算力服務中面向用戶中至關重要的一環,未來應當從以下幾個方面加強發展:一是進行整體最優的資源配置優化,解決算力供給與需求之間的結構性矛盾,保障算力的高效產出和使用;二是強化資源和需求的映射關系,算力服務可依據任務類型,智能化選擇計算資源進行調度,持續提全球數據量爆發性增長,人工智能、區塊鏈、數據中心和邊緣計算
98、等場景對算力的需求越來越高。為了滿足多元化的算力需求和應用場景,未來的基礎計算架構將引入更多種類的基礎資源來加速計算。CHAPTER4 面向 2030 年算力服務展望 47國家“東數西算”工程下算力服務發展研究報告高任務執行效率,優化資源使用;三是需加速完善算力交易體系,并融入多種安全技術如隱私計算、區塊鏈等,保障算力輸出的安全性。算網深度融合態勢之下的新型服務模式,將全面賦能各行各業,充分滿足各類場景需求,給企業帶來創新發展的源動力。算力和網絡的發展日益呈現一體共生之勢,從最初網絡僅支持連接算力逐漸演進到感知算力、承載算力、調度算力,實現網在算中、算網一體。未來,算力度量、算力原生、算力路由
99、、算力調度等關鍵技術的發展成熟,將推動算網資源日益走向深度融合。當前,算網感知接入、協同編排調度以及控制轉發等相關技術快速發展,目前已具備提供跨架構、跨服務商、跨地域服務的前置條件。一是算力度量技術在資源感知接入階段筑牢跨架構服務基礎。算力度量技術面向不同架構的計算資源、不同連接方式的網絡資源、不同介質的存儲資源分別進行量化,完成量綱統一,為算力跨域調度屏蔽底層資源架構差異,根據具體任務需求按量匹配資源,實現算網資源的充分利用。二是多要素融合在編排調度階段突破跨服務商資源壁壘。算力服務內涵下的編排調度與 48傳統編排調度的差異主要在于,前者是面向計算任務進行,更加關注用戶需求;而后者是聚焦計算
100、資源。算力資源之間存在服務商屬性差異,傳統的編排調度以服務商為前提進行資源匹配,即在相對有限的資源下形成最優的編排方案;算力服務內涵下的編排調度能夠以用戶計算任務性能需求、資源規模需求及全域資源狀態等多要素作為編排要素,將跨域的算、網等原子能力進行按需靈活組合,突破跨服務商編排調度的限制。三是智能選路在控制轉發階段沖破跨地域調度阻礙。傳統調度場景中,網絡主要起到保障傳輸的輔助作用。隨著“算力路由”、“算網一體”等概念的提出與相關技術的成熟,通過在網絡路由體系中增加算力信息,來實現網絡和計算資源的一體化感知,進而實現網絡與多重異構算力資源疊加的全局跨域智能調度。網絡智能選路完成調度過程中最優算力
101、節點及傳輸路徑的選擇,有效優化調度傳輸時延,系統化提升算力服務質量。在產業實踐上,算網云一體化技術持續落地,算網大腦是典型代表。當前產業內已誕生如算網大腦、算網調度引擎、算網一體機等聚焦算網云一體化技術的實踐產品,并在音視頻、AR/VR、自動駕駛、智慧園區等多種場景中得到應用,其中,算網大腦是算網云一體化技術落地的典型代表。例如,以三大運營商為代表,各自建設的算網大腦通過對計算任務、算網資源狀態等信息的綜合判斷,形成可支持跨架構、跨地域、跨服務商調度的算網編排方案,并完成相關資源部署,以支撐其東視西渲、東數西訓等多場景運算需求。應用上,算力服務加速產業滲透,應用場景充分拓展。隨著算力服務化進程
102、的加快,算力市場逐步擴展到跨地域、跨運營主體的算力交易。高效的算力交易能力將有效盤活存量算力,降低單位算力使用成本,促進算力服務深入政府、金融、教育、制造、工業、農業等行業。未來,算力服務將在各行業得到更廣泛的應用。在醫療行業,算力服務可以用于加速基因測序、藥物研發等重要任務,進一步推動醫療技術的創新。在交通行業,算力服務可以用于優化交通流量,提高交通效率,實現智能交通管理,減少擁堵和事故的發生。此外,算力服務還可以應用于城市規劃、環境保護、金融風控等領域,幫助決策者更好地分析和處理復雜的問題,提供精準的決策支持。隨著算力服務應用場景的拓展,預計相關技術和服務的市場規模也將不斷擴大,為經濟增長
103、和社會進步帶來更多機遇。CHAPTER4 面向 2030 年算力服務展望 49國家“東數西算”工程下算力服務發展研究報告產業上,算力服務市場日趨繁榮,產業生態愈發成熟。當前,電信運營商、IT 基礎設施企業、互聯網頭部企業以及部分中小型服務商等眾多企業已紛紛入局算力服務市場,算力服務產業生態雛形基本形成,市場建設日趨繁榮。在下一發展階段中,算力服務產業上下游各方需加強相互協作,共同攻克技術實踐難題,持續創新算力應用新模式。依靠市場各方的通力合作與協同發展,我國算力生態產業鏈將逐漸成熟。通過打造綠色可持續發展的算力服務商業模式,為數字經濟時代掀開嶄新篇章。未來,算力將加速普及,類似于電力插座變成算
104、力插座。用戶使用算力不需要帶一臺電腦,可以通過一個標準的計量方式來使用算力。未來還可能會出現類似于發電廠的算力工廠,尤其在西部地區會出現,比如在煤礦、水電站的附近已經開始建設算力工廠,電力極其便宜,成本特別低。工業時代有公路、電網,算力時代也有算力網絡。隨著算力服務的發展,未來在算網時代有三類不同角色:一是網絡通信商,通過算網融合參與進來;另外超算的供應商、云計算供應商,通過超算互聯網也會參與提供算力服務;還有國家電網通過建設發電廠,參與提供算力服務。三類角色從不同的技術途徑搶占算力服務市場。50版權聲明國家東數西算工程下算力服務發展研究報告版權屬于中國智能計算產業聯盟和中研益企(北京)信息技術研究院有限公司,并受法律保護;轉載、摘編或利用其他方式使用本考察報告文字、圖片或者觀點的,應注明“來源:中國智能計算產業聯盟和益企研究院”;違反上述聲明者,本公司保留追究其相關法律責任的權利。