《推理算力行業深度:發展現狀、競爭格局、發展趨勢、產業鏈及相關公司深度梳理-250217(21頁).pdf》由會員分享,可在線閱讀,更多相關《推理算力行業深度:發展現狀、競爭格局、發展趨勢、產業鏈及相關公司深度梳理-250217(21頁).pdf(21頁珍藏版)》請在三個皮匠報告上搜索。
1、 1/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 行業研究報告 慧博智能投研 推理算力推理算力行業行業深度:深度:發展發展現狀現狀、競爭格局競爭格局、發展趨勢發展趨勢、產業鏈、產業鏈及相關公司深度梳理及相關公司深度梳理 推理算力(Inference Computing Power)指在人工智能(AI)模型中,利用已訓練完成的算法對輸入數據進行實時預測或決策所需的計算能力。其核心價值在于將實驗室中的 AI 模型轉化為實際應用,是AI 商業化落地的關鍵環節。推理算力作為 AI 技術應用的核心環節,正在迎來爆發式增長。隨著生成式 AI 的快速發展,推理算力的需求
2、將逐步超過訓練算力,尤其是在科學研究、編程、辦公軟件、醫療健康和金融等領域,推理算力的應用場景將更加廣泛。未來,隨著國產 AI 芯片廠商的逐步崛起,推理算力的市場格局將發生深刻變化,國產芯片有望在 3-5 年內占據更大的市場份額。此外,推理芯片的市場規模潛力巨大,預計到 2025 年,推理芯片的需求將達到 600 億美元左右。圍繞推理算力,下面我們從 AI 技術的兩個環節開始溯源,進而了解推理算力發展現狀、競爭格局、未來發展趨勢,并對產業鏈及相關公司進行梳理,希望能夠幫助大家更好了解推理算力。目錄目錄 一、AI 技術及推理算力.1 二、推理算力發展現狀.2 三、推理算力競爭格局及市場空間.3
3、四、推理算力產業鏈.4 五、國內推理算力相關公司.9 六、推理算力的未來發展趨勢.19 七、參考研報.20 一、一、AI 技術及推理算力技術及推理算力 1.AI 技術的兩個環節技術的兩個環節 AI 技術在實際應用中包括兩個環節:訓練(Training)和推理(Inference)。訓練是指通過大數據訓練出一個復雜的神經網絡模型,使其能夠適應特定的功能。訓練需要較高的計算性能、能夠處理海量數據、具有一定的通用性。推理是指利用訓練好的神經網絡模型進行運算,利用輸入的新數據來一次性獲得正確結論的過程。2/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 云端推理占比逐
4、步提升,AI 落地應用數量增加。根據 IDC 數據,隨著人工智能進入大規模落地應用的關鍵時期,2022 年在云端部署的算力里,推理占算力已經達到了 58.5%,訓練占算力只有 41.5%,預計到 2026 年,推理占到 62.2%,訓練占 37.8%。云端推理占比逐步提升說明,AI 落地應用數量正在不斷增加,人工智能模型將逐步進入廣泛投產模式。2.推理算力推理算力 推理算力是 AI 技術實際應用中的關鍵環節,主要涉及利用訓練好的模型對新數據進行快速處理和響應。推理的過程不需要重復使用訓練側的算力,而是隨著應用場景、用戶數量和使用頻次的增長而擴展。推理算力的需求通常通過“云端訓練,端側推理”的模
5、式來實現,即將訓練好的模型下放到端側設備(如手機、服務器等),端側設備利用這些模型進行實時推理運算。二、二、推理算力推理算力發展現狀發展現狀 1.2024 年推理算力需求開始爆發年推理算力需求開始爆發 2024 年,推理算力的需求已經開始爆發式增長,尤其是在生成式 AI 的應用中,推理算力的需求遠超訓練算力。根據 IDC 的預測,到 2026 年,中國智能算力規模將達到每秒十萬億億次浮點運算(ZFLOPS),年復合增長率達到 52.3%。這一增長主要來自于推理端的需求釋放,尤其是在大模型的應用中,推理算力的需求已經逐步超過訓練算力。vXbYmNtRoNqMmR8OcMbRnPmMtRqNfQo
6、OsQlOoPuM6MmMvMxNrRrRMYnRoO 3/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 2.預計今年為算力爆發元年預計今年為算力爆發元年 此外,2025 年被認為是算力爆發的元年,推理算力的需求將迎來井噴式增長。以字節跳動的豆包模型為例,截至 2024 年 12 月中旬,其日均 token 使用量已經超過 4 萬億,短短七個月內增長了 33 倍。這一增長的背后,是 AI 技術在各行業廣泛應用所帶來的巨大算力需求。未來,推理算力的需求將繼續增長,尤其是在 OpenAIo1-preview 等新一代模型的應用中,推理算力的需求將進一步擴大。三、
7、三、推理算力競爭格局推理算力競爭格局及市場空間及市場空間 1.一超多強一超多強 推理算力市場的競爭格局呈現出“一超多強”的態勢,英偉達憑借其硬件優勢和軟件生態在推理芯片市場占據領先地位。根據 LiftrInsights 的數據,2022 年英偉達在數據中心 AI 加速市場的份額達到了 82%,遠超其他競爭對手。然而,隨著美國對高端芯片的出口限制逐步加大,國內廠商如華為昇騰、寒武紀等正在加快追趕步伐,尤其是在國產替代的趨勢下,國內廠商有望在未來占據更大的市場份額。4/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 2.百花齊放百花齊放 此外,推理芯片的供應商呈現
8、百花齊放的態勢,除了英偉達和 AMD 等主流廠商外,其他公司如 Xilinx、Altera、Lattice 等也在特定場景下提供了高效的推理解決方案。未來,隨著生成式 AI 的廣泛應用,推理芯片的需求預計將大幅增長,尤其是在 2024 年和 2025 年,推理芯片的需求可能達到 600 億美元左右。四、四、推理算力產業鏈推理算力產業鏈 推理算力的產業鏈涉及多個環節,從芯片設計、制造到 AI 服務器、云計算平臺,再到最終的應用場景。以下是推理算力產業鏈的主要組成部分:5/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 1.芯片芯片(1)目前目前 GPU 為云端為
9、云端 AI 訓練應用的首選,也有專門面向推理需求設計的訓練應用的首選,也有專門面向推理需求設計的 GPU 在云端訓練場景,GPU 兼顧通用性和高算力,同時具有完善的軟件生態便于開發,目前占據主導。云端訓練 GPU 常用的型號例如 V100、A100、H100,上述型號在多種比特位寬具有高算力表現,互連帶寬性能也能滿足集群分布式訓練的需要。在云端推理場景,A100、H100 等型號亦可應用,英偉達也設計了面向推理市場的 T4、A10 等 GPU,這一類型號的性能相比同代旗艦有所下降,但仍具有良好的低精度比特位寬滿足 AI 推理的需要,可以滿足客戶對能耗、成本的綜合考慮。帶寬、互連速率的限制,使云
10、端超大規模的模型推理選擇 A100、H100 更優,而非 T4、A10 等推理卡。以 GPT-3 為例,OpenAI 數據顯示 GPT-3 模型 1750 億參數對應超過 350GB 的 GPU 顯存需求。假設參數規模與所需顯存呈線性關系,且推理的中間參數量按 1 倍估算,則 1 萬億參數規模的大模型推理需要約 4000GB 顯存,則需要 50 張 A100(80GB)或者 167 張 A10(24GB)。集群中的 GPU 數量越多意 6/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 味著更復雜的互連要求,而且 A10 無法應用 NVLink 和 NVSwi
11、tch 技術,大量 A10 組成的集群僅依靠PCIe 通信,互連帶寬相比 A100 等顯卡的劣勢明顯,進而可能導致模型推理的時效性不佳。(2)邊緣端靠近數據源頭,需求復雜致使邊緣端靠近數據源頭,需求復雜致使 AI 芯片種類豐富多樣芯片種類豐富多樣 邊緣端 AI 以推理任務為主,邊緣 AI 芯片的特點是靠近數據源頭,就近為終端設備提供 AI 算力,減少了網絡通信延遲,并不代表算力需求一定弱。邊緣 AI 芯片通常要求更為多樣化,要求保證具體應用場景的高能效、低延遲、低成本等要求,復雜的需求場景導致邊緣 AI 芯片的種類豐富多樣。目前邊緣端的模型小到使用 CPU 做 AI 運算即可,或大到借助 AI
12、 芯片進行運算加速,INT8 算力從幾 TOPS 到幾百TOPS 不等。邊緣端 AI 推理芯片依然遵循 CPU+xPU 的異構方案,并由于空間制約多以 SoC 的形式出現,GPU、FPGA、NPU、ASIC 則作為加速模塊布置于其中。例如英偉達 JestonXavier 內含 Volta 架構 GPU,蘋果 M2 配備 NPU 模塊。在邊緣端的小算力場景,GPU 的功耗較大,NPU 具有較強的競爭力。經測算,AI 大模型在訓練端和推理端都將產生巨量的算力/AI 芯片需求。如果未來大模型廣泛商用落地,推理端的算力/AI 芯片的需求量將明顯高于訓練端。(3)推理更依賴于任務本質,以此決定所需芯片種
13、類推理更依賴于任務本質,以此決定所需芯片種類 在推理芯片的選用方面,相較于訓練更多關注模型大小而言,推理更依賴于任務本質,以此決定所需芯片種類。推理算力涵蓋芯片類型非常豐富,涵蓋了從高性能 GPU 到 CPU、FPGA、ASIC 等多種芯片類型。不同的推理任務對芯片的需求不同,例如,當需要大量內容或圖像生成時,通常會選擇 GPU 進行推理計算(如英偉達的 T4 芯片);而對于較簡單的推理過程(如語音識別等),CPU 有時也會成為較好的推理引擎。此外,FPGA 和 ASIC 在特定場景下也能提供高效的推理能力??傊啾扔柧毿酒评硇酒瑥S商所采用的路徑更多元化。7/21 2025 年年 2 月月
14、17 日日 行業行業|深度深度|研究報告研究報告 2.AI 服務器服務器 服務器是在網絡環境中提供計算能力并運行軟件應用程序的特定 IT 設備,內部結構復雜,應用場景十分廣泛。AI 服務器分為訓練和推理兩種,訓練對芯片算力要求更高,推理對算力的要求偏低推理對算力的要求偏低;推理負載占比有望推理負載占比有望持續提升。持續提升。AI 服務器目前在服務器當中出貨量占比小,2022 年全球 AI 服務器出貨量約占整體服務器比重 1%,約為 14.5 萬臺,有望持續增長。8/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 AI 服務器是推理算力的主要載體,尤其是在云端推
15、理場景中,服務器的性能直接影響推理效率。中國AI 服務器水平位于世界前列,相關企業如寶德、華鯤振宇、長江計算等都在基于昇騰芯片推出 AI 服務器產品,助力國內 AI 推理算力的快速發展。3.云計算平臺云計算平臺 國產大模型算法創新+開源生態有望構建一條聯合創新之路,推動中國 AI 領先。繼 OpenAI 閉源后,大模型廠商呈現閉源趨勢,直至 DeepSeek 將高性價比的 R1 模型開源。作為國內領先互聯網大廠的核心團隊,字節豆包團隊的 VideoWorld 開源有望進一步促進國內外大模型行業的開源進程,為相關開發者提供了來自中國最先進的技術資源與創新基石。未來,如果大模型能夠形成繁榮的開源生
16、態,AI 基礎模型有望加快創新,AI 應用部署門檻降低以及成本帶動應用繁榮,并催化推理算力需求快速增長。云計算平臺為推理算力提供了基礎設施支持,尤其是在生成式云計算平臺為推理算力提供了基礎設施支持,尤其是在生成式 AI 的應用中,云計算平臺通過提供彈性的應用中,云計算平臺通過提供彈性算力資源,幫助企業在推理階段降低成本并提升效率。算力資源,幫助企業在推理階段降低成本并提升效率。華為與 SiliconFlow 的合作推出的DeepSeekR1/V3 推理服務就是一個典型案例,表明軟件企業在推理端的合作趨勢正在強化。4.應用領域應用領域 推理算力的應用場景廣泛,隨著生成式 AI 的快速發展,推理算
17、力在多個行業中發揮了重要作用。以下是推理算力的主要應用領域:(1)科學研究科學研究 推理算力的提升可以幫助科研人員在物理、化學和生物學等領域進行復雜的數據分析和模型構建,輔助科研工作超越人類專家的水平。9/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告(2)編程和軟件開發編程和軟件開發 生成式 AI 的推理能力大幅提升,尤其是在 Claude3.5 和 OpenAIo1 模型的應用中,推理能力的增強直接提升了編程效率,降低了專業程序工具的使用門檻,未來可能會出現大眾級的代碼工具。(3)辦公軟件辦公軟件 AI 推理能力的提升使得辦公軟件能夠更好地滿足用戶的需求,
18、尤其是在圖像生成、文檔處理等方面,推理算力的應用將進一步提升辦公軟件的滲透率。(4)醫療健康醫療健康 推理算力在醫療領域的應用主要體現在輔助診斷和藥物研發等方面。隨著生成式 AI 推理能力的提升,醫生的工作流將變得更加便捷,推理算力的需求也將持續增長。(5)金融金融 金融行業中,推理算力主要用于風險評估、投資決策等場景,這些場景需要大量的邏輯推理和數學運算。隨著 AI 大模型在金融領域的應用逐漸成熟,推理算力的需求將進一步釋放。五、五、國內國內推理算力相關公司推理算力相關公司 在推理算力領域,國內多家公司都在積極布局,以下是一些值得關注的相關公司:1.寒武紀寒武紀 寒武紀是國內智算芯片領域的龍
19、頭企業,能提供完善的云邊端系列化智能芯片和基礎開發軟件套件產品,具有云邊端一體、軟硬件協同、訓練推理融合、具備統一生態的特點。公司與服務器廠商和產業公司合作,為互聯網、金融、交通、能源、電力和制造等領域的復雜 AI 應用場景提供充裕算力。公司的產品包括云端智能芯片、加速卡及訓練整機,邊緣智能芯片及加速卡,終端智能處理器 IP 等。董事長兼總經理陳天石從研究生開始便投入芯片研發工作,是全世界最早探索專用 AI 芯片的少數科研人員之一。自成立以來,公司一直深耕于專用 AI 芯片領域,在發展中進行了大量處理器指令集與微架構的創新,并對開發者套件和開發者生態進行了不斷迭代完善,使得公司已經成長為國產智
20、算芯片的核心供應商。10/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 公司主要產品包括云端智能芯片、加速卡、訓練整機,邊緣智能芯片、加速卡,以及終端智能芯片 IP,其中云端智能訓練整機和集群是公司收入的絕大部分來源。云端智能芯片產品最新產品為其思元 590 芯片及相關板卡和整機,單卡算力超過英偉達 A100,集群算力接近 A100 水平。同時在售的包括思元 370系列產品,包括 MLU370-X8,X4,S8,S4 等智能加速卡產品。公司背靠中科院計算所,核心團隊核心研發人員多來自于著名高?;蛘呖蒲性核?。2021 年至 2023 年,公司的研發開支分別為
21、11.36 億,15.23 億,11.18 億,處于 A 股芯片上市公司的前列。同時,公司通過股權激勵計劃綁定核心管理層,激發全員的工作積極性。2024 年,公司思元 590 產品在互聯網大廠廣泛送樣測試,成績表現不俗。據公開資料,單卡性能超過英偉達 A100,互聯集群性能可以達到英偉達 A100 的 80%,某些場景可以達到甚至超過 A100。預計下一代產品將采用類似 Blackwell 的雙芯結構,性能對標英偉達 H100,預計相比思元 590 有翻倍以上的性能提升。11/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 自 2021 年思元 370 發布以
22、來,公司高算力產品已經在包括阿里,百度,字節,騰訊等互聯網大廠受到廣泛測試和批量采用。思元 590 作為性能更強,開發者工具更完善的產品,24 年下半年通過互聯網大客戶的測試,相關產品有望在 25 年迎來加速出貨。據不完全統計,包括字節、阿里、騰訊在內的互聯網廠商有數十萬臺的 AI 服務器需求,短中期市場空間可達千億元人民幣。2.華為昇騰華為昇騰 昇騰計算是基于華為昇騰系列(HUAWEI Ascend)AI 處理器和基礎軟件構建 Atlas 人工智能計算解決方案,包括 Atlas 系列模塊、板卡、小站、服務器、集群等豐富的產品形態,打造面向“端、邊、云”的全場景 AI 基礎設施方案,覆蓋深度學
23、習領域推理和訓練全流程。12/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 昇騰為客戶打造場景化解決方案。1)國家區域人工智能計算中心。方案主要用于人工智能深度學習模型開發、模型訓練和模型推理場景,以 AI 算力集群賦能產業集群,推動人工智能產業集約集聚發展。2)城市人工智能中樞。依托 ICT 技術與知識創新融合,推動城市的感知、認知、決策和執行實現深度協同,打造面向城市的智能應用和場景化服務。3)通用訓練服務器場景。通用訓練服務器場景主要面向互聯網、金融、運營商等行業,提供 Atlas800、Atlas300TPro 等通用訓練服務產品。4)視頻與圖像分析
24、。華為視頻與圖像分析解決方案聚焦中心和邊緣推理,面向各行業環境和事件實時智能分析場景提供多款Atlas 系列產品。昇騰計算產業是基于昇騰系列(HUAWEI Ascend)處理器和基礎軟件構建的全棧 AI 計算基礎設施、行業應用及服務,包括昇騰系列處理器、系列硬件、CANN(Compute Architecture for Neural Networks,異構計算架構)、AI 計算框架、應用使能、開發工具鏈、管理運維工具、行業應用及服務等全產業鏈。13/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 昇騰為各行各業打造場景化解決方案,不斷擴大合作縱深,拓寬雙方合
25、作領域。3.中科曙光中科曙光 中科曙光:背靠中科院,核心信息基礎設施領軍企業。中科曙光隸屬于北京中科算源資產管理有限公司,實控人為中國科學院計算技術研究所。隨著 1990 年 863 計劃的推出,公司于 1993 年研發出國內首臺全對稱共享存儲多處理機系統曙光一號,1996 年曙光公司成立并發布計算機系統曙光 1000,2014 年中科曙光在上交所上市。目前,公司脫胎于高性能計算機產品,在高端計算、存儲、安全和數據中心等領域積累了深厚的技術實力和市場份額,成長為全產業的高端計算服務生態。14/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 中科曙光主營業務主要
26、分為兩部分:IT 設備(高性能計算機、存儲產品)和圍繞高性能計算機的軟件集成、系統開發及技術服務。高性能服務器:從制造商轉型向解決方案供應商,減少海外制裁風險,并提高毛利率。軟件集成、系統開發及技術服務:滿足差異化需求,適配各行業特質。適配差異化場景和功能,中科曙光提供 3 類通用服務器解決方案。通用服務器針對適用的場景和功能有多個產品,主要有機架式服務器、高密度服務器和核心應用服務器三種;機架式服務器種類多樣、計算性能強勁,可滿足云計算、大數據分析、機器學習等多個使用場景;高密度服務器采用集中式供電、集中式管理、共享散熱模式,是大企業、集團、政府、能源、云計算、互聯網等數據中心建設的理想選擇
27、;15/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 核心應用服務器的特點是具備強大性能及靈活的 IO 擴展能力,可以兼容多種擴展卡和安全設備,可支撐文件服務器,備份服務器,計算單元,辦公系統,適用于政府、金融、能源等行業使用需求。兼具適配性和領先性能,中科曙光服務器口碑領先。1)服務器具備廣泛適配性,可與多種類型的 CPU、GPU、MIC 計算資源進行適配,比如,機架式服務器的 CPU 廠商分別有 Intel、AMD 和龍芯,高密度服務器的 CPU 廠商為 Intel,核心應用服務器的 CPU 廠商為龍芯。2)公司的通用服務器具有領先的計算密度和節能性,產
28、品整合高速網絡和存儲技術,可實現超大規模線性擴展,具有節能高效、安全穩定、高度集成等特點。目前公司旗下子公司與參控股公司已全方位覆蓋了從上游芯片、服務器硬件、IO 存儲到中游云計算平臺、大數據平臺、算力服務平臺以及下游云服務的全計算業務生態體系,各業務板塊間可發揮協同效應。海光 CPU 產品:產品性能先進,比肩國際同類型主流高端處理器水平,在國內處于領先地位。對海光通用處理器的微體系結構進行持續研發和優化,不斷提升高端處理器性能,公司研發出的第一代、第二代 CPU,達到了國際上同類型主流高端處理器的水平,在國內處于領先地位。對比 Intel 在 2020 年與海光 7825 同期 6 款至強鉑
29、金系列產品,海光 7285CPU 的 SPECCPU2017 的實測性能與國際領先芯片設計企業 Intel 同期發布的主流處理器產品的實測性能相當。16/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 海光 DCU 產品:商業化應用部署中,國際同類型高端產品水平?;凇邦?CUDA”環境研發,深算一號產品性能達到國際上同類型高端產品的水平;2023 年三季度發布的深算二號,實現了在大數據、人工智能、商業計算等領域的商用,該產品具有全精度浮點數據和各種常見整型數據計算能力,性能相對于深算一號性能提升 100%以上。4.首都在線首都在線 公司主要為客戶提供全球云網
30、融合服務、IDC 數據中心服務以及渲染產品及解決方案,涉及 AI 人工智能、元宇宙、車聯網、游戲、音視頻、電商等多個行業。17/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 全球云網融合服務:將全球通訊運營商的網絡資源和成熟軟硬件廠商的計算、存儲等設備進行集成,通過虛擬化、分布式計算等核心技術對 IT 實體資源進行虛擬化與產品化封裝,為客戶提供計算(云主機、裸金屬)、網絡(大帶寬、專線、全球加速、多云互聯)、IDC 數據中心、存儲和邊緣計算服務,客戶可實時獲取所需的彈性計算、存儲與網絡服務。IDC 數據中心服務:根據客戶的特定需求部署核心數據中心、建立內容分
31、發網絡(CDN)節點和搭建節點間數據同步互聯網絡,為客戶提供全球范圍內的數據中心、云網一體和創新技術的產品解決方案,同時提供本地化的 IDC 增值服務。渲染產品及解決方案:基于異構算力平臺、專業級顯卡與邊緣節點布局,為客戶提供存算網一體化的大規?;A算力平臺,針對各行業的各個環節提供高質量、低成本的解決方案。目前已經形成 GPU 服務器、GPU 云主機、GPU 云桌面等系列產品。18/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 首都在線作為全球云網一體化云計算服務商,面向全球客戶提供優質的云計算、大數據、人工智能等技首都在線作為全球云網一體化云計算服務商,
32、面向全球客戶提供優質的云計算、大數據、人工智能等技術產品與服務,術產品與服務,打造貼近客戶業務場景的行業解決方案,致力于以云服務賦能數字經濟,成為與客戶共同應對變化的伙伴。公司的發展歷程可分為三個階段:1)業務初創階段:公司與 2005 年在北京市正式成立,在 2009 年開始由傳統 IDC 服務廠商轉型為云計算提供商。2011 年,成功推出第一代“云主機”,布局“公有云”業務。2)積累開拓階段:2013 年,公司與 IBM 簽署公有云長期戰略合作協議,并宣布第四代云計算上線。2014 年,公司第二次戰略轉型開始布局海外市場,主要的客戶包括游戲、音視頻、電商。2017 年,公司形成了全球化的環
33、網服務,實現全球云平臺的互聯互通。2020 年,公司正式在深交所 A 股創業板上市。3)高速發展階段:2022 年,公司通過與英偉達、燧原等優秀公司合作,借助底層英偉達 GPU 算力儲備,以 AI 云為抓手,開啟第二波成長曲線。2023 年,公司將抓住機遇由全球云計算服務商向全球新型算力服務提供商轉型。19/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 5.浪潮信息浪潮信息 公司是全球領先的 IT 基礎設施產品、方案和服務提供商,為客戶提供云計算、大數據、人工智能等各類創新 IT 產品和解決方案。分板塊來看,在算法方面,公司推出的企業大模型開發平臺 EPAI
34、(Enterprise Platform of AI),支持包括 CPU、GPU 和各類加速卡在內的 20+多元計算芯片,助力企業輕松跨越 AI 應用開發與部署門檻。在算力方面,公司推出的全新一代開放加速計算服務器NF5698G7、穩定高效的多元算力平臺等多款 AI 服務器產品,都具有多元開放、綠色節能的共性;新一代模塊式液冷智算中心,覆蓋了不同的計算節點,兼容了通用 CPU、GPU、OAM,可以給客戶提供數據中心部署實施完整的液冷解決方案,實現 PUE 低至 1.1。公司與 Intel 聯合發布了 AI 通用服務器,業界首次實現服務器基于通用處理器支持千億參數大模型的運行,能夠靈活滿足基于大
35、模型的 AI 應用及云計算、數據庫等通用場景。在數據基礎設施層面,公司發布了生成式 AI 存儲解決方案,滿足大模型應用在存儲性能和存儲容量方面的嚴苛需求,幫助用戶加速大模型的數據歸集、提升模型訓練效率、簡化海量異構數據的管理,實現面向大模型應用的全面優化,助力用戶構筑人工智能時代最佳數據存儲底座。在互聯方面,公司推出的超級 AI 以太網交換機 X400,是國內首款基于 NVIDIASpectrum-X 平臺打造,具備高吞吐、低時延、高可靠等優勢,針對 AI 大模型場景進行 RoCE 優化,比傳統的 RoCE 網絡性能提升了 1.6 倍,為大模型訓練和推理提供領先的 AI 網絡性能。智能化進程加
36、速,源 2.0-M32 持續耕耘算力創新:公司一直站在大模型算法創新的前沿。去年 11 月發布“源 2.0”大模型,今年 5 月又發布了“源 2.0-M32”大模型。源 2.0-M32 是浪潮信息在大模型領域持續耕耘的最新探索成果,通過在算法、數據、算力等方面的全面創新,M32 不僅可以提供與業界領先開源大模型相當的性能,更可以大幅降低大模型所需算力消耗。大幅提升的模算效率將為企業開發應用生成式 AI 提供模型高性能、算力低門檻的高效路徑。M32 開源大模型配合企業大模型開發平臺 EPAI(Enterprise Platform of AI),將助力企業實現更快的技術迭代與高效的應用落地,為人
37、工智能產業的發展提供堅實的底座和成長的土壤,加速產業智能化進程。六、六、推理算力的未來發展趨勢推理算力的未來發展趨勢 隨著 AI 技術的不斷進步,推理算力的需求將在未來幾年內迎來爆發式增長。以下是推理算力的未來發展趨勢:1.推理算力需求將遠超訓練算力推理算力需求將遠超訓練算力 AI 技術的應用場景正在從訓練側向推理側轉移,推理算力的需求將在未來幾年內遠超訓練算力。根據IDC 的預測,到 2026 年,中國智能算力規模將達到每秒十萬億億次浮點運算(ZFLOPS),年復合增長率為 52.3%。這一增長主要來自于推理端的需求釋放,尤其是在大模型的應用中,推理算力的需求已經逐步超過訓練算力。2.國產推
38、理芯片有望占據市場國產推理芯片有望占據市場 隨著美國對高端芯片的出口限制逐步加大,國產 AI 芯片廠商正在加快追趕步伐。根據相關預測,未來3-5 年內,高性價比的國產 AI 芯片有望占據市場,尤其是在推理端的應用中,國產芯片的表現將逐步提升。20/21 2025 年年 2 月月 17 日日 行業行業|深度深度|研究報告研究報告 3.推理芯片市場規模潛力巨大推理芯片市場規模潛力巨大 隨著生成式 AI 的廣泛應用,推理芯片的需求預計將大幅增長。根據相關測算,2025 年生成式 AI 大規模商用后,推理芯片的需求可能達到 600 億美元左右。4.推理算力的多樣化發展推理算力的多樣化發展 推理芯片的選
39、擇不僅僅依賴于模型的大小,更重要的是任務的本質。因此,未來的推理芯片市場將更加多元化,除了 GPU 外,CPU、FPGA、ASIC 等芯片類型也將根據不同的應用場景發揮重要作用。推理算力作為 AI 技術應用的核心環節,正在迎來爆發式增長。隨著生成式 AI 的快速發展,推理算力的需求將逐步超過訓練算力,尤其是在科學研究、編程、辦公軟件、醫療健康和金融等領域,推理算力的應用場景將更加廣泛。未來,隨著國產 AI 芯片廠商的逐步崛起,推理算力的市場格局將發生深刻變化,國產芯片有望在 3-5 年內占據更大的市場份額。此外,推理芯片的市場規模潛力巨大,預計到 2025 年,推理芯片的需求將達到 600 億
40、美元左右。七七、參考研報參考研報 1.西部證券-計算機行業人工智能系列報告(四)/算力系列報告(一):推理芯片,生成式 AI 驅動,或迎來重大機遇-24/05/09 2.申萬宏源-計算機行業周報:Agent 時代到來!全面梳理工業軟件并購機會!-24/10/26-景順長城-計算機行業重塑與創造:2024Al 洞察報告-24/03/01 3.華金證券-通信行業分析報告:AI 景氣賽道,國產全鏈受益-24/06/16 4.華西證券-計算機行業周觀點:AI 應用加速落地,推理算力井噴在即-24/12/28 5.中信建投-TMT 行業深度報告:算力大時代,AI 算力產業鏈全景梳理-23/06/14 6
41、.慧博智能投研-華為昇騰深度:驅動因素、框架研究、產業生態及相關公司深度梳理-23/09/18 7.華泰證券-科技行業專題研究:英偉達超預期對算力產業鏈的影響-23/05/29 8.首創證券-計算機行業深度報告:AI 崛起,算力先行-23/11/23 9.浙商證券-計算機行業大模型點評:開源的多模態模型有望催化推理算力,并為智駕模型提供借鑒-25/02/10 10.中泰證券-中科曙光-603019-自主高性能計算機領軍,通服+AI+算力互聯網三位一體發展 11.華安證券-首都在線-300846-賦能 AIGC 新基建,驅動未來新機遇 12.華鑫證券-浪潮信息-000977-公司動態研究報告:源 2.0M32 持續耕耘算力創新,智能化進程加速 13.中金公司-浪潮信息-000977-業績增速亮眼,服務器龍頭受益算力需求高景氣 14.光大證券-AI 行業跟蹤報告第 54 期:比亞迪智駕和華為昇騰驅動強瑞技術快速成長 15.第一上海-寒武紀-688256-技術立足,算力中軍,充分受益 AI 浪潮 16.民生證券-計算機行業周報:科技內需為王,從寒武紀到昇騰 21/21 2025 年年 2 月月 17 日日行業行業|深度深度|研究報告研究報告 免責聲明:以上內容僅供學習交流,不構成投資建議。