《計算機行業算力框架報告:擁抱AI算力加速國產化時代-231219(42頁).pdf》由會員分享,可在線閱讀,更多相關《計算機行業算力框架報告:擁抱AI算力加速國產化時代-231219(42頁).pdf(42頁珍藏版)》請在三個皮匠報告上搜索。
1、算力框架報告擁抱AI算力加速國產化時代行業評級:看好2023年12月1證券研究報告分析師劉雯蜀分析師李佩京郵箱郵箱證書編號S1230523020002證書編號S1230522060001投資要點2AI算力有望實現加速國產化。我們復盤了超算、通用算力的發展歷史,認為國產AI算力有望復刻發展歷程,從“可用”邁向“好用”,并且在當前國際局勢下,AI算力國產化進程有望加速,具體看2024年將為“客戶初選適配年”,2025年將為“客戶主動采購年”,2026年國產AI芯片有望成為主導。普通云計算:已從“可用”邁向“好用”,27年國產服務器市場空間千億。我們預計2024年國產服務器CPU市場規模有望達到19
2、8億(同比+35.6%),2027年有望達到333億(24-27年CAGR+19%);2024年國產服務器市場規模有望達到594億(同比+35.6%),2027年有望達到1000億(24-27年CAGR+19%);根據Bernstein,2022年國產芯片服務器占比達到25%(ARM占15%,其余占10%);2023年下半年開始,運營商和金融客戶陸續進行國產服務器大規模集采,其中Arm服務器在以運營商和銀行為代表的行業信創采購大單中占比持續提升,因而我們認為未來信創服務器將呈現華為、海光為主的格局。超算:受限較早,超算云服務遠期空間有望達到700億。我國超算CPU已在8年前受限并開啟了自強之路
3、,根據沙利文,2016-2021年中國超算服務市場規模CAGR為24.7%,預計2021-2025年CAGR為24.1%,2025年中國超算服務市場規模將達到466億元,為了促進國產超算算力的上架率,2023年科技部啟動了超算互聯網建設工作,預計中國超算云服務市場規模遠期有望達到700億,其中630億為企業主導,未來商用企業市場潛力巨大。智算:開始受限,國產化進程有望加速。美國從2022年開始針對我國高端AI芯片生產制造、人員、供應等多環節持續加碼,我國算力新基建等支持政策不斷推出,我們預計2024年國內AI算力總需求有望達到211.50EFlops,其中國產算力需求為98.24EFlops,
4、國產化比例為46.45%,對應需要昇騰910為30.70萬張,市場規模307億,AI服務器3.84萬臺,市場規模409.33億。相關標的(1)算力芯片:海光信息、寒武紀、景嘉微;(2)服務器:中科曙光、浪潮信息、紫光股份、華勤技術、四川長虹、高新發展、神州數碼、中國長城、烽火通信、拓維信息、廣電運通、特發信息、同方股份、軟通動力、卓易信息等;(3)軟件生態及大模型應用:軟通動力、中軟國際、北路智控、能科科技、航天宏圖、中科星圖、超圖軟件等;風險提示國際形勢變化、供應鏈安全風險、芯片設計迭代風險、競爭加劇風險、下游客戶總體需求或節奏不及預期風險、政策風險等wWeWeVbWeYbUmOpPpOtN
5、mM6MaO6MtRqQpNsRiNrQmOkPtRpPaQpPzQMYsPvMNZrNrP目錄C O N T E N T S從CPU到GPU,核心技術當自強010203普通計算:從“可用”到“好用”04超算:受限較早,徐徐前行智算:限制加速,國產化時點提前到來05風險提示從CPU到GPU,核心技術當自強01Partone4算力全面國產化時代已提前到來5算力是數字經濟運行和發展的基石和前提。IDC發布的2021-2022全球計算力指數報告指出,算力對經濟增長的拉動具有長期性和倍增效應:計算力指數平均每提高1點,數字經濟和GDP將分別增長3.5和1.8,當一個國家的計算力指數達到40分、60分時
6、,計算力指數每提升1點,其對于GDP增長的推動力將分別增加1.5倍和3.0倍;算力全面國產化時代已提前到來。算力的基本載體是服務器,服務器的核心部件為CPU和類GPU等計算芯片,經過多年的技術積累和市場打磨,我國國產CPU已從“可用”進入“好用”階段,以運營商和金融為代表的大客戶正有序進行信創服務器的集采和規?;瘧?;隨著新一輪AI算力升級的浪潮的興起以及國際局勢的迅速變化,我們認為AI算力芯片的國產化時點已提前到來。算力與經濟增長模型計算力指數與GDP回歸分析趨勢資料來源:IDC、51CTO、清華大學全球產業研究院、浙商證券研究所國內算力產業鏈的三大體系在國內,算力產業鏈整體屬于生產制造業,
7、經過多年發展,上下游廠商往往存在較為密切的股權/業務關系,可分為如下體系:中科院系以海光為核心芯片,以中科曙光及ODM為主要整機廠的x86信創服務器體系,兼容性好;華為系以鯤鵬+昇騰為核心芯片,以華為硬件生態合作伙伴(四川長虹、高新發展、寶德、超聚變、神州數碼、烽火通信、拓維信息等)為主要整機廠的Arm信創服務器體系,自主可控程度更高;中電子系以飛騰為核心芯片,以中國長城為主要整機廠的Arm信創服務器體系,自主可控程度高;整體上看,我國正在逐步完善產業鏈和生態,以應對日趨復雜的國際局勢。資料來源:億歐智庫、資產信息網、千際投行、IDC、wind、中國芯應用創新高峰論壇、企業財報公告、企業官網、
8、浙商證券研究所6體系類別關鍵芯片體系內主要服務器整機廠商主要下游客戶主要海外競品CPU華為鯤鵬四川長虹、高新發展、寶德、超聚變、神州數碼、烽火通信、拓維信息、中國長城、廣電運通、東華軟件、同方股份、特發信息、百信信息運營商和金融等行業客戶Intel x86服務器,主要用于非AI的運算和存儲中科院海光中科曙光,紫光股份1、黨政客戶;2、運營商和金融等行業客戶;中電子飛騰中國長城黨政客戶-龍芯、申威、兆芯-黨政等特殊領域體系類別關鍵芯片體系內主要服務器整機廠商主要下游客戶主要海外競品類GPU華為昇騰四川長虹、高新發展、寶德、超聚變、神州數碼、烽火通信、拓維信息、中國長城、廣電運通、東華軟件、同方股
9、份、特發信息、百信信息1、政府智算中心;2、大模型廠商、運營商、金融等央國企客戶或受限客戶;NVIDIA H100 服務器,主要用于大模型訓練和推理中科院海光中科曙光1、政府算力中心;2、科研院所、央國企等;-景嘉微、寒武紀、壁仞、沐曦、燧源、天數智芯、摩爾線程等黨政等特定領域CPU:從“可用”到“好用”02Partone7國產CPU技術路線正逐步趨于收斂8CPU根據架構主要分為x86及Arm,技術路線正逐步收斂于華為和海光兩大體系。芯片的發展更看重能否形成更加完善的生態閉環,要求上游供應相對充足、自身性能及價格相比國外芯片具備一定的性價比、下游生態覆蓋面廣且最好是主流生態,綜合上述因素來看,
10、未來信創及商用CPU技術路線將逐步向華為ARM體系及海光X86體系收斂。資料來源:wind、億歐智庫、政府采購網、浙商證券研究所強弱自主化程度指令集授權+自研指令集授權擁有100%源代碼,按授權處理器的架構和指令集自行編寫代碼、設計芯片IP授權指令集體系研發單位產品劣勢產品優勢CPU代表產品龍芯1號龍芯2號龍芯3號鯤鵬920S2500D2000FT-2000A/2Hygon C86-7285ZX-C+系列ZX-C 系列KX-6000系列KH-30000系列國產化程度最高的MIPS架構芯片多核架構支撐算力,ARM服務器芯片中性能最佳高性能、低功耗,服務器優勢顯著,有內嵌安全模塊高效、兼容、安全,
11、整機優勢顯著兼容性強,性能和應用生態上具有較強的優勢僅低端服務器芯片,MIPS指令集被美國限制兼容性和生態需要進一步打造兼容性和生態需要進一步打造未來技術持續更新需要時間信創市場份額相對較小中科院計算所華為飛騰天津海光上海兆芯MIPSARMARMx86x86(VIA)2027年國產PC市場規模有望達到547億9資料來源:公開資料整理測算、浙商證券研究所,數據存在四舍五入的情況我們預計27年國產PC市場空間有望達到547億。根據我們信創框架報告測算,我們預計2024年國產PC CPU市場規模有望達到38億(同比+50%),2027年有望達到87億(24-27年CAGR+19%);2024年國產P
12、C市場規模有望達到239億(同比+50%),2027年有望達到547億(24-27年CAGR+32%)。國產PC及CPU市場規模(億元、%)國產服務器市場規模測算2023E2024E2025E2026E2027E23-27合計PC CPU總存量(萬顆)63046425654966476747平均每年PC CPU增量(萬顆)12611285131013291349假設:當年PC CPU采購的國產化率(%)25%37%52%66%81%當年國產PC CPU出貨量(萬顆)31847767888310933449單價(萬元/顆)0.080.080.080.080.08當年國產PC CPU市場規模(億元
13、)25 38 54 71 87 276 yoy50%42%30%24%PC總存量(萬臺)63046425654966476747平均每年PC增量(萬臺)12611285131013291349假設:當年PC采購的國產化率(%)25%37%52%66%81%當年國產PC出貨量(萬臺)31847767888310933449單價(萬元/臺)0.50.50.50.50.5當年國產PC市場規模(億元)159 239 339 441 547 1725 yoy50%42%30%24%0%10%20%30%40%50%60%01002003004005006002023E2024E2025E2026E202
14、7E當年國產PC CPU市場規模(億元)當年國產PC市場規模(億元)yoy2027年國產服務器市場規模有望達到千億10資料來源:公開資料整理測算、半導體產業縱橫、Counterpoint、Bernstein、浙商證券研究所,數據存在四舍五入的情況2022年服務器芯片國產化率達到25%。按照Counterpoint,2022年全球服務器芯片市場中X86占91%、ARM占6%、其它芯片占3%;根據Bernstein,目前中國市場服務器中ARM占比約15%,其它國產CPU(龍芯、海光、兆芯、申威等)占比約10%,合計國產芯片服務器占比達到25%;我們預計27年國產服務器市場空間有望達到千億。根據我們
15、信創框架報告測算,我們預計2024年國產服務器CPU市場規模有望達到198億(同比+36%),2027年有望達到333億(24-27年CAGR+19%);2024年國產服務器市場規模有望達到594億(同比+36%),2027年有望達到1000億(24-27年CAGR+19%)。國產服務器及CPU市場規模(億元、%)國產服務器市場規模測算2023E2024E2025E2026E2027E23-27合計服務器CPU總存量(萬顆)195919912,0242,0492,075平均每年服務器CPU增量(萬顆)392398405410415假設:當年服務器CPU采購的國產化率(%)37%50%62%73
16、%80%當年國產服務器CPU出貨量(萬顆)1461982513013331229假設:國產CPU單價(萬元/顆)11111當年國產服務器CPU市場規模(億元)146 198 251 301 333 1229 yoy46%36%27%20%11%服務器總存量(萬臺)979995101210251037平均每年服務器增量(萬臺)196199202205207假設:當年PC采購的國產化率(%)37%50%62%73%80%當年國產服務器出貨量(萬臺)7399125150167614假設:國產服務器單價(萬元/臺)66666當年國產服務器市場規模(億元)43859475290210003686yoy4
17、6%36%27%20%11%0%5%10%15%20%25%30%35%40%02004006008001,0001,2002023E2024E2025E2026E2027E當年國產服務器CPU市場規模(億元)當年國產服務器市場規模(億元)yoy以運營商和金融為代表的行業客戶已開始大規模集采國產服務器1123年下半年開始,運營商和金融客戶陸續進行國產服務器大規模集采,我們預計未來能源電力、制造業、醫療、教育等行業的央國企客戶信創服務器集采也有望逐步開展;供應上看,Arm服務器在以運營商和銀行為代表的行業信創采購大單中占比持續提升,如中信銀行65億訂單中Arm芯片服務器約占服務器采購金額的3/4
18、,我們預計未來Arm芯片服務器的份額將進一步提升。2021年x86服務器的主要下游客戶構成互聯網,38%政府,16%運營商,13%金融,7%制造業,6%服務,5%教育,4%交通,3%公共事業,2%其他,6%普通服務器集采情況資料來源:億歐智庫、資產信息網、千際投行、IDC、wind、中國芯應用創新高峰論壇、工商銀行、中信銀行、114通信網、浙商證券研究所ARM:華為鯤鵬CPU主打高性能和低功耗12資料來源:鯤鵬社區、華為海思、智東西、華為、浙商證券研究所鯤鵬920是華為自研的面向數據中心的核心CPU,主打高性能和低功耗?;贏RM v8.2架構,由華為公司自主設計完成,主頻可達2.6GHz,單
19、芯片可支持64核,支持8通道DDR4、100G RoCE以太網卡,具備PCle4.0及CCIX接口,可提供640Gbps總帶寬,通過優化分支預測算法、提升運算單元數量、改進內存子系統架構等一系列微架構設計,大幅提高處理器性能,SPECint Benchmark評分超過930,超出業界標桿25%。鯤鵬CPU技術演進圖鯤鵬920主打高性能和低功耗ARM:飛騰CPU可擴展性、安全性強飛騰CPU兼具高可擴展、高性能、高安全、高可靠、高能效五大核心能力。2020年7月,飛騰正式發布了新一代可擴展多路服務器芯片騰云S2500系列,采用16nm工藝,64核架構,8路直連可達512核,與上代FT-2000+相
20、比增加了4個直連接口,總帶寬800Gbps,支持2路、4路和8路直連,可以形成128核到512核的計算機系統;根據芯智訊,飛騰新一代高性能處理器內核FTC870已經研發完成,并且性能達到了國際先進水平。FT870內核的主頻可達3GHz,CINT2017得分為5.73672,CFP2017得分為8.42688,整體性能相對于上一代的FTC860提升了約20%,同時也超越了Arm面向服務器市場的Neoverse N1內核,達到了與Neoverse N2相當的水平,并且CFP2017的得分超過了Neoverse N2。13飛騰各系列路線圖資料來源:飛騰、芯智訊、浙商證券研究所新一代”870”高性能處
21、理器核,性能追趕國際先進水平點擊此處添加標題添加標題點擊此處添加標題點擊此處添加標題點擊此處添加標題點擊此處添加標題點擊此處添加標題添加標題點擊此處添加標題點擊此處添加標題添加標題點擊此處添加標題添加標題飛騰騰云S系列高性能服務器CPU應用于計算和存儲服務器、數據中心等飛騰騰銳D系列高效能桌面CPU應用于桌面整機、一體機、便攜機等飛騰騰瓏E系列高端嵌入式CPU應用于嵌入式設備信息系統、工業控制等飛騰套片X系列與騰云S、騰銳D等處理器搭配構成全國產化方案2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 FT-1500A/16FT-2000+/64
22、S2500FT-1500A/4FT-2000/4D2000D3000FT-2000A/2E2000X100S5000添加標題6.848.196.127.66088.658.426887.1110.1712.8312.1914.164.925.125.25.21525.735.736725.86086.637.497.658.140246810121416FTC860,3GHzGraviton3(V1),2.6GHzQ80-33(N1),3.3GHzFTC861,3GHzXeon8380(Sunny Cove),4.3GHzFTC870,3GHzARM N2,3GHzEPYC7443(ZEN3)
23、,4GHZM1 Max(Firestorm),3.2GHzRyzen9 5950X(ZEN3),4.9GHzi9-12900K(Golden Cove),5.2GHzCINT2017CFP2017FTC870 相對于FTC860提升約20%FTC870單核性能超越ARM N1,和ARM N2相當X86:海光CPU兼具性能和兼容性14海光基于AMD授權的x86指令集研制CPU,兼具性能和兼容性。以海光7285為例,相關參數為32核,64個超線程,2.0GHz主頻,DDR4內存,內存通道數8,最高內存頻率2666MHz,PCIe通道數128;海光使用先進的處理器微結構和緩存層次結構,改進了分支預測
24、算法,使得每個時鐘周期執行的指令數得到顯著提高;依托先進的 SoC 架構和片上網絡,集成了更多處理器核心;采用先進的工藝制程和物理設計方法,實現了處理器高主頻設計,使海光 CPU 產品具有優異的產品性能,目前公司多款產品已在核心數、支持內存、內存通道數、PCIe通道數等方面處于國內前列,比肩全球主流產品;海光三號系列芯片是公司目前的主力產品。最高規格具備32核心64線程,擁有多達128條PCle4.0通道,支持內存頻率提升至3200MHZ。相比上一代產品,海光三號的整體實測性能提升了約45%。在SOC設計、I/O帶寬、取指單元、功能模塊、防御機制等方面,海光三號均做了不同程度的優化,綜合性能大
25、幅躍升。海光四號有望采用全新自研微架構,有望對標Intel最新代頂級型號處理器的性能水平。IntelAMD海光兆芯華為海思飛騰龍芯申威品牌Xeon6354EPYC7542海光7285開勝KH-30000鯤鵬920-7260S2500企業級3C5000L申威1621指令集x86x86x86x86ARMARMLoongArchSW_64核心數183232864641616超線程366464不支持不支持不支持不支持不支持主頻3.0GHz2.9GHz2.0GHz3.0GHz2.6GHz2.2GHz2.2GHz2.0GHz內存類型DDR4DDR4DDR4DDR4DDR4DDR4DDR4DDR3內存通道數
26、88828848最高內存頻率3200MHz3200MHz2666MHz2666 MHz2933MHz3200MHz3200MHz2133MHzPCIe通道數641281281640173216產品定位服務器CPU 服務器CPU 服務器CPU 服務器CPU 服務器CPU 服務器CPU 服務器CPU 服務器CPU海光7285性能參數對比各主流CPU性能參數對比資料來源:海光招股書、公司公告、證券時報、新浪財經、浙商證券研究所產品名稱發布時間4路測試結果雙路測試結果性能差異 (Intel 數據/海光數據-1)Speccpu_INTSpeccpu_FP Speccpu_INTSpeccpu_FP Sp
27、eccpu_INTSpeccpu_FP Intel8380HL(鉑金)2020年第二季度78465739232912.64%6.66%Intel8380H(鉑金)2020年第二季度78465339232712.64%6.01%Intel8376HL(鉑金)2020年第二季度7656413833219.91%4.06%Intel8376H(鉑金)2020年第二季度7566433783228.62%4.38%海光72852020年第一季度-348308-Intel8360HL(鉑金)2020年第三季度690599345300-0.86%-2.76%Intel8360H(鉑金)2020年第三季度68
28、8597344299-1.15%-3.09%LoongArch:龍芯3A6000性能比肩第10代酷睿i3處理器LoongArch龍架構為完全自主設計,與國際主流處理器的設計差距已補齊。第四代微架構LA664突破了國際主流CPU的標配同時多線程(SMT)技術,全面提升了各項指標,首次將4發射提升到6發射,同時在ROB、定點/向量物理寄存器、發射隊列、功能部件、載入/存儲隊列等各項指標上,都實現了50到100的提升,基本補齊了與當今主流處理器在通用處理能力、單核性能、設計能力的差距;3A6000性能與2020年10代酷睿i3-10100處理器相當。首款產品龍芯3A6000采用自主成熟工藝制造,4個
29、物理核心,支持同時多線程技術(SMT2),因此有8個邏輯核心,主頻為2.5GHz,集成安全可信模塊,可提供安全啟動方案和國密(SM2、SM3、SM4等)應用支持;根據芯智訊,龍芯3A6000處理器總體性能與Intel 2020年上市的第10代酷睿i3-10100四核處理器基本相當,下一步爭取使用成熟工藝達到英特爾、AMD 先進工藝 CPU 的性能;龍架構開放授權,打造國際第四大開源生態。在國外,龍架構獲得了國際開源生態編號258,與x86、Arm、RISC-V處于等同的地位,得到了Linux系統內核、GCC/LLVM兩大支柱性編譯器、Rust/Golang/Pascal等傳統與新興編程語言、N
30、odejs/.net等主流應用開發框架等開源社區、開源軟件的快速支持;在國內,首批面向微控制器、嵌入式、終端的龍芯CPU IP核已開放授權,國產操作系統及國內基礎應用已支持龍架構,可以滿足基本的辦公、娛樂需求。15各主流CPU性能參數對比各主流CPU性能參數對比資料來源:龍芯中科、硬件世界、浙商證券研究所超算:受限較早,徐徐前行03Partone16超級計算用于處理極端復雜或數據密集型問題17資料來源:常金鳳,李寧東,江暢.我國超算產業發展研究J.信息通信技術與政策,2022,48(3):64-68.、頭豹研究院、浙商證券研究所超算產業范圍超級計算,又稱高性能計算(HPC),是計算科學的重要前
31、沿分支,指利用并行工作的多臺計算機系統(即超級計算機)的集中式計算資源,處理極端復雜或數據密集型問題,與智算相比,超算要求雙精度計算(FP64),而智算一般要求單精度、半精度計算(FP32、16、8);超算產業呈現典型的政策性特征。由于超算芯片所需技術難度較大,同時下游應用一般以前沿基礎科學研究等非商業化需求為主,因而主要參與者為央國企、科研院所等單位,整體產業鏈發展呈現一定的政策周期性。超算芯片受限較早,我國超算在政策加持下已進入互聯階段18資料來源:前瞻產業研究院、華經產業研究院、路透社、中國新聞網、各地政府官網等、浙商證券研究所超算CPU已在8年前受限。早在2015年4月,美國商務部就拒
32、絕Intel向中國的國家超算廣州中心、長沙中心、天津中心和國防科大出售“至強”芯片用于天河二號系統升級的申請,并將這4所中國機構列入出口管制名單;后續美國不斷加緊對我國超算相關單位的限制,如2019年6月美國商務部依據進出口管理條例對中國超算三巨頭中的“神威”和“曙光”實施制裁,將與此兩者相關的5家中國企業列入“實體清單”,禁止向其提供美國技術及元器件;我國自受限后就開啟了自強之路。2016年“十三五”國家科技創新規劃明確提出要突破超級計算機中央處理器(CPU)架構設計技術,而后2021年的十四五規劃明確提出建設E級和10E級超級計算中心,目前為了促進國產超算算力的上架率,科技部啟動了超算互聯
33、網建設工作,目標建成一體化超算算力網絡和服務平臺,實現算力資源的統籌調度。時間政策文件政策內容2013年上海張江國家自主創新示范區發展規劃綱要(2013-2020年)加強科技基礎設施建設,支持在示范區內建設和完善超級計算中心、生物樣本庫、化合物樣本庫等科技基礎設施。2016年國家創新驅動發展戰略綱要建設超算中心和云計算平臺等數字化基礎設施,形成基于大數據的先進信息網絡支撐體系。2016年“十三五”國家科技創新規劃突破超級計算機中央處理器(CPU)架構設計技術,提升服務器及桌面計算機 CPU、操作系統和數據庫、辦公軟件等的功能、效能和可靠性,攻克智能終端嵌入式 CPU 和操作系統的高性能低功耗等
34、核心關鍵技術。2017年新一代人工智能發展規劃建立人工智能超級計算中心、大規模超級智能計算支撐環境、在線智能教育平臺人在回路”駕駛腦、產業發展復雜性分析與風險評估的智能平臺2019年交通強國建設綱要推動大教據、互聯網、人工智能、區塊鏈、超級計算等新技術與交通行業深度融合2020年發改委首次明確新型基礎設施的范圍首次明確了新型基礎設施的內涵和范圍,提出“新基建”主要包括信息基礎設施(5G、物聯網、人工智能、數據中心等)融合基礎設施(智能交通基礎設施、智慧能源基礎設施等)和創新基礎設施(重大科技基礎設施、科教基礎設施、產業技術創新基礎施等)2020年關于加快新型信息基礎設施建設擴大信息消費的若干政
35、策措施加快新型信息基礎設施建設,加快新一代數據中心布局方面,新建、擴建符合國標A級或T4建設標準的超算中心、大數據中心、云計算中心項目2021年國民經濟和社會發展“十四五”和2035年遠景目標綱要加快構建全國一體化大數據中心體系,強化算力統籌智能調度,建設若干國家樞紐節點和大數據中心集群,建設E級和10E級超級計算中心。聚焦高端芯片、人工智能關鍵算法等關鍵領域,加強通用處理器、云計算系統和軟件核心技術一體化研發。2021年新型數據中心發展三年行動計劃(2021-2023年)到2023年底,全國數據中心機架規模年均增速保持在20%左右,平均利用率力爭提升到60%以上,總算力超過200EFlops
36、,高性能算力占比達到10%。加快高性能、智能計算中心部署,推動CPU、GPU等異構算力提升。2021年“十四五”大數據產業規劃加快構建全國一體化大數據中心體系,推進國家工業互聯網大數據中心建設,強化算力統籌智能調度,建設若干國家樞紐節點和大數據中心集群,建設高性能計算機集群,合理部署超級計算中心。2023年科技部啟動國家超算互聯網部署工作國家超算互聯網將突破現有的單體超算中心運營模式,將全國眾多的超算中心連接起來,構建一體化算力服務平臺。添加標題中國超算算力總和2020年已達566PFlops19資料來源:國際TOP500組織、頭豹、沙利文研究、浙商證券研究所;注:以上算力數據根據國際TOP5
37、00組織全球超級計算機500強榜單統計,2020年起,中國停止向該委員會提交最新超算系統信息1592022062272202282262141881731730%10%20%30%40%50%050100150200250中國制造超級計算機數量(臺,左軸)在全球TOP500占比(右軸)234.7298.9354.5438.2466.9531.8565.6566.6541.3530.1530.20%5%10%15%20%25%30%35%40%0100200300400500600中國超算算力Rmax(PFlops,實測峰值,左軸)占全球TOP500份額(右軸)全球超級計算機500強榜單中中國制
38、造的數量及占比(臺、%)中國超級計算機算力總和及在全球占比(PFlops、%)在全球Top500榜單中,中國供應商制造超級計算機數量連續9次市場份額位居全球第一。2018年底-2020年中,全球Top500榜單中,中國超算上榜數量占比約為45%。2017-2019年,中國供應商制造超級計算機算力總和在全球Top500超算算力總和占比約為三成,低于數量占比。2020年起,中國停止向TOP500組織提交最新超算系統信息,故此后數量和算力占比均有所下滑。預計2025年中國超算市場規模達到466億元20全球來看,據頭豹研究院預計,以供應商HPC市場收入為口徑進行市場規模測算,2017-2021年全球超
39、算市場規模CAGR為12.2%,預計2021-2026年CAGR為6.1%,2026年超算HPC市場規模將達到395.3億美元;中國來看,根據沙利文研究測算,2016-2021年中國超算服務市場規模CAGR為24.7%,預計2021-2025年CAGR為24.1%,2025年中國超算服務市場規模將達到466億元。2016-2025E中國超算服務市場規模(億元、%)16-21年CAGR=24.7%21-25E CAGR=24.1%65.1 82.1 101.2 125.5 157.4 196.6 244.8 303.9 376.6 466.0 0%5%10%15%20%25%30%0501001
40、502002503003504004505002016201720182019202020212022E 2023E 2024E 2025E市場規模(億元,左軸)YOY(右軸)2017-2026E全球超算市場規模(億美元、%)資料來源:頭豹、沙利文研究、浙商證券研究所體系名稱地址運營狀態算力業務主機共建單位應用領域備注中科院體系深圳中心深圳市南山區篤學路9號2009年獲批,2010年9月開始運營理論峰值為3PFlops;二期規劃達到2EFlops曙光6000“星云”中科院計算所、深圳市政府等-架構:X86投資額:12.3億元成都中心四川省成都市天府新區科學城鹿溪智谷核心區2020年9月按照30
41、0P峰值性能進行總體規劃,一期完成建設峰值性能170P曙光7000“硅立方”-航空航天、電子信息、生物醫藥、裝備制造、先進材料、能源化工等架構:X86投資額:約25億元昆山中心江蘇省昆山市玉山鎮研暉路89號2020年12月雙精度峰值300PFlops的通用超算算力曙光6000“星云”-人工智能、生物醫藥、物理化學材料、大氣海洋環境等前沿科學領域架構:X86投資額:20多億元太原先進計算中心-2021年3月29日動工,10月20日通電試運行,2022年3月31日通過科技部驗收,4月18日正式納入國家序列管理300PFlops曙光“太行1號”-信息、海洋、安全、新能源、新材料、生命健康等研制/承建
42、單位:云時代、山西大學西安中心陜西省西安市航天基地航創路與航天東路十字西南角2020年8月批準成立,截至2023年4月底,一期項目已完成,二期項目建設進度86.5%以上峰值算力180PFlops(二期建設計劃2023年12月底前建成投用,算力300P)曙光-先進制造、生物醫藥、新材料、新能源、人工智能等-鄭州中心河南省鄭州市鄭州高新技術產業開發區長椿路與楓楊街交叉口東南角2019年4月獲批,2020年11月通過科技部驗收并納入國家超算序列管理理論峰值算力100PFlops曙光“嵩山”河南省科技廳、鄭州大學數字經濟、社會管理、精準醫學、生物育種、環境治理、高端裝備、人工智能、國土資源管理等-國防
43、科大體系天津中心天津經濟技術開發區第六大街與北海路交口濱海外包產業園5號樓2009年5月批準-天河一號(TH-IA)、天河三號(TH3)原型機國防科大、天津濱海新區政府、天津經濟技術開發區管委會-研制/承建單位:國防科大長沙中心湖南省長沙市岳麓區山南路252號湖南大學南校區2014年11月通用算力200PFlops(FP64)、人工智能算力1000POps(FP16)“天河一號”(TH-1HN)湖南省政府(資金、統籌)、湖南大學(運營管理)、國防科大(技術支撐)-廣州中心廣東省廣州大學城中山大學東校區2014年1月一期峰值100PFlops“天河二號”廣東省人民政府、廣州市人民政府、國防科大、
44、中山大學-江南計算所體系濟南中心山東省濟南市超算科技園創建于2011年,2018年建成E級計算原型機,2019-2022年在建百億億次超算平臺等-神威藍光山東省科學院、山東省計算中心-研制/承建單位:國家并行計算機工程技術研究中心無錫中心江蘇省無錫市蠡園經濟開發區2016年6月峰值運算速度12.54億億次/秒(125.436PFlops)神威 太湖之光清華大學(管理運維)、無錫市-處理器:國家高性能集成電路設計中心自主研制的“申威26010”眾核處理器架構:基于Linux系統優化而成的神威睿思系統投資方:科技部、江蘇省、無錫市研制/承建單位:國家并行計算機工程技術研究中心全國有11家國家級超算
45、中心,中科院體系占比過半21資料來源:各國家超算中心官網,各地政府官方網站,人民網、新浪網等媒體,企查查,浙商證券研究所由于超算與國家前沿基礎科學研究的需求緊密相關,因此我國國家級超算中心基本可分為中科院、國防科大和江南計算所三大體系,從數量上看,中科院體系份額超過50%;超算上云是必經之路,超算云服務市場規模有望達到700億22國家超算互聯網分為基礎算力層、運行管理層、服務運營商三層參與者。由超算中心提供基礎算力,運行管理者負責管理資源并實現接口調用,服務運營商作為超算服務運營主體,未來還可以建設類似應用商店的超算應用軟件平臺,目標是到2025年底,通過超算互聯網建設,打造國家算力底座,促進
46、超算算力的一體化運營;超算服務需要大量同時熟悉超算技術和行業科研思維的復合型人才,互聯有利于資源的有效配置。由于超算涉及領域廣泛且細碎,如海洋氣象、地質勘探、工業仿真、富媒體渲染等超算服務場景對超算服務的要求不盡相同,包括超算資源的調度、軟件系統的搭配等均不一,因而只有服務商對各個典型使用場景有著深刻的理解,才能設計出符合下游用戶使用習慣的產品服務矩陣,各國家級超算中心人才專長領域不同,超算互聯和上云有利于實現人才、資源的合理配置,促進超算行業的商業化發展;中國超算云服務市場規模遠期有望達到700億。根據沙利文,按照實驗室數量*超算云服務滲透率*年消費額的公式測算,預計中國超算云服務市場規模遠
47、期有望達到700億,其中630億為企業主導,未來商用企業市場潛力巨大。國家超算互聯網平臺架構圖中國超算云服務市場規模遠期有望達到700億資料來源:國家超算互聯網官網、沙利文,浙商證券研究所智算:限制加速,國產化時點提前到來04Partone23美國加大AI芯片管制措施,AI算力國產化時點已提前到來24資料來源:金杜律師事務所、美國政府官網、英偉達等、浙商證券研究所拜登政府上臺以來,通過聯盟的方式對華半導體產業形成多邊管制的態勢逐漸明晰,近期出臺了先進計算芯片規則(AC/S IFR)、擴大半導體制造項目出口管制暫行最終規則(SME IFR)以及增加了BIS“實體清單”,以對芯片設計、代工、生產設
48、備、芯片供應、人員等多環節進行限制,我們認為充沛的算力是AI大模型成功實現商業化落地的前提,AI算力的國產化時點已提前到來。設計領域設備領域制造領域原材料領域 2019年5月,美國商務部BIS將華為及其非美國附屬70家公司納入出口管制“實體清單”。隨后,英國芯片設計公司ARM暫停與華為的業務。2019年華為被美國BIS列入實體清單后,美國三大EDA軟件廠商Synopsys、Cadence、Mentor繼按照美國商務部的要求暫停了對華為的授權和更新。2022年8月,美國BIS通過發布臨時規則對用于GAAFET集成電路開發的EDA軟件進行出口管制。2023年10月17日生效的BIS“實體清單”新增
49、壁仞、摩爾線程、光線云、超燃半導體等13家芯片研發實體,代工、用美國技術生產的海外產品等或將受限 2019年5月,美國商務部BIS將華為及其非美國附屬70家公司納入出口管制“實體清單”。隨后,英國芯片設計公司ARM暫停與華為的業務。2019年華為被美國BIS列入實體清單后,美國三大EDA軟件廠商Synopsys、Cadence、Mentor繼按照美國商務部的要求暫停了對華為的授權和更新。2022年8月,美國BIS通過發布臨時規則對用于GAAFET集成電路開發的EDA軟件進行出口管制。2022年7月,美國游說荷蘭停止向中國出口ASML公司的先進產品。2022年7月,美國兩家芯片設備公司LamRe
50、search和KLA收到美國商務部的通知,禁止出口14納米以下制程制造設備到中國大陸。2023年10月,擴大半導體制造項目出口管制暫行最終規則(SME IFR)增加了對其他類型的半導體制造設備的限制。2020年5月,美國BIS宣布限制華為使用美國特定技術和軟件在國外設計和制造半導體的能力。2021年11月,英特爾中國工廠擴產計劃被拜登政府以危及“國家安全”的理由拒絕。2022年8月美國總統拜登簽署芯片法案,禁止受益企業自接受資助之日起10年內在中國增產先進制程半導體。2023年10月,擴大半導體制造項目出口管制暫行最終規則(SME IFR)要求晶圓廠為最終實體為中國內地或者中國澳門在內的客戶生
51、產晶體管數量超過50 billion或采用HBM的芯片時需要經過美國EAR認可。美國限制向中國出口芯片制造原材料主要包括:復合半導體晶圓、極紫外掩膜、光刻膠、半導體金剛石材料、刻蝕氣體和摻雜物。銷售和出口 2022年8月,美國政府禁止AMD和NVIDIA向中國出口高端GPU芯片。將于2023年11月16日生效的先進計算芯片規則(AC/S IFR)新增了總處理性能TPP和性能密度PD限制,英偉達表示A800、H800、L40s、L40、RTX 4090可能會受到影響;智算算力新基建頂層規劃已出,各地政策有望逐步跟進25資料來源:工信微報、各地政府官網、IDC圈等、浙商證券研究所算力基礎設施高質量
52、發展行動計劃從全局對全國智算算力進行了頂層規劃,并強調網絡聯通,以往各自為政的局面有望得到統一,使用國產芯片建設的智算中心上架率有望提升。10月9日,工信部等六部門聯合印發算力基礎設施高質量發展行動計劃(以下簡稱“行動計劃”),明確提出了到2025年全國算力目標規模超過300EFlops,智能算力占比達到35%,重點應用場所光傳送網(OTN)覆蓋率達到80%,工業、金融等領域算力滲透率顯著提升,醫療、交通等領域應用實現規?;瘡椭仆茝V,能源、教育等領域應用范圍進一步擴大;“行動計劃”從頂層明確了未來三年全國智算算力的建設目標及節奏,解決了各地智算中心建設節奏、標準不統一、各自為政的情況,可以從全
53、國層面實現智算算力的混合調用,也將有利于提升國產智算算力上架率。算力基礎設施高質量發展行動計劃主要內容今年各地智算算力相關政策文件省市時間政策名稱北京5月25日關于征集2023年度“中央引導地方”專項人工智能領域儲備課題的通知5月30日北京市加快建設具有全球影響力的人工智能創新策源地實施方案(2023-2025年)、北京市促進通用人工智能創新發展的若干措施6月13日用人工智能創新發展的若干措施北京市機器人產業創新發展行動方案(2023-2025年)10月11日人工智能算力券實施方案(20232025年)成都6月5日成都市關于進一步促進人工智能產業高質量發展的若千政策措施(征求意見稿)福建7月1
54、2日福建省新型基礎設施建設三年行動計劃(2023-2025年)杭州7月27日杭州市人民政府辦公廳關于加快推進人工智能產業創新發展的實施意見8月16日關于高標準建設“中國視谷”高質量發展視覺智能產業的實施意見江蘇1月19日關于進一步促進集成電路產業高質量發展若干政策的通知南京2月23日南京市加快發展新一代人工智能產業行動計劃(2023-2025)寧夏8月13日促進人工智能創新發展政策措施上海7月8日上海市推動人工智能大模型創新發展的若干措施10月19日上海市進一步推進新型基礎設施建設行動方案(2023-2026年)深圳5月31日深圳市加快推動人工智能高質量發展高水平應用行動方案(2023-202
55、4年)四川7月3日關于深入推進新型工業化加快建設現代化產業體系的決定8月21日四川省元宇宙產業發展行動計劃(2023-2025年)(征求意見稿)無錫6月14日無錫市人工智能產業創新發展三年行動計劃(2023-2025)重慶7月24日重慶市以場景驅動人工智能產業高質量發展行動計劃(2023-2025年)2024年國產AI算力需求有望接近100EFlops26考慮到我國國產AI芯片供應商的產能供應、生態適配、綜合性價比等情況,國內AI芯片與英偉達H100芯片相比仍有一定差距,因此我們認為政策性客戶有望逐步全面轉向國產AI芯片,商用客戶如互聯網有望將百億參數模型的部分訓練和推理需求轉向國產AI芯片,
56、2024年我國國產芯片主要需求將包括:政府智算中心、運營商、金融、第三方大模型廠商、互聯網廠商,根據我們的測算,按8卡昇騰910 AI服務器計算,2024年預計昇騰910出貨量為30.7萬張,對應3.84萬臺AI服務器。資料來源:根據公開資料整理測算,存在四舍五入情況,計算過程請見后幾頁,浙商證券研究所;注:根據華為認證公眾號,昇騰910在FP16下算力為320T、INT8下算力為640T2024年新增總算力需求(EFlops)國產化比例(%)國產算力需求(EFlops)單卡算力(Tflops)卡數(萬)假設單臺AI服務器卡數(張)AI服務器臺數(萬)政府智算中心(FP16)23.00 100
57、%23.00 3207.19 80.90 運營商(FP16)43.63 80%34.90 32010.91 81.36 金融(FP16)10.69 60%6.41 3202.00 80.25 第三方大模型廠商-訓練(FP16)79.37 25%19.84 3206.20 80.78 互聯網廠商-百億訓練(FP16)49.60 20%9.92 3203.10 80.39 互聯網廠商-百億推理(INT8)10.42 80%8.33 640 1.30 80.16 合計211.5098.2430.70 3.84 2024年國產AI算力需求有望接近100EFlops271、2024年政府智算中心國產AI
58、算力增量需求為23EP,需要7.19萬張昇騰910卡,0.90萬臺AI訓練服務器根據信通院發布的2023智能算力發展白皮書,2022年中國算力總規模已經高達180 EFlops,其中智能算力規模達到了41EFlops;工信部發布的算力基礎設施高質量發展行動計劃設定到2025年全國算力目標規模超過300EFlops,智能算力占比達到35%,由此我們可得到2024年智算算力缺口為260*30%-220*25%=23EFlops,考慮到智算中心建設為政府行為,因此我們認為國產芯片供應占比將達到100%,即2024年政府智算中心國產AI算力需求為23EFlops,對應需要昇騰910卡7.19萬張,AI
59、訓練服務器0.90萬臺。資料來源:信通院、工信微報、華為、浙商證券研究所指標20222023E2024E2025E目標算力規模(EFlops)180 220 260 300 目標智算算力占比23%25%30%35%目標智算算力規模(EFlops)41 55 78 105 智算算力缺口(EFlops)14 23 27 國產化比例100%100%100%國產智算算力規模(EFlops)14 23 27 yoy65%17%單卡算力(Tflops)320320320卡數(萬)4.36 7.19 8.44 假設單臺AI訓練服務器卡數(張)888臺數(萬)0.55 0.90 1.05 2024年國產AI算
60、力需求有望接近100EFlops282、2024年運營商國產AI算力增量需求為34.90EFlops,需要10.91萬張昇騰910卡,1.36萬臺AI訓練服務器據C114通信網,中國電信AI算力服務器(2023-2024年)集中采購項目共分為4個標包,總金額為84.62億,總采購規模為4175臺訓練型服務器(根據芯智訊,使用國產鯤鵬芯片的AI服務器1977臺,占整體采購數量的47.35%,總金額28億)及1182臺IB交換機,在當前背景下,我們認為:1)運營商將與云計算時代類似,部分承擔地方算力基建任務,并提供智算算網服務;2)移動、聯通、電信三大運營商招采節奏相近,算力服務器采購數量與202
61、3年各家算力網絡Capex比例一致;3)運營商將作為信創排頭兵承擔AI算力信創任務,國產化率有望達到80%;由此可得到2024年運營商增量國產AI算力需求為34.90EFlops,需要10.91萬張昇騰910卡,1.36萬臺AI訓練服務器。資料來源:中國電信、芯智訊、C114通信網、華為、浙商證券研究所科目數據來源&測算過程電信集采AI訓練服務器臺數(臺)4175中國電信AI算力服務器(2023-2024年)集中采購項目其中國產服務器臺數(臺)1977預計2024年運營商集采AI訓練服務器總臺數(臺)17,042.56 根據114通信網,2023年,中國電信算力(云資源)將投資195億元,中國
62、移動計劃算力投資452億元,中國聯通算力網絡資本開支將達到149億元,我們假設三大運營商在AI算力上的投資比例與算力整體Capex一致,則合計AI訓練服務器集采數量為4175/195*(195+452+149)=17042.56昇騰910單卡算力(TFLOPS)320昇騰910基于自研華為達芬奇架構3D Cube技術,半精度(FP16)算力達到320TFLOPS假設單臺AI服務器卡數(張)8單臺AI服務器算力(PFLOPS)2.56320*8/1002024年新增總算力需求(EFlops)43.63 17042.56*2.56預計國產化率80%2024年國產算力增量(EFlops)34.90
63、43.63*80%所需卡數(萬)10.91 34.90*106/104預計國產AI訓練服務器臺數(臺)1.36 10.91/82024年國產AI算力需求有望接近100EFlops293、2024年金融等行業客戶國產AI算力增量需求為6.41EFlops,需要2萬張昇騰910卡,0.25萬臺AI訓練服務器我們認為運營商客戶需要部分額外負擔地方智算中心的基建職責,金融客戶智算中心則主要為自身業務使用,因而預計金融客戶服務器需求小于運營商客戶,即6家國有銀行及12家股份制銀行等行業客戶的AI服務器采購規模為4175臺,假設國產化率60%,則可得到國產AI服務器需求為1670臺,對應算力規模為6.41
64、EFlops,需要2萬張昇騰910卡,0.25萬臺AI訓練服務器。資料來源:中國電信、芯智訊、114通信網、華為、浙商證券研究所科目數據來源&測算過程電信集采AI訓練服務器臺數(臺)4175中國電信AI算力服務器(2023-2024年)集中采購項目其中國產服務器臺數(臺)1977預計2024年銀行等行業客戶集采AI訓練服務器總臺數(臺)4175金融客戶智算中心則主要為自身業務使用,因而預計金融客戶服務器需求小于運營商客戶昇騰910單卡算力(TFLOPS)320昇騰910基于自研華為達芬奇架構3D Cube技術,半精度(FP16)算力達到320TFLOPS假設單臺AI服務器卡數(張)8單臺AI服
65、務器算力(PFLOPS)2.56320*8/1002024年新增總算力需求(EFlops)10.694175*2.56/1000預計國產化率60%2024年國產算力增量(EFlops)6.4110.69*60%所需卡數(萬)2.006.41*106/104預計國產AI訓練服務器臺數(臺)0.252.00/82024年國產AI算力需求有望接近100EFlops304、2024年第三方大模型廠商的國產AI算力增量需求為19.84EFlops,需要6.20萬張昇騰910卡,0.78萬臺AI訓練服務器2023-2024年中國人工智能計算力發展評估報告顯示,截至2023年10月中國累計發布兩百余個大模型
66、,其中以科研院所和互聯網企業為開發主力軍,我們認為院所以及訊飛、智譜、智源等第三方大模型廠商或由于算力供應受限,可能會由國內芯片解決部分算力需求,假設2024年新增大模型總數為50個,平均模型參數量為200億,算力國產化率為25%,則可得到2024年第三方大模型廠商的國產AI算力增量需求為19.84EFlops,需要6.20萬張昇騰910卡,0.78萬臺AI訓練服務器.資料來源:2023-2024年中國人工智能計算力發展評估報告、華為、The Economics of Large Language Models、浙商證券研究所參數數據處理過程假設新增大模型數量502023-2024年中國人工智
67、能計算力發展評估報告顯示,截至2023年10月中國累計發布兩百余個大模型假設新增大模型的平均參數數量(億個,N)200訓練Tokens數量(億個)342.86 Language Models are Few-Shot Learners論文顯示,GPT-3參數為175B,訓練使用300B tokens,因此假設參數量與tokens比例固定單個模型單Token訓練所需運算次數(TFLOPS,6N)0.12(每個token在模型正向傳播和反向傳播的時候所需的乘法、加法計算次數)*(平均參數數量)單模型所需算力(PFLOPS)4,114,285.71 342.86*0.12108/1000假設單次訓練
68、所需時間(天)30假設30天完成訓練訓練算力需求(EFlops)79.3750*4,114,285.71/30/24/3600假設國產算力占比25%國產算力需求(EFlops)19.84 79.37*25%所需卡數(萬)6.20 19.84*1000/0.32/1000預計國產AI訓練服務器臺數(臺)0.78 6.20/82024年國產AI算力需求有望接近100EFlops315、互聯網廠商需要國產算力分別為9.92EFlops(FP16)、8.33EFlops(INT8),合計需要4.4萬張昇騰910卡,0.55萬臺AI服務器美國芯片禁令限制了國內通過官方渠道獲取A800、H800等主流GP
69、U的方式,目前阿里云官網已下架英偉達A系列服務器云計算產品、百度為200臺服務器訂購了1600片昇騰910BAI芯片,因而我們預計互聯網廠商在算力選擇上將呈現如下情況:1)百億模型推理率先實現國產替代,通過工程師團隊持續調優來實現學習和提升遷移能力以及運算性能,最終等效于A800;2)百億模型訓練在2024年逐步實現國產替代;3)千億模型推理、訓練仍以英偉達芯片為主,后續預算根據各個芯片的實際性價比進行考慮,關鍵因素包括硬件成本+人員成本+實際性能;我們假設2024年在百億參數模型上將實現20%的訓練需求國產化以及80%的推理需求國產化,則可算得需要國產算力分別為9.92EFlops、8.33
70、EFlops,合計需要4.4萬張昇騰910卡,0.55萬臺AI服務器。資料來源:華為、The Economics of Large Language Models、浙商證券研究所參數數據處理過程訓練需求假設大模型數量52023-2024年中國人工智能計算力發展評估報告顯示,截至2023年10月中國累計發布兩百余個大模型平均參數數量(億個,N)500假設參數量100億訓練Tokens數量(億個)857.14 Language Models are Few-Shot Learners論文顯示,GPT-3參數為175B,訓練使用300B tokens,因此假設參數量與tokens比例固定單個模型單T
71、oken訓練所需運算次數(TFLOPS,6N)0.3(每個token在模型正向傳播和反向傳播的時候所需的乘法、加法計算次數)*(平均參數數量)單模型所需算力(PFLOPS)25,714,285.71 1028580假設單次訓練所需時間(天)30假設30天完成訓練訓練算力需求(EFlops)49.60200*1028571.43/30/24/3600 國產算力占比20%假設國產算力占比20%國產算力需求(EFlops)9.9279.37*20%所需卡數(萬)3.10 9.92*1000/0.32/10000預計國產AI服務器臺數(臺)0.39 3.10/8推理需求假設大模型數量5選取前5家互聯網
72、廠商的推理需求進行計算平均參數數量(億個,N)500假設平均每家大模型參數量1.5萬億每天訪問次數(億次)0.02根據similarweb,Chatgpt每周全球最大訪問量接近5000萬,平均每天714萬,考慮到我國大模型主要針對國內客戶群體,因此假設平均國內大模型應用每天訪問量為200萬每次訪問查詢次數(次)15大模型應用一般具備多輪查詢能力,假設平均每次訪問互動15次每次查詢Tokens數量(個)1,000假設每次互動Tokens數量為1000單Tokens所需計算次數(TFlops-s,2N)3推理所需計算成本比訓練低,大約為2N每次訪問每次查詢所需計算次數(TFlops-s)3,000
73、3*1000每天累計計算次數(EFlops-s)90,0000.02*108*15*3000/1000/1000平均每秒所需算力(EFlops)1.0490000/24/3600 算力冗余倍數2推理算力需要具備一定的冗余來應對算力響應波峰,因此假設算力儲備為算力需求的2倍所需推理算力(EFlops)10.421.04*2*5國產算力占比80%假設國產算力占比20%國產算力需求(EFlops)8.3379.37*20%所需卡數(萬)1.30 8.33*1000/0.64/10000預計國產AI服務器臺數(臺)0.16 1.30/82024年國產AI服務器市場規模有望達到409億32綜上,我們預計
74、2024年國內新增AI總算力需求為211.5EFlops(FP16),其中國產算力需求為98.24EFlops(FP16),國產化比例為46.45%,按單張昇騰910算力320TFLOPS計算,對應需要昇騰910為30.70萬張,按單臺服務器8張昇騰910計算對應3.84萬臺AI服務器;根據京東,昇騰Atlas 300T A2訓練卡均價在10萬以上,因此可得2024年昇騰芯片潛在市場規模約為=30.7*10=307億;根據IDC,訓練型服務器的GPU成本占比約為72.8%,我們假設8張昇騰Atlas 300T A2的訓練服務器中GPU占比75%,由此可得2024年華為昇騰服務器潛在市場規模為4
75、09.33億。資料來源:京東、IDC、智研咨詢、浙商證券研究所國產AI芯片單卡部分指標接近英偉達,華為、海光具備競爭力資料來源:各公司官網、算力智庫、海光信息招股書、浙商證券研究所33運算協處理器基于不同的設計思想存在多條技術路線,包括 GPGPU、ASIC、FPGA等。其中 GPGPU 的代表企業包括 NVIDIA 和 AMD;利用 ASIC 技術,許多大公司都研發了協處理器產品,包括 Intel 的 Phi 和 NNP、Google 的 TPU、華為昇騰、寒武紀思元等;基于 Intel、Xilinx 的 FPGA,出現過很多專用協處理器產品。綜合考慮性能、能效比和編程靈活性等方面的因素,G
76、PGPU 在協處理器應用領域具有非常明顯的優勢,目前廣泛應用于商業計算、人工智能和泛人工智能等領域。國產AI芯片供應商基本可分為體系化廠商(華為、海光、寒武紀等)、互聯網自研(平頭哥等)、初創廠商(壁仞、沐曦、燧源、摩爾線程)三類,體系化廠商具備相對完善的生態、豐富的行業應用經驗、大量的客戶積累以及相對穩定的供應體系,因為AI算力的底層硬件需求相對比較統一和標準化,所以我們認為未來AI芯片有望類似CPU芯片,呈現集中度提升的趨勢,最終形成寡頭競爭的格局。0%20%40%60%80%100%120%2008Q12008Q22008Q32008Q42009Q12009Q22009Q32009Q42
77、010Q12010Q22010Q32010Q42011Q12011Q22011Q32011Q42012Q12012Q22012Q32012Q42013Q12013Q22013Q32013Q42014Q12014Q22014Q32014Q42015Q12015Q22015Q32015Q42016Q12016Q22016Q32016Q42017Q12017Q22017Q32017Q42018Q12018Q22018Q32018Q42019Q12019Q22019Q32019Q42020Q12020Q22020Q32020Q42021Q12021Q22021Q32021Q42022Q12022Q22
78、022Q32022Q42023Q12023Q22023Q32023Q4IntelAMD服務器領域Intel和AMD市場份額華為昇騰已形成完善的多層產業生態34資料來源:昇騰社區、浙商證券研究所華為昇騰AI產業生態昇騰計算產業:基于昇騰系列(HUAWEI Ascend)處理器和基礎軟件構建的全棧AI計算基礎設施、行業應用及服務,包括昇騰系列處理器、系列硬件、CANN(Compute Architecture for Neural Networks,異構計算架構)、AI計算框架、應用使能、開發工具鏈、管理運維工具、行業應用及服務等全產業鏈。華為昇騰AI產業生態包括昇騰AI基礎軟硬件平臺,即Atla
79、s系列硬件、異構計算架構CANN、全場景AI框架昇思MindSpore、昇騰應用使能MindX以及一站式開發平臺ModelArts等?;跁N騰910系列板卡,華為推出了AI訓練集群Atlas900、AI訓練服務器Atlas800、智能小站Atlas500、AI推理與訓練卡Atlas300和AI加速模塊Atlas200,完成了Atlas全系列產品布局,支持萬億參數大模型訓練,同時覆蓋云、邊、端全場景。華為提出了具備分層開放、體系協同、敏捷高效、安全可信等特征的,全行業通用的行業智能化參考架構。其中智能底座提供大規模AI算力、海量存儲及并行計算框架,支撐大模型訓練,提升訓練效率,提供高性能的存算網
80、協同。根據場景需求不同,提供系列化的算力能力。適應不同場景,提供系列化、分層、友好的開放能力。另外,智能底座層還包含品類多樣的邊緣計算設備,支撐邊緣推理和數據分析等業務場景。華為行業智能化參考架構華為昇騰從推理卡到算力集群的多層AI算力硬件體系35Atlas 900 AI集群Atlas 900 PoDAtlas 800 訓練服務器Atlas 800 訓練服務器Atlas 800 推理服務器Atlas 800 推理服務器Atlas 300T 訓練卡Atlas 300I 推理卡型號90009000900090103000301090003000/3010圖示形態-47U機柜4U服務器4U服務器2U
81、服務器2U服務器全高,3/4長,雙槽位半高半長PCIe卡CPU-32*鯤鵬9204*鯤鵬9202*Intel V5 Cascaded Lake處理器2*鯤鵬9201/2個Intel Xeon SP Skylake 或 Cascade Lake處理器,最高205W-AI處理器數千顆昇騰910 AI處理器互聯64*昇騰9108*昇騰9108*昇騰910最大支持8個Atlas 300I 推理卡最大支持7個Atlas 300I 推理卡昇騰 910昇騰310HBM-2048 GB32 GB,1228GB/s 32GB,1228GB/s-AI算力256 1024 PFlopsFP1614.08 20.48
82、 PFlops FP16,最大可擴展至1 EFlops FP162.24 PFlops FP161.76 PFlops FP162.24 PFlops FP161.76 PFlops FP16最大704 TOPS INT8最大616 TOPS INT8內置30個達芬奇AI Core280 TFlops FP16(Pro)220 TFlops FP1688 TOPS INT8網絡及接口集成HCCS、PCIe 和100G RoCE三種高速接口-8*100GE+4*25GE/2*100GE8*100GE1*OCP NIC 3.0標卡,支持2*25GE最多支持9個PCIe4.0 PCIe接口10個PC
83、Ie Gen3.0接口1*100GE QSFP-DD接口,出口總帶寬56.5 Gb/sPCIe x16 Gen3.0功耗單柜50KW單柜46 kW,根據采購的設備配置不同,功耗會有所差異最大功耗5.6 kW最大功耗5.6 kW-最大300W最大67W散熱方式混合液冷液冷風冷/液冷風冷風冷風冷被動風冷-資料來源:華為官網、浙商證券研究所昇騰加入PyTorch社區共建,有望為世界提供第二AI算力選擇36資料來源:華為、科大訊飛、中國電信、云頭條、PyTorch、自主可控新鮮事等、浙商證券研究所性能上,昇騰910b正逐步接近A100。昇騰910基于自研華為達芬奇架構3D Cube技術,半精度(FP1
84、6)算力達到320TFlops,科大訊飛創始人、董事長劉慶峰表示華為的 GPU 能力可以對標英偉達A100;應用上,昇騰服務器已在政府智算中心、運營商、銀行、央國企、互聯網等AI算力領域全面規?;涞?。智算中心方面,昇騰算力集群已在華為云、東數西算的樞紐節點貴州和內蒙、中國28個城市的AI智算中心大規模商用部署,神州數碼已與恒為科技簽訂4億昇騰服務器訂單合同;運營商方面,10月,中國電信公布了AI算力服務器集采中標公告,G系列訓練服務器總金額28億,占整體訂單金額的1/3;互聯網方面,百度為200臺服務器訂購了1600片昇騰910B AI芯片,我們預計未來以政府智算中心、運營商、金融以及IT企
85、業、互聯網等客戶有望為昇騰服務器的增長提供強勁動力。未來,昇騰有望構建世界第二“CUDA”生態。目前昇騰迭代的瓶頸在于生態,以英偉達CUDA為核心的AI算力生態是當今世界大模型的主流,10月18日華為作為Premier最高級別會員正式加入全球AI開源框架PyTorch社區,PyTorch 2.1版本已同步支持昇騰NPU,開發者可直接在PyTorch 2.1上基于昇騰進行模型開發,基于PyTorch,昇騰已經適配了BLOOM、GPT-3、LLaMA等業界主流大模型,深度優化后性能可持平業界,我們預計未來昇騰迭代速度有望加快,并復刻鯤鵬計算生態發展歷程,在各行業遍地開花。昇騰加入PyTorch社區
86、共建中國電信AI服務器中標候選人公告海光DCU產品具備完善的軟件棧支持37海光DCU屬于GPGPU的一種。CUDA是一種由NVIDIA推出的通用并行計算架構,包含了應用于NVIDIA GPU的指令集(ISA)以及GPU內部并行計算引擎。海光DCU協處理器全面兼容ROCm GPU計算生態,由于ROCm和CUDA在生態、編程環境等方面具有高度的相似性,CUDA用戶可以以較低代價快速遷移至ROCm平臺,因此ROCm也被稱為“類CUDA”。因此,海光DCU協處理器能夠較好地適配、適應國際主流商業計算軟件和人工智能軟件,軟硬件生態豐富,可廣泛應用于大數據處理、人工智能、商業計算等計算密集類應用領域,主要
87、部署在服務器集群或數據中心,為應用程序提供高性能、高能效比的算力,支撐高復雜度和高吞吐量的數據處理任務。海光DCU具備開放式生態和統一底層硬件驅動平臺,支持常見計算框架、庫和編程模型層次化軟件棧,適配不同API接口和編譯器可最大限度利用已有的成熟AI算法和框架。海光DCU基本組成架構海光軟件棧體系資料來源:海光招股書、海光官網、浙商證券研究所項目海光NVIDIAAMD品牌深算一號Ampere 100MI100生產工藝7nm FinFET7nm FinFET7nm FinFET核心數量4096(64 CUs)2560 CUDA processors 640 Tensor processors12
88、0 Cus內核頻率Up to 1.5GHz(FP64)Up to 1.7GHz(FP32)Up to 1.53GHzUp to 1.5GHz(FP64)Up to 1.7GHz(FP32)顯存容量32GB HBM280GB HBM2e32GB HBM2顯存位寬4096bit5120bit4096bit顯存頻率2.0 GHz3.2 GHz2.4 GHz顯存帶寬1024 GB/s2039 GB/s1228 GB/sTDP350W400W300WCPU to GPU 互聯PCIe Gen4 16PCIe Gen4 16PCIe Gen4 16GPU to GPU 互聯xGMI 2,up to 184
89、GB/sNVLink,up to 600GB/sInfinity Fabric 3,up to 276 GB/s海光8100產品圖片典型功耗260-350W典型運算類型雙精度、單精度、半精度浮點數據和各種常見整型數據計算 60-64個計算單元(最多4096個計算核心)支持FP64、FP32、FP16、INT8、INT4內存 4個HBM2內存通道 最高內存帶寬為1TB/s 最大內存容量為32GBI/O 16 Lane PCIe Gen4 DCU芯片之間高速互連海光DCU性能逐步接近英偉達A100,能夠完整支持大模型訓練38公司新產品加速迭代,性能持續提升,研發團隊在高端處理器設計、SoC架構設計
90、、處理器安全、處理器驗證、高主頻與低功耗處理器實現、高端芯片IP設計、工藝物理設計、先進封裝設計、基礎軟件等關鍵技術上不斷實現突破。性能上,海光深算一號DCU內核頻率、顯存位寬已逐步接近英偉達A100,在顯存容量、帶寬、算力、互聯性能上仍有一定的進步空間;深算二號已于2023年Q3發布,實現了在大數據處理、人工智能、商業計算等領域的商業化應用,具有全精度浮點數據和各種常見整型數據計算能力,性能相對于深算一號實現了翻倍的增長;深算三號研發進展順利。在AIGC持續快速發展的時代背景下,海光DCU能夠完整支持大模型訓練,實現LLaMa、GPT、Bloom、ChatGLM、悟道、紫東太初等為代表的大模
91、型的全面應用,與國內包括文心一言等大模型全面適配,達到國內領先水平。海光 DCU 的產品形態海光深算一號與國際主流芯片性能對比資料來源:海光招股書、海光官網、浙商證券研究所風險提示05Partone39風險提示401、國際形勢變化:受限美國“實體清單”,行業內企業采購服務器及芯片等有關國外先進部件可能受一定影響;2、供應鏈安全風險:芯片銷售受上游供應制約較為嚴重,直接影響后續芯片迭代速度;3、芯片設計迭代風險:不同芯片的技術路徑、設計思路略有不同,存在技術風險;4、競爭加劇風險:芯片及整機存在競爭加劇的風險;5、下游客戶總體需求或節奏不及預期風險:下游客戶需求總量或節奏存在不急市場預期可能,因
92、而可能會呈現一定的周期性;6、政策風險:信創、超算、AI算力的發展均受相關政策節奏影響;點擊此處添加標題添加標題點擊此處添加標題點擊此處添加標題點擊此處添加標題點擊此處添加標題點擊此處添加標題添加標題點擊此處添加標題點擊此處添加標題添加標題點擊此處添加標題添加標題95%行業評級與免責聲明行業的投資評級以報告日后的6個月內,行業指數相對于滬深300指數的漲跌幅為標準,定義如下:1、看好:行業指數相對于滬深300指數表現10%以上;2、中性:行業指數相對于滬深300指數表現10%10%以上;3、看淡:行業指數相對于滬深300指數表現10%以下。我們在此提醒您,不同證券研究機構采用不同的評級術語及評級標準。我們采用的是相對評級體系,表示投資的相對比重。建議:投資者買入或者賣出證券的決定取決于個人的實際情況,比如當前的持倉結構以及其他需要考慮的因素。投資者不應僅僅依靠投資評級來推斷結論 41聯系方式42浙商證券研究所 上??偛康刂罚簵罡吣下?29號陸家嘴世紀金融廣場1號樓25層北京地址:北京市東城區朝陽門北大街8號富華大廈E座4層深圳地址:廣東省深圳市福田區廣電金融中心33層郵政編碼:200127 電話:(8621)80108518 傳真:(8621)80106010